Рецензия: Udacity Data Analyst Nanodegree Program

Програмата за анализ на данни на Udacity Nanodegree беше една от първите онлайн програми за наука за данни в революцията за онлайн образование. Целта му е „да гарантирате, че овладявате точните умения, необходими за изграждане на кариера в науката за данни“. Постига ли целта си? Това ли е най-добрият вариант?

Завърших програмата през есента 2016. Използвайки вдъхновение от шаблона за отзиви с отворен код на Class Central, ето моят отзив за програмата на Udacity Data Analyst Nanodegree.

АКТУАЛИЗАЦИЯ: Програмата Data Analyst Nanodegree беше обновена с ново съдържание и студентски услуги през септември 2017 г. Подробности тук. Бях докаран и на борда, за да помогна за пресъздаването на част от това ново съдържание. По-голямата част от този преглед е непроменена. Фактическите актуализации са обозначени с курсив.

Обща информация

Какво ме накара да реша да взема тази програма?

В началото на 2016 г. започнах да създавам собствена магистърска програма по наука за данни, използвайки онлайн ресурси. (Можете да прочетете за това тук.) Записах се в програмата Data Analyst Nanodegree по няколко причини:

  • Исках ръководство за моето въведение в науката за данните.
  • Исках сплотена програма вместо индивидуални курсове от различни доставчици.
  • Получи звездни отзиви.
  • Имах няколко курса по Udacity и бях фен на техния стил на преподаване.

Какви бяха моите цели?

Въпреки че програмата може да действа като мост към работа (повече за това по-късно), исках да използвам програмата като въведение към по-напреднали материали. Този „по-усъвършенстван материал“ се отнася както за предмети, които са обхванати в програмата, така и за предмети, които не са.

Какво представлява програма Udacity Nanodegree?

Udacity е един от водещите доставчици на онлайн образование. Себастиан Трън, бивш професор в Станфорд и основател на Google X, основава компанията и се фокусира върху иновациите в Udacity като президент и председател. Виш Макхиани е главен изпълнителен директор.

Наноградусните програми са онлайн идентификационни данни, предоставени от Udacity. Те представляват компилация от курсове по Udacity (някои от тях се предлагат безплатно, други не), които имат приложени към тях проекти, които се преглеждат от рецензенти на платени проекти на Udacity. Те идват и с куп студентски услуги.

Slack се използва като инструмент на общността, където учениците от Udacity могат да взаимодействат с други студенти, както и с инструкторите на тяхната програма и други служители на Udacity. В повечето програми учениците са назначили ментори и общуват с тях чрез частен канал за чат, който винаги е достъпен в класната стая на Udacity.

Програмата Data Analyst Nanodegree първоначално беше пусната през 2014 г. Това беше втората програма Nanodegree на Udacity. Въпреки че е претърпял някои промени през годините, ядрото на програмата е непокътнато.

Кои са инструкторите и какъв е техният произход?

Тъй като програмата Data Analyst Nanodegree представлява компилация от курсове по Udacity (отново някои безплатни, други не), има няколко инструктори. Техните автобиографии често включват престижни роли в големи технологични компании и степени от топ американски училища.

Те сами по себе си не са „инструктори“, но рецензенти на проекти, ментори и екип от студентски опит (които следят Slack заедно с инструктори) са сред хората, с които общувате най-много. Те са толкова, толкова полезни. Повече за това по-късно.

Разходи

Програмата е разделена на два термина. Първият срок струва $ 499 USD. Вторият срок струва $ 699 USD. Ако имате силна представа за уменията, преподавани през първия срок, можете да го пропуснете, да завършите само втория срок и пак да получите удостоверението.

Препоръчителни предпоставки

За термин 1 Udacity препоръчва студентите да са запознати с описателната статистика и да имат известен опит в работата с данни в електронни таблици или SQL.

За Урок 2 учениците трябва да имат опит в анализирането на данни с помощта на Python, както и солидно разбиране за извеждащата статистика и нейните приложения.

Моят опит / умения за влизане в програмата

Стартирах програмата през май 2016 г., когато имах няколко месеца опит в програмирането, най-вече в C и Python. По-голямата част от този опит е от модула за свързване на моята магистърска програма по наука за данни, където взех CS50 на Харвард: Въведение в компютърните науки и Въведение в програмата Udacity за програмиране на Nanodegree.

Бях завършил и бакалавърската си програма по химическо инженерство и имах 24 месеца опит, свързан с количеството. Това означаваше, че бях на няколко курса по статистика и се чувствах добре с данните.

Програмата

Структура

Програмата Data Analyst Nanodegree е разделена на два термина. Всеки термин има три курса и четири проекта (допълнителният проект е въвеждащ проект, който ви помага да свикнете с учебната среда Udacity). Мат Леонард, ръководителят на учебната програма на програмата по време на опресняването, присъства в цялата програма, докато представя всеки курс, неговата цел в програмата и неговите инструктори.

Съдържанието на курса се състои от комбинация от видеоклипове, текст и тестове. Видеоклиповете обикновено варират от 30 секунди до пет минути, според стила на Udacity. Автоматично оценяваните тестове често следват тези кратки видеоклипове. Тези тестове обикновено са задачи с многократен избор, попълване на празно или малки програмиращи задачи. След придобиването на CloudLabs, тези задачи по програмиране вече се изпълняват в Jupyter Notebook и SQL кодиращи среди в класната стая на Udacity.

Отново, всеки раздел има степенуван проект. Тези проекти и обратната връзка от рецензенти на платени проекти на Udacity са мястото, където голяма част от ценността е за студентите.

Учебна програма

Моето издание на програмата имаше седем части:

  • P1: Описателна и референтна статистика
  • P2: Въведение в анализа на данни (с NumPy и панди)
  • P3: Разбъркване на данни с MongoDB (или SQL)
  • P4: Анализ на изследователски данни (с R)
  • P5: Въведение в машинното обучение
  • P6: Визуализация на данни с D3.js
  • P7: Проектиране на A / B тест

Първият термин на новата програма се нарича Анализ на данни с Python и SQL . Курсовете и проектите включват:

  • Интро проект: Изследвайте тенденциите във времето. SQL и електронни таблици (или Python / R, ако вече сте запознати) се използват за анализ и визуализиране на данните за температурата.
  • Курс: Въведение в Python. Проект: Изследвайте американските данни за Bikeshare.
  • Курс: Въведение в анализа на данни, който включва процеса на анализ на данни и SQL за анализ на данни. Проект: Проучване на набор от данни.
  • Курс: Практическа статистика. Проект: Анализирайте резултатите от A / B теста.

Вторият термин се нарича Разширен анализ на данни . Курсовете и проектите включват:

  • Интро проект: Тестване на перцептивен феномен. Изчислете описателна статистика и извършете статистически тест на набор от данни, базиран на психологически феномен, наречен Stroop Effect.
  • Курс: Разбъркване на данни (с Python). Проект: Разбъркване и анализ на данни. Това е курсът и проектът, който създадох. ?
  • Курс: Анализ на изследователски данни (с R). Проект: Изследване и обобщаване на данни.
  • Курс: Разказване на данни (с Таблица). Проект: Създаване на история от таблицата.

Големите промени, с пълни подробности, описани в тази публикация в блога:

  • Python вече се преподава в програмата.
  • Машинното обучение и A / B тестването вече са включени като незадължителен материал и вече не са изисквания за завършване на програмата. Разум: „Фокусът на тази програма е да ви подготви за работата на анализатор на данни. Нашите изследвания показват, че машинното обучение не е изискване за по-голямата част от позициите на анализатори на данни. " Основите на A / B тестването вече са разгледани в новия курс за практическа статистика, който дава на студентите експозицията, която ще им е необходима в работата.
  • Нови курсове и проекти. По-конкретно, Въведение в анализа на данните (което включва Python за анализ на данни и SQL за анализ на данни), Практическа статистика (преподава се от Себастиан Трън) и Разбъркване на данни.

Класиране

Проектите се оценяват на пропуск / неуспех (официално, „отговаря на спецификациите“ и „изисква промени“) в съответствие с уникална рубрика. Вашият проект трябва да отговаря на всички раздели на рубриката. Ако всичките ви проекти отговарят на спецификациите, завършвате. Това означава, че автоматично оценяваните тестове не се включват в оценката ви.

Ако подаването на проект изисква промени, вашият рецензент на проекта ще ви даде обратна връзка. След като внедрите тези промени, можете да ги изпратите отново. Няма ограничение за подаване.

Моят опит

Хронология

Очакваният график на Udacity за програмата Data Analyst Nanodegree беше 378 часа, когато започнах, което означаваше, че студентите отнеха средно 6-7 месеца, за да я завършат. Според Toggl (приложение за проследяване на времето) цялата програма ми отне 369 часа в продължение на пет месеца. Тази времева линия включваше отделяне на сериозно време за изработване на портфолиото на моите проекти, за разлика от създаването на минимума, за да се задоволи рубриката за преминаване / отказ.

Програмата беше кондензирана при опресняването през есента на 2017 г. Най- нови оценени времевата линия е на 260 часа . Всеки срок се провежда по 10 часа седмично в продължение на 13 седмици, въпреки че студентите имат 19 седмици, за да завършат всеки срок.

Как беше съдържанието на курса?

За моето издание на програмата съдържанието на курса от P1 (Статистика), P2 (Въведение в анализа на данните), P4 (Анализ на изследователски данни), P5 (Машинно обучение) и P7 (A / B тестване) получава пет звезди от пет от мен. P3 (Data Wrangling) и P6 получават три звезди и половина.

Съдържанието на изследователския анализ на данни със служители на Facebook (P4) беше толкова осветително. Встъпителният курс за машинно обучение със Себастиан Трън и Кейти Малоун (P5) беше най-забавното, което имах във всеки онлайн курс. Съдържанието за A / B тестване със служители на Google (P7) е толкова уникално. Бих дал на тези три курса шест звезди, ако можех.

Съдържанието на SQL и разбъркване на данни (P3) не беше невероятно. Същото е и със съдържанието за визуализация на данни (P6), макар че това вероятно е така, защото D3.js е супер трудно да се преподава на начинаещи в JavaScript. Тези мнения не са необичайни, според прегледите на Class Central за тези курсове. Вижте ги тук и тук.

Това „не невероятно“ съдържание от старата програма беше премахнато при опресняването през есента на 2017 г. Вече е включено преработено съдържание за въведение в анализ на данни, SQL, статистика, преборване на данни и визуализация на данни. Съдържанието на практическата статистика се фокусира върху статистиката на извода, като описателната статистика е предпоставка и се преподава в програмата Data Foundations Nanodegree. Курсът за визуализация на данни вече се преподава с Tableau вместо D3.js.

Как бяха проектите?

Отново проектите са мястото, където Udacity се отличават от останалите онлайн образователни платформи. Те инвестират в процеса на преглед на своите проекти и това се отплаща. Програмата Data Analyst Nanodegree не беше изключение.

Всички проекти подсилват съдържанието, което сте научили във видеоклиповете. Рецензентите на проекти знаят своите неща. Те ви казват къде сте успели и къде са грешките и / или пропуските ви. Контролирано обучение чрез правене. Работи.

Форумите и менторите на форума са особено полезни, когато закъсате. Потърсете във форумите, за да видите дали проблемът ви е често срещан (те обикновено са). Без късмет? Публикувайте нов въпрос сами. Има един ментор от форума, Майлс Калън, който изглежда знае всичко за всичко и отговаря в рамките на часове. Имам съмнения, че той спи.

Въпреки че форумите все още съществуват и работят, наставниците на Slack и класните стаи вече са препоръчителните възможности за подкрепа. Студентите могат да публикуват въпроси и отговорите се предоставят със същото или по-високо ниво на непосредственост (в рамките на часове и често по-рано). Общността Slack се контролира от инструктори на Udacity, както и от екипа на студентския опит, който гарантира, че студентските въпроси, коментари и т.н. се разглеждат своевременно. Известният Майлс Калан вече е наставник.

Ако сте любопитни да видите как изглеждат тези проекти, разгледайте това хранилище на Github.

Колко трудно беше?

Съдържанието на статистиката беше лесно за мен, защото бях на няколко курса по статистика в по-ниска степен. Това вероятно би било вярно за всяка тема от програмата Nanodegree, ако имате предишен опит в нея.

Бих класифицирал по-голямата част от програмата като междинна трудност. Лекционното съдържание, което няма много тестове (те често го правят), обаче може да бъде вятър, което не е непременно лошо. Проектите упражняват мозъка ви. Всеки от тях вероятно ще ви отнеме повече от двадесет часа, ако искате да бъдете задълбочени.

Проектът за проучвателен анализ на данни беше най-предизвикателният за преминаване. Отне ми 3,5 подавания. Вижте тази тема в Twitter за повече подробности.

Можете ли да кандидатствате за работа веднага след дипломирането?

Можеш. Програмата трябва да ви осигури необходимите умения за ролята на анализатор на данни от начално ниво, ако я приемате сериозно. Ели Кастелайн е отличен пример за това. Можете да прочетете повече за неговата история по-долу.

Как да изградим кариера в технологиите без CS степен

През пролетта на 2014 г. бях нов отпаднал колеж в автобус на хрътки, насочен никъде по-конкретно. medium.com

Можете също така да продължите към по-напреднали курсове, както за предметите, обхванати в програмата, така и за други предмети. Това избрах да направя.

Финални мисли

Бих ли взел програмата отново, знаейки какво знам сега?

Някъде към края на програмата започнах да създавам Ръководство за кариера на Data Science на Class Central. Това доведе до проучване на всеки отделен онлайн курс, предлаган за всеки предмет в науката за данните.

Въпреки че се наслаждавах на повечето курсове в рамките на програмата Nanodegree (актуализация: новите курсове замениха курсовете, които не ми харесаха ) , има курсове от други доставчици, които получават по-добри отзиви за определени предмети. Статистика например. Ако имах достъп до ръководството си, когато започнах, щях да обмисля маршрута за отделен курс за всеки предмет. Студентските услуги на Udacity и процесът на преглед на проекти обаче са толкова ефективни за учене, че бих взел програмата Data Analyst Nanodegree независимо.

Ако сте човекът, който иска 100% персонализирано онлайн обучение, но иска да се възползва от проектите и услугите на Udacity, проучване на любимите ви курсове за всеки предмет (препоръчвам да използвате Class Central) и след това записване в програмата Nanodegree за завършване проектите е нещо за разглеждане.

Алтернативите

Това са петте алтернативни програми, които обмислях, когато се записах в програмата Data Analyst Nanodegree:

  • Специализация на науката за данни на Coursera от университета Джон Хопкинс
  • Сертификат за професионална програма на Microsoft в областта на науката за данни на edX
  • Специализация за анализ и интерпретация на данни на Coursera от университета Уеслиан
  • Пистите на Python и R на DataCamp
  • Пътеки на Dataquest на Dataquest и Data Scientist

Забележка: Премахнах коментарите си за тези програми поради политиката на Udacity относно коментирането на други доставчици.

Заключение

Програмата на Nanodegree на анализатора на данни на Udacity ви дава основни умения, необходими ви за кариера в науката за данни. След дипломирането ще можете да насочите своите силни и слаби страни и да допълвате обучението си, когато е необходимо. Освен това ще си тръгнете с шепа готови за портфолио проекти.

Обичах го, както и другите.

★★★★ ¾