Преглед на всеки курс за визуализация на данни в интернет

Преди година отпаднах от една от най-добрите програми за компютърни науки в Канада. Започнах да създавам собствена магистърска програма по наука за данни, използвайки онлайн ресурси. Разбрах, че вместо това мога да науча всичко, което ми трябва, чрез edX, Coursera и Udacity. И бих могъл да го науча по-бързо, по-ефективно и за малка част от цената.

Сега почти приключих. Участвал съм много курсове, свързани с науката за данните, и одитирани части от много други. Знам какви са възможностите и какви умения са необходими на учащите, които се подготвят за ролята на анализатор на данни или учен по данни. Преди няколко месеца започнах да създавам ръководство с преглед, което препоръчва най-добрите курсове за всеки предмет в рамките на науката за данните.

За първото ръководство от поредицата препоръчах няколко класа по кодиране за начинаещия учен по данни. Тогава това беше статистика и класове на вероятност. Тогава това беше въведение в самата наука за данните.

Сега върху визуализацията на данни.

За това ръководство прекарах 10+ часа, опитвайки се да идентифицирам всеки онлайн курс за визуализация на данни, предлаган от март 2017 г., извличане на ключови битове информация от техните програми и рецензии и съставяне на техните оценки. За тази задача се обърнах към никой друг освен общността с отворен код Class Central и нейната база данни от хиляди оценки и рецензии за курсове.

От 2011 г. основателят на Class Central Dhawal Shah следи по-отблизо онлайн курсовете, отколкото може би някой друг по света. Dhawal лично ми помогна да събера този списък с ресурси.

Как избрахме курсове за разглеждане

Всеки курс трябва да отговаря на три критерия:

  1. По-голямата част от курса трябва да бъде фокусирана върху визуализацията на обяснителни данни. Покриването на подготовката на данни, например, е разрешено, тъй като това е важна част от процеса на визуализация на данните. Курсовете, които обхващат по-малко подходящи теми (статистическо моделиране например), са изключени. Повече за обяснителното разграничение по-долу.
  2. Той трябва да се предлага при поискване или да се предлага на всеки няколко месеца.
  3. Това трябва да е интерактивен онлайн курс, така че няма книги или уроци само за четене . Въпреки че това са жизнеспособни начини за учене, това ръководство се фокусира върху курсове.

Вярваме, че сме покрили всеки забележителен курс, който отговаря на горните критерии. Тъй като има привидно стотици курсове за Udemy, ние избрахме да разгледаме само най-преглежданите и най-високо оценените. Винаги има шанс да сме пропуснали нещо, така че, моля, уведомете ни в раздела за коментари, ако оставим добър курс.

Как оценихме курсовете

Съставихме среден рейтинг и брой рецензии от Class Central и други сайтове за рецензии, за да изчислим среднопретеглена оценка за всеки курс. Прочетохме текстови рецензии и използвахме тази обратна връзка, за да допълним числените оценки.

Направихме субективни планове за съдебен план въз основа на два фактора, като първият даде предпочитание пред втория:

  1. Покритие на теорията за визуализация на данни. Обяснени ли са мотивациите за избор на визуализация? Курсът преподава ли само инструмента? Повече за това в следващия раздел.
  2. Покритие на избрани инструменти за визуализация на данни. Ефективно ли курсът преподава общи инструменти за визуализация (Tableau, ggplot2, Seaborn и др.)? Имат ли учениците възможност да практикуват тези умения? Не се дава предпочитание за избор на инструмент.

Защо да дадем приоритет на теорията за визуализация

Владеенето на конкретен инструмент е разточително без познаване на основите на ефективната визуализация. Освен това инструментите често са взаимозаменяеми в зависимост от настройката.

По-важното е, че доброто визуализиране на данни е по-сложно, отколкото повечето хора си мислят. Изисква се внимателно обмисляне от етапите на планиране до изпълнението. Изборът на правилната диаграма, балансиране на сложността и бъркотията, възползване от предварителните свойства и много други, визуализацията на данните е едновременно изкуство и наука. Лесно е да се объркате, а понякога и ужасно (вижте по-долу).

Проучвателна срещу обяснителна визуализация

Както е описано от университета в Индиана професор Йонг-Yeol Ahn, целта на обяснителен визуализация на данни е да се свързва прозрения и съобщения, а целта на проучвателно визуализация е да се открият скрити мотиви.

Тази статия се фокусира върху обяснителни курсове за визуализация на данни. Следователно курсове като Анализ на данни на Udacity с R (изключително изследователски курс) са изключени от тази статия. Темата е важна; просто няма достатъчно курсове, които да оправдаят самостоятелна статия. Тя ще бъде разгледана накратко в обобщената статия за тази поредица.

Понякога се изисква кодиране

Някои курсове, изброени по-долу, изискват основни умения за кодиране на езика на обучение на курса. Ако имате много малко опит в програмирането, нашите препоръки в първата статия от тази поредица - най-доброто въведение в курсовете по програмиране за наука за данни - биха били чудесно начало. Покрити са както курсовете по Python, така и R.

Липсват данни за преглед

В сравнение с другите статии от тази поредица, липсват данни за преглед на курсове за визуализация на данни, които отговарят на горните критерии. Все още няма ясен курс за най-добра визуализация на данни. Следователно препоръките по-долу не са толкова убедителни, колкото предишни статии. Както винаги, но особено тук, опитайте се да изберете курса, който най-добре отговаря на вашите нужди.

Нашият избор за най-добрия курс за визуализация на данни е ...

  • Визуализация на данни със специализация Таблица от Калифорнийския университет, Дейвис на Coursera

... който съдържа следните пет курса:

  • Основи на визуализацията с Tableau
  • Основни принципи на дизайна за Tableau
  • Визуален анализ с Tableau
  • Създаване на табла за управление и разказване на истории с Tableau
  • Визуализация на данни с проект Tableau

Визуализацията на данните от Университета на Калифорния, Дейвис със специализация по Tableau, има най-добрата комбинация от теория и покритие на инструментариума, базирана на критериите за оценка на тази статия. Той се потапя дълбоко в теорията, както няколко други курса. Има възможности за практикуване на Tableau чрез упътвания и окончателен проект, въпреки че овладяването на Tableau не е основният фокус. Това е сравнително нова специализация (края на 2016 г.) и курсовете имат само една 4- звездна оценка помежду си в сайтовете за преглед, използвани за този анализ.

Govind Acharya, Hunter Whitney и Suk Brar са инструкторите. Ачария е главен анализатор в UC Davis. Уитни и Брар са уважавани професионалисти в бранша. Между тях те имат опит с визуализацията на данни от десетилетия, който ясно се предава чрез съдържанието на курса. Видеоклиповете са добре продуцирани.

Очакваният график за специализация по Coursera е 22 седмици със седмични ангажименти, вариращи от три до осем часа седмично. Тези оценки са сигурно твърде високи, както отбелязват няколко рецензента и опитът ми с Coursera. Понастоящем са налични безплатни (одитиране на всеки курс поотделно) и платени (заплащане на специализацията).

Няколко видни рецензенти на Coursera отбелязват следното:

Те не само ви казват как да направите дизайна на визуализацията, но също така и защо (физиологията, принципите). Горещо бих препоръчал този клас. Голям курс - предпазва от някои фини клопки при подготовката за визуализация. Въпреки че е много основно въведение в използването на Tableau, курсът предоставя широк и интересен фон, който трябва да се окаже полезен за всеки, който се стреми да подобри разбирането си за основи на визуализацията.

Теория на визуализацията и R, научени чрез правене

  • Визуализация на данни с ggplot2 от DataCamp

... за които има три части:

  • Визуализация на данни с ggplot2 (част 1)
  • Визуализация на данни с ggplot2 (част 2)
  • Визуализация на данни с ggplot2 (част 3)

Друга чудесна възможност е визуализацията на данни на DataCamp със серия ggplot2, особено ако искате да научите R и по-точно ggplot2. Обхваща се значително количество теория, което е подходящо, като се има предвид, че ggplot2 е вдъхновен от Граматиката на графиката. Покритието на инструментите и практиката също са впечатляващи - ще знаете R и неговия странен синтаксис доста добре, напускайки тези курсове. Няма отзиви за тези курсове на сайтовете за рецензии, използвани за този анализ.

Инструктор и на трите курса е Рик Скавета, който е биолог, инструктор в семинар, учен на свободна практика и съосновател на Science Craft. Хибридният стил на преподаване на DataCamp използва видео (с участието на Scavetta) и текстови инструкции с много примери чрез редактор на код в браузъра. Съдържанието на видео, текст и код е добре полирано.

Заедно прогнозният график за трите курса е 16 часа. Първата глава от всеки курс е достъпна безплатно. За пълен достъп е необходим абонамент за DataCamp, който в момента е $ 29 на месец или $ 300 на година.

Следното одобрение е от Хадли Уикъм, главен учен в RStudio и създател на ggplot2:

Настоятелно препоръчвам „Визуализация на данни с ggplot2“ от Rick Scavetta. Това ви дава отлично въведение в ggplot2. Ще научите както основната теория, така и ще се запознаете с практиката в онлайн средата за обучение на DataCamp.

Практическо въведение в Tableau с отличен инструктор

Таблица 10 от Кирил Еременко и екипа на SuperDataScience на Udemy, който включва:

  • Таблица 10 AZ: Практическо обучение по табла за наука за данни!
  • Таблица 10 Разширено обучение: Главна таблица по наука за данни

Преподавани от Кирил Еременко, SuperDataScience's Tableau 10 Series е ефективно практическо въведение. Той се фокусира най-вече върху покритието на инструментите (Tableau), а не върху теорията за визуализация на данни. Еременко е един от най-уважаваните инструктори в тези ръководства с постоянно положителни отзиви за своите курсове. AZ курсът е предпоставка за курса за напреднало обучение. Заедно курсовете от поредицата имат средно претеглена оценка от 4,6 звезди над 3 724 отзива.

Поредицата има седемнадесет часа видео съдържание. Цената на всеки курс варира в зависимост от отстъпките на Udemy, но те са чести и могат да бъдат закупени само за $ 10.

Няколко видни рецензенти отбелязват следното:

Това беше страхотно. Аз използвам Tableau дневно, но това е едно страхотно припомните някои от елементите, аз не използват и голямо проучване помощ за сядане на Tableau Certified Professional изпит. Добра работа Кирил и екипът!

Кирил е невероятен учител и студентите, които посещават този курс, ясно ще разберат защо има десетки курсове и хиляди студенти - той е в състояние да преподава сложни умения в реалния бизнес контекст и да го прави постепенно, като по този начин комбинира често сложната задача да преподава и двете основи и специфични за контекста приложения едновременно.

Състезанието

Нека разгледаме другите алтернативи, сортирани по низходящ рейтинг.

Интерактивна визуализация на данни с Python & Bokeh (Ardit Sulce / Udemy): Фокус на инструмента (Python и Bokeh). Включва раздел за създаване на уеб приложения. Седем часа видео. Цената варира в зависимост от отстъпките на Udemy, които са чести. Той има средно претеглена оценка от 4,6 звезди над 103 отзива.

Визуализация на информацията (IVMOOC) (Университет в Индиана / Независим): Обхваща много подробно теория и множество инструменти. Впечатляващ проект от реалния живот. Регистрацията не работи при опит, въпреки имейлите до администраторите на курса. Пълен дванадесет седмичен магистърски курс. Безплатно. Той има 4,5- звездна среднопретеглена оценка над 2 отзива.

Таблица за начинаещи - Получете сертификат Ускорете кариерата си (Лукас Халим / Удеми): Фокус на инструмента (Таблица). Четири часа видео. Цената варира в зависимост от отстъпките на Udemy, които са чести. Той има 4,5- звездна среднопретеглена оценка над 649 отзива.

Анализиране и визуализиране на данни с Power BI (Microsoft / edX): Фокус на инструмента (Power BI). Създадено специално за бизнес потребители, инвестирани в екосистемата на Microsoft. Част от сертификата на Microsoft Professional Program в областта на науката за данни. Приблизителен график от два до четири часа седмично в продължение на шест седмици. Безплатно с потвърден сертификат, който можете да закупите. Той има 4,5- звездна среднопретеглена оценка над 117 отзива.

Анализиране и визуализиране на данни с Excel (Microsoft / edX): Фокус на инструмента (Excel). Създадено специално за бизнес потребители, инвестирани в екосистемата на Microsoft. Част от сертификата на Microsoft Professional Program в областта на науката за данни. Приблизителен график от два до четири часа седмично в продължение на шест седмици. Безплатно с потвърден сертификат, който можете да закупите. Той има 4,5- звездна среднопретеглена оценка над 972 отзива.

Данните визуализират данни с D3.js Лесният начин (Безкрайни умения / Udemy): Фокус на инструмента (D3.js). Четири часа видео. Цената варира в зависимост от отстъпките на Udemy, които са чести. Той има среднопретеглена оценка от 4.4 звезди над 262 отзива.

Визуализация на данни с Python и Matplotlib (Stone River eLearning / Udemy): Фокус на инструмента (Python и Matplotlib). Шест часа видео. Цената варира в зависимост от отстъпките на Udemy, които са чести. Той има среднопретеглена оценка с 4.4 звезди над 92 отзива.

Анализ на данни: Визуализация и дизайн на таблото (Delft University of Technology / edX): Инструмент (Excel) и бизнес фокус. Очакван график от четири до шест часа седмично в продължение на шест седмици. Безплатно с потвърден сертификат, който можете да закупите. Той има средно претеглена оценка с 4.2 звезди над 5 отзива.

Големи данни: Визуализация на данни (Технологичен университет в Куинсланд / FutureLearn): Балансирана теория / фокус на инструмента. Излагане на различни инструменти. Стартира на август 2017 г. Очаквани срокове от два часа седмично в продължение на три седмици. Безплатно с „надстройка“, налична за закупуване. Той има 4- звезден рейтинг над 1 отзив.

Визуализация на данните и комуникация с Tableau (Duke University / Coursera): Инструмент (Tableau) и бизнес фокус. Част от Excel to MySQL: Аналитични техники за бизнес специализация. Приблизителен график от шест до осем часа седмично в продължение на пет седмици. Налични безплатни и платени опции. Той има средно претеглена оценка от 3,67 звезди над 9 отзива.

Визуализация на данни (Университет на Илинойс в Urbana-Champaign / Coursera): Фокус на теорията. Част от специализацията по извличане на данни. Приблизителен график от четири до шест часа седмично в продължение на четири седмици. Налични безплатни и платени опции. Той има средно претеглена оценка с 3,14 звезди над 22 отзива.

Визуализация на данни и D3.js (Udacity): Балансиран фокус на теория / инструмент. Инструкцията D3.js се чувства „непълна“ и „не на място“. Очакван срок от седем седмици. Безплатно. Той има средно претеглена оценка от 2,83 звезди над 6 отзива.

Управление на данните и визуализация (Университет Уеслиан / Coursera): Балансирана теория / фокус на инструмента. Покрива множество инструменти (Python и SAS). Част от специализацията за анализ и интерпретация на данни на Уеслиян. Приблизителен график от четири до пет часа седмично в продължение на четири седмици. Налични безплатни и платени опции. Той има средно претеглена оценка от 2,67 звезди над 6 отзива.

Приложни графики, диаграми и представяне на данни в Python (Университет в Мичиган / Coursera): Балансирана теория и фокус на инструмента Налични безплатни и платени опции. Той има средно претеглена оценка с 2 звезди над 4 отзива.

Следните курсове нямаха рецензии към март 2017 г.

Визуализация на данни в Tableau (Udacity): Фокус на теорията с отлично покритие. Кратко покритие на инструмента (Таблица). Предимно текстови инструкции с тестове с множество възможности за избор. Част от Nanodegree на анализатора на данни на Udacity и Predictive Analytics за бизнес Nanodegree. Този курс вероятно ще се класира на първо място, когато се актуализира с видеоклипове, за да допълни текста. Приблизителен график от три седмици. Безплатно.

Изграждане на инструменти за визуализация на данни (Университет Джонс Хопкинс / Coursera): Фокус на инструмента (R и ggplot2). Част от Овладяването на разработката на софтуер на JHU в R специализация. Приблизителен график от два часа седмично в продължение на четири седмици. Налични безплатни и платени опции.

Визуализация на данни за всички (Trinity College / edX): Фокус на теорията. Приблизителен график от три часа седмично в продължение на шест седмици. Безплатно с удостоверен сертификат, който можете да закупите.

Визуализация на данни с Advanced Excel (PwC / Coursera): Фокус на инструмента (Excel). Част от уменията за анализ и представяне на данни на PwC: Специализация на подхода PwC. Приблизителен график от три до четири часа седмично в продължение на четири седмици. Налични безплатни и платени опции.

Комуникация на резултатите от бизнес анализи (Университет на Колорадо Боулдър / Курсра): Теория и бизнес фокус. Част от анализа на данни на Colorado Boulder за бизнес специализация Bootcamp. Очакван срок от четири седмици. Налични безплатни и платени опции.

Разказване на истории чрез визуализация на данни (Dataquest): Предимно фокус на инструмента (Python, Matplotlib и Seaborn). Очакваната времева линия е неясна. Предимно безплатно, но за пълен достъп е необходим абонамент.

Път за обучение за визуализация на данни (O'Reilly): Балансиран фокус на инструмента / теорията. Обхваща D3.js. Множество инструктори. Петнадесет часа съдържание. Безплатно с десетдневна безплатна пробна версия.

Визуализация на данни за разработчици (Dan Appleman / Pluralsight): Фокус на теорията. Съобразено с разработчици. Два часа съдържание. Безплатно с десетдневна безплатна пробна версия.

Следващите четири курса са създадени от Бил Шандър от Beehive Media и се предлагат в Lynda. Те са изброени в хронологичен ред по дата на издаване.

Основи на визуализацията на данни (Bill Shander / Lynda): Фокус на теорията. Четири часа съдържание. Безплатно с десетдневна безплатна пробна версия.

Проектиране на визуализация на данни (Bill Shander / Lynda): Фокус на теорията. Обхваща създаването на специфичен проект от концепция до анализ на данни до проектиране и изпълнение. Четири часа съдържание. Безплатно с десетдневна безплатна пробна версия.

Визуализация на данни за анализатори на данни (Bill Shander / Lynda): Фокус на теорията. Съобразено с анализатори на данни. Два часа съдържание. Безплатно с десетдневна безплатна пробна версия.

Визуализация на данни Основни разкази (Bill Shander / Lynda): Фокус на теорията. Два часа съдържание. Безплатно с десетдневна безплатна пробна версия.

Визуализация в R, от начинаещ до напреднал (Nathan Yau / FlowingData): Четириседмичен курс. Необходим е абонамент.

Следните четири курса се предлагат от DataCamp. Както беше отбелязано по-горе, хибридният стил на преподаване на DataCamp използва видео и текстови инструкции с много примери чрез редактор на код в браузъра.

Визуализация на данни в R (DataCamp): Балансиран фокус на теория / инструмент. Обхваща основна R графика. Приблизителен срок от четири часа. За пълен достъп се изисква абонамент.

Въведение в визуализацията на данни с Python (DataCamp): Фокус на инструмента (Python, Matplotlib и Seaborn). Приблизителен срок от четири часа. За пълен достъп се изисква абонамент.

Интерактивно визуализиране на данни с Bokeh (DataCamp): Фокус на инструмента (Python и Bokeh). Приблизителен срок от четири часа. За пълен достъп се изисква абонамент.

Визуализация на данни в R с ggvis (DataCamp): Балансиран фокус на теория / инструмент. Обхваща R и ggvis. Приблизителен срок от четири часа. За пълен достъп се изисква абонамент.

Опаковане

Това е четвъртата от поредицата от шест части, която обхваща най-добрите онлайн курсове за стартиране в областта на науката за данни. Ние разгледахме програмирането в първата статия, статистиката и вероятността във втората статия и въведенията в науката за данните в третата статия. Останалата част от поредицата ще обхване други основни компетенции в областта на науката за данни. Следва машинно обучение.

Ако искате да научите Data Science, започнете с един от тези класове по програмиране

medium.freecodecamp.com Ако искате да научите Наука за данни, вземете няколко от тези класове статистика

medium.freecodecamp.com Класирах всеки курс за въведение в науката за данни в интернет, базиран на хиляди точки от данни

medium.freecodecamp.com

Последното парче ще бъде резюме на тези статии, плюс най-добрите онлайн курсове за други ключови теми, като преборване на данни, бази данни и дори софтуерно инженерство.

Ако търсите пълен списък на онлайн курсовете по Data Science, можете да ги намерите на тематичната страница на Data Central и Big Data на Class Central.

Ако ви е харесало да четете това, разгледайте някои от другите парчета на Class Central:

Ето 250 курса на Ivy League, които можете да вземете онлайн в момента безплатно

250 MOOC от Браун, Колумбия, Корнел, Дартмут, Харвард, Пен, Принстън и Йейл. medium.freecodecamp.com 50-те най-добри безплатни онлайн университетски курса според данните

Когато стартирах Class Central през ноември 2011 г., имаше около 18- ина безплатни онлайн курса и почти всички ... medium.freecodecamp.com

Ако имате предложения за курсове, които съм пропуснал, уведомете ме в отговорите!

Ако сметнете това за полезно, щракнете върху? така че повече хора ще го видят тук в Medium.

Това е съкратена версия на оригиналната ми статия, публикувана в Class Central, където съм включил допълнителни описания на курсовете, учебни програми и множество рецензии.