Научете се на науката за данните: учебният път, който използвах, за да намеря работа за анализ в Jet.com

Как можете да преминете от нулеви умения за програмиране до работа в технологиите или анализа?

Ако се интересувате от изучаването на тези умения, независимо дали за забавление или за промяна в кариерата, какъв е най-добрият начин да го направите?

Съществуват безброй списъци с най-добрите онлайн курсове, но как можете да създадете своя собствена учебна пътека с целия шум?

Аз лично никога не съм мислил, че ще науча някакви практически умения около програмиране, анализ на данни, машинно обучение или технологии като цяло. Като специалност по финанси винаги съм предполагал, че ще бъда „бизнесменът“. И все пак по някакъв начин се научих на Python и SQL и се озовах да работя по анализи в Jet.com, използвайки един от тези езици всеки ден.

Защо Python и SQL, може да попитате?

Python е най-бързо растящият език за програмиране там и с добра причина. Той има безумен брой библиотеки, които можете да използвате за приложения за машинно обучение, анализ на данни, визуализация, уеб приложения, интеграции на API и много други. Плюс това е един от най-лесните езици за изучаване и изучаване. Що се отнася до SQL, базите данни захранват компаниите за технологични технологии, а SQL ви позволява да разберете по-добре, да проучите и да използвате натрупаните данни.

По-долу очертавам пътя, по който преминах в изучаването на тези езици, който ме доведе до аналитика. За да бъде ясно, този път беше невероятно труден; Прекарах безброй вечери, чувствайки се разочарован и объркан. Много нощи исках просто да хвърля кърпата и да се задоволя с това, че съм бизнесменът.

Но вашата мотивация остава ключът към прокарването напред през препятствията, с които неизбежно ще се сблъскате. Независимо дали искате да преминете към роля на анализ на данни или роля на науката за данни или просто искате да разберете по-добре програмирането и технологиите, за да се забавлявате (което става забавно!), Трябва да разберете как да останете мотивирани и дисциплиниран, ако искате действително да научите тези умения.

За мен отделянето на конкретни количества време почти всеки ден (около 90 минути до 2 часа), за да се уча или практикувам веднага след като се прибера от работа, ми позволи да развия последователни навици и да разбивам концепции за дома, които ми се струваха объркващи.

Ето пътя, по който поех; надяваме се, че може да ви помогне да започнете сами.

Основната фондация

  1. Научете Python по трудния начин

Това е един от най-добрите курсове, които някога съм посещавал, точка. Той е самонасочен и предизвикателен, но Zed ви предоставя достатъчно подробности и насоки, за да започнете действително да започнете програмирането в Python. Той прави програмирането да се чувства достъпно и материалът ви дава увереност седмица след седмица да се чувствате така, сякаш можете ефективно да научите Python.

2. Анализ на режима: Панди

Mode Analytics предлага страхотно въведение в Python и включва уроци по една от най-мощните му структури от данни: Pandas DataFrame. Това е идеално за изучаване на основите на анализа на данните, след като сте свалили основите на Python.

3. Анализ на режима: SQL

Другият урок за Analytics Mode за SQL също е фантастичен. Можете да научите всички ключови понятия и да създадете силна SQL основа тук. Те дори имат свой собствен SQL редактор и данни, с които можете да си играете.

Съвместно с Mode Analytics, W3 Schools могат да ви помогнат да отговорите на всеки SQL въпрос, който някога сте имали, докато си проправяте път през уроците.

Гмуркане точно в машинно обучение

Преди да разбирам напълно Python, направих един изстрел и кандидатствах за самоуправляващата се на Udacity кола. Знаех, че е напълно над главата ми, но си помислих, защо да не опитам?

По-лесно е да се мотивирате да научите Python и машинно обучение, когато сте очаровани от практическите приложения.

Имах около месец преди началото на урока, така че взех колкото се може повече часове по наука на данните и машинно обучение.

Ето най-добрите безплатни уводни курсове, които открих, които бяха изключително полезни:

  • Udacity Machine Learning Intro
  • Udacity Въведение в статистиката
  • Udacity Въведение в науката за данни

Да, виждате, че мисля доста високо за Udacity.

Макар и да не е безплатен, горещо препоръчвам да разгледате книгата за дълбоко обучение Grokking. Той предоставя изключително ясни и подходящи примери за основите на машинното обучение.

TensorFlow, разработен от Google, е библиотека с отворен код за машинно обучение, която може да бъде написана на Python. Той е невероятно мощен и си струва да се запознаете.

Вижте упражнението MNIST за фантастично въведение в рамката.

Открих, че класът Stanford CS231 също е полезен ресурс; той обхваща широко конволюционните невронни мрежи (това, което използваме за софтуер за разпознаване на изображения или лица), което, чета, би било изключително полезно за самоуправляващата се кола Nanodegree. Ако въобще се интересувате от използването на машинно обучение с изображения или видео, няма да намерите много по-добро от този курс.

И накрая, след като използвах тези ресурси за изграждане на солидна основа, аз започнах Udacity Self Driving Car Nanodegree.

Няма да говоря много за това, тъй като тук и тук вече има страхотни прозорци на курса. Това, което ще кажа, е, че за мой собствен шок, въпреки че бях най-предизвикателният курс, който някога съм предприемал, успях да разбера по-голямата част от съдържанието. Въоръжени с правилните базови познания, ще се изненадате колко дълбоко може да бъде разбирането ви за сложна тема.

Продължаващо обучение по Анализ и наука за данни

След като се потопих интензивно в машинното обучение в продължение на няколко месеца, беше полезно да направя крачка назад и да затвърдя разбирането си за практическите принципи на анализ и наука за данни.

Започнах с Data Science, Deep Learning и Machine Learning с Python, фантастичен курс по Udemy . Докато засяга машинното обучение, той изцяло обхваща принципите в аналитиката, науката за данни и статистиката, особено около различни техники за извличане на данни и практически сценарии за тяхното внедряване.

Книгата Data Science For Business също невероятно обяснява КАК и ЗАЩО някои модели работят при решаване на проблеми в специфичен контекст; той ви забива аналитична рамка и начин на мислене, които могат да бъдат приложени към всяка ситуация, въртяща се около проблеми с данните. Това е най -добрият ресурс, който открих, който свързва различни аналитични подходи към конкретни бизнес ситуации и проблеми.

Разбира се, ако се интересувате от кариера в областта на аналитиката или науката за данни, винаги трябва да усъвършенствате стари умения или да добавяте нови умения към инструментариума си. FreeCodeCamp и Hackernoonпубликувайте информативни статии и уроци за всички неща, свързани с науката за данни и софтуерното инженерство. Любимата ми статия наскоро беше добре написан урок за писане на собствена блокчейн.

Искате ли обаче да знаете най -добрия начин да продължите да учите?

Изградете нещо. Всичко. Изследвайте набор от данни. Намерете практически проблем, пред който сте изправени вие или вашата компания, и се опитайте да го разрешите.

Дори да нямате достъп до висококачествени данни във вашата компания, има много набори от данни с отворен код, с които можете да играете и да практикувате. Обзалагам се, че ще научите точно толкова, ако не и повече, да работите върху собствените си проекти за данни, отколкото да ходите на какъвто и да е курс или да четете която и да е книга.

И накрая, срещата и ученето от хора, които имат уменията, които искате да придобиете, е изключително полезно. Силно препоръчвам да използвате Meetup, за да намерите групи специалисти по аналитика или софтуер във вашия район. Много от тези групи имат безплатни уроци или учебни сесии и ще срещнете много безумно умни хора, които могат да предоставят съвети и трикове за ускоряване на вашите знания.

В Ню Йорк някои от групите, които ми помогнаха изключително много, са:

  • Общество за машинно обучение
  • Google Developer Group
  • НЯЙ
  • Наука за данните в Ню Йорк

Забавлявайте се в ученето и ми кажете как протича вашето пътуване!

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

АКТУАЛИЗАЦИЯ : Udacity току-що пусна нова програма Data Scientist Nanodegree. Прегледах материалите и изглежда невероятно полезен ресурс! Проектите включват изграждане на механизъм за препоръки с данни на IBM и класифициране на клиентите по сегменти. Все още не съм го взел, но вижте тук: Програма за учени на данни Nanodegree.