Weka Tutorial - базирано на GUI машинно обучение с Java

В днешно време езиците за програмиране като Python и R несъмнено са едни от най-търсените езици в науката за данни и машинното обучение.

Но възможно ли е да се изпълняват и общи задачи за машинно обучение и наука за данни, без непременно да владеете кодиране?

Разбира се, че е! Weka е базиран на графичен потребителски интерфейс пакет с отворен код. Той може да се използва за изпълнение на често срещани задачи на Data Science само с помощта на графичния интерфейс.

Основи

Weka може лесно да бъде инсталиран на всеки тип платформа, като следвате инструкциите на следната връзка. Единствената предпоставка е инсталирането на Java 8.0 на вашата локална машина.

След като инсталирате Weka, ще имате набор от стандартни техники за обработка на данни и изводи като:

  • Предварителна обработка на данни : след като заредите набор от данни, Weka ви позволява бързо да изследвате неговите атрибути и екземпляри. Освен това са налични различни техники за филтриране, за да се преобразуват например категоричните данни в числови или да се извърши избор на функция, за да се намали размерът на набора ни от данни (напр. Да се ​​ускорят времената за обучение и производителността).
  • Алгоритми за класификация и регресия:колекция от различни алгоритми като Gaussian Naive Bayes, дървета за вземане на решения, K-Neighbor Neighbor, техники на ансамбли и различни варианти на линейна регресия.
  • Клъстериране: тази техника може да се използва, за да се идентифицират основните категории в нашите данни по без надзор. Някои примерни алгоритми, налични в колекцията Weka, са K-Means Clustering и Expectation Maximization.
  • Откриване на асоциации: откриване на правила в нашия набор от данни, за да се идентифицират по-лесно модели и връзки между различните функции.
  • Визуализация на данни:набор от интегрирани техники за визуализация на данни за бързо визуализиране на корелациите между характеристиките и представяне на научени модели на машинно обучение като дървета за вземане на решения и клъстериране на K-Means.

Друга интересна характеристика на Weka е възможността да инсталирате нови пакети при създаването им.

Един пример за допълнителен пакет, който можете да инсталирате, е AutoML. Всъщност AutoML може да бъде особено полезен за начинаещи, които може да се затруднят да идентифицират какъв модел на машинно обучение може да е най-добре да се използва за конкретна задача.

Използвайки пакета Weka AutoML, можете лесно да тествате различни модели на машинно обучение в движение. Той също така ви позволява да настроите автоматично неговите хипер-параметри, за да увеличите производителността.

И накрая, за по-експертни потребители, Weka предлага и интерфейс на командния ред за използване на Java код. Това може да бъде особено полезно, особено ако работите с големи количества данни.

Пример

Сега ще разгледаме един прост пример, за да покажем как да започнем с Weka.

На първо място, можем да започнем нашия анализ, като отворим Weka Explorer и отворим нашия набор от данни (в този пример Iris Dataset).

Изберете раздела Класификация, изберете Naive Bayes като наш класификатор и щракнете върху старт. Ще видите, че можем бързо да постигнем 96% точност на класификацията, без да се налага да пишем какъвто и да е код!

Заключение

В случай че търсите повече информация за това как да започнете с Weka, тази поредица в YouTube от Google Developers е чудесно място да започнете.

Свържи се с мен

Ако искате да сте в течение с последните ми статии и проекти, следвайте ме в Medium и се абонирайте за моя пощенски списък. Това са някои от моите данни за контакти:

  • Linkedin
  • Личен блог
  • Личен уебсайт
  • Среден профил
  • GitHub
  • Кагъл

Снимка на корицата от тази статия.