spinner-it

Big Data

Старт навчання
Старт курсу запитуйте в адміністрації
36 год. Двічі на тиждень

Опис курсу:

В результаті проходження курсу студенти опанують сучасні методи та алгоритми теорії інтелектуального аналізу великих даних та машинного навчання. Мета курсу — формування реальних навичок в аналізі, обробці, пошуку шаблонів та побудуванні прогнозів на основі даних.

Після вивчення курсу Ви зможете:

  • Аналізувати та обробляти великі та надвеликі дані у різних форматах з метою підтримки прийняття рішень
  • Знаходити шаблони у великих і надвеликих базах даних та у масивах тексту
  • Будувати прогнози з використанням сучасних методів і алгоритмів інтелектуального аналізу даних;
  • Використовувати програмне забезпечення для інтелектуального аналізу даних в практичній роботі.

Разом дешевше

data-science-300x170 Big Data
Data Science/Machine Learning Fundamentals
+
pmi_acp-300x170 Big Data
Big Data
=

16700 грн.

14200 грн.

Програма курсу:

Загальні відомості про інтелектуальний аналіз даних (ІАД) та машинне навчання
  • Загальні відомості про великі данні та інтелектуальний аналіз даних. Задачі ІАД. Огляд методів ІАД та машинного навчання
  • Процес ІАД. Підготовлення даних.
  • Практичне застосування ІАД.
Методи та алгоритми класифікації
  • Методи побудови дерев рішень. Методика «розділяй та володарюй». Алгоритм покриття. Алгоритм CART.
  • Байесівські методи класифікації.
  • Побудова математичних функції класифікації. Метод опорних векторів: лінійний та нелінійний випадки.
  • Системи з нечіткою логікою. Нечітко-нейронні системи. Настроювання параметрів нечітко-нейронних систем.
  • Розв’язання практичних задач класифікації.
Методи та алгоритми кластеризації
  • Ієрархічна кластеризація: агломеративний та дівізимний алгоритми. Методи сусідства. Поняття дендрограми.
  • Статистичні алгоритми k-середніх, ЕМ та їх модифікації.
  • Методи кластеризації на основі теорії графів. Алгоритми знаходження мінімального покриваючого дерева. Алгоритм Борувки.
  • Алгоритм Форел та його модифікації.
  • Метод самоорганізуючих карт Кохонена. Метод стохастичного градієнта. Інтерпретація карт.
  • Аналіз результатів кластеризації. Розв’язання практичних задач.
Методи та алгоритми побудови асоціативних правил. Секвенційний аналіз
  • Загальні відомості. Показники корисності асоціативних правил.
  • Алгоритми Apriori та FP-росту. Поняття FP-дерева (префіксного дерева).
  • Шаблони послідовностей. Алгоритм AprioriAll.
  • Пошук асоціативних правил в ієрархіях даних. Алгоритм GSP.
  • Розв’язання практичних задач пошуку асоціативних правил та шаблонів послідовностей.
Ансамблі моделей ІАД
  • Види ансамблів. Поняття беггінгу. Суміш моделей ІАД. Комбінування результатів прогнозів, отриманих моделями ІАД.
  • Методи розрахунку коефіцієнтів відносних важливостей (ваг) моделей в ансамблі.
  • Поняття бустингу. Алгоритм AdaBoost. Обгрунтування бустингу. Градієнтний бустинг.
  • Порівняння моделей ІАД. Оцінки ефектив. та помилок моделей. Lift- і Profit-криві. ROC-аналіз.
Методи та алгоритми аналізу текстової інформації (textmining)
  • Етапи text mining. Попередня обробка документів. Виявлення ключових понять. Анотування текстів.
  • Методи категоризації (рубрикації) текстів.
  • Методи пошуку релевантних документів на основі множини запитів. Методи навчання ранжуванню.
  • Розв’язання практичних задач text mining.

Мінімальні вимоги:

  • Дуже бажане (але не обов’язкове) володіння знаннями з теорії ймовірностей: дискретна та неперервна випадкова величина, математичне сподівання, дисперсія, умовне математичне сподівання;
  • Володіння на початковому рівні  мовою програмування Python.

* Примітка: зазначені знижки не сумуються з іншими діючими акціями та спеціальними пропозиціями. Знижка застосовується тільки до нових заявок та при умові повної оплати курсу. Якщо у Вас виникли питання, звертайтеся за консультацією до наших менеджерів!