ПРОГРАММА КУРСА
Data Science: машинное обучение и нейронные сети. Профессиональный уровень
1. Необходимая математическая база. Начало.

  • Повторение основных понятий. Вектор, матрица, векторное пространство. Действия над векторами и матрицами. Транспонирование матрицы, обратная матрица, единичная и нулевая матриц.
  • Теория вероятности. Комбинаторика. Случайные величины. Дисперсия случайной величины. Условная вероятность. Формула Байеса. Распределения и доверительные интервалы.

2. Необходимая математическая база. Продолжение.

  • Знакомство с производной. Производные n-го порядка. Частные производные. Разложение производной на граф. Понятие градиента.
  • Проверка статистической гипотезы. Проведение A/B тестирования.

3. Введение в алгоритмы.

  • Введение в алгоритмы.
  • Постоянное время.
  • Логарифмическое время.
  • Линейное время.
  • Линейно-логарифмическое время.
  • Квадратичное время.
  • Кубическое время.
  • Экспоненциальное время.
  • Сложность в лучшем и худшем случае.
  • Пространственная сложность.
  • Алгоритмы машинного обучения.

4. Линейная регрессия.

  • Метод наименьших квадратов.
  • Функция стоимости.
  • Градиентный спуск.
  • Простая линейная регрессия.
  • Знакомство с scikit-learn.

5. Логистическая регрессия.

  • Логистическая функция.
  • Переход от линейной к логистической.
  • Математика перехода.
  • Поиск наилучшего графика.
  • Создание и обучение модели.

6. Метрики классификации.

  • Confusion matrix.
  • Accuracy.
  • Precision, Recall и F1-Score.
  • ROC-кривые.
  • Логистическая регрессия в Scikit-Learn.
  • Оценка работы модели.

7. Метод k-ближайших соседей. Иерархическая кластеризация данных.

  • Теория метода KNN.
  • Решение задач методом k-ближайших соседей.
  • Иерархическая кластеризация данных.

8. Кластеризация. К-средних. Кластеризация на основе плотности данных.

  • Принципы кластеризации данных.
  • Теория кластеризации.
  • Кластеризация k-средних.
  • Кластеризация на основе плотности данных.

9. Метод опорных векторов.

  • Теория метода опорных векторов.
  • Метод опорных векторов для решения задач классификации.
  • Метод опорных векторов для решения задач регрессии.

10. Деревья решений. Случайные леса.

  • Что такое дерево решений?
  • Энтропия. Энтропия подразделений.
  • Создание дерева решений.
  • Случайные леса.
  • Гиперпараметры случайного леса.
  • Случайные леса для регрессии и классификации данных.

11. Алгоритмы нейронных сетей. Знакомство с PyTorch.

  • Введение в ИНС.
  • Эволюция ИНС.
  • Обучение нейронной сети.
  • Перенос обучения.
  • Введение в PyTorch.

12. Введение в PyTorch.

  • Понятие тензора.
  • Работа с тензорами.
  • Сверточные нейронные сети.

13. Создание и обучение нейронных сетей. Анализ временных рядов.

  • Создание и обучение нейронных сетей.
  • Понятие временного ряда.

14. Методология анализа временных рядов и нейросети.

  • Методология анализа временных рядов и нейросети.
  • Анализ временных рядов.
  • Дрейф данных.
  • RNN.
  • LSTM.
  • GRU.
  • BiLSTM и ConvLSTM.
  • Популярные архитектуры нейронных сетей.
15-16. Создание API для моделей машинного обучения.

  • Знакомство с Flask / FastAPI.
  • Создание API для моделей.
  • Знакомство с Postman.
  • Тестирование API.
  • Знакомство с Docker.
  • Деплой моделей МО.