ПРОГРАММА КУРСА Data Science: машинное обучение и нейронные сети. Профессиональный уровень
1. Необходимая математическая база. Начало.
Повторение основных понятий. Вектор, матрица, векторное пространство. Действия над векторами и матрицами. Транспонирование матрицы, обратная матрица, единичная и нулевая матриц.
Теория вероятности. Комбинаторика. Случайные величины. Дисперсия случайной величины. Условная вероятность. Формула Байеса. Распределения и доверительные интервалы.
2. Необходимая математическая база. Продолжение.
Знакомство с производной. Производные n-го порядка. Частные производные. Разложение производной на граф. Понятие градиента.
Проверка статистической гипотезы. Проведение A/B тестирования.
3. Введение в алгоритмы.
Введение в алгоритмы.
Постоянное время.
Логарифмическое время.
Линейное время.
Линейно-логарифмическое время.
Квадратичное время.
Кубическое время.
Экспоненциальное время.
Сложность в лучшем и худшем случае.
Пространственная сложность.
Алгоритмы машинного обучения.
4. Линейная регрессия.
Метод наименьших квадратов.
Функция стоимости.
Градиентный спуск.
Простая линейная регрессия.
Знакомство с scikit-learn.
5. Логистическая регрессия.
Логистическая функция.
Переход от линейной к логистической.
Математика перехода.
Поиск наилучшего графика.
Создание и обучение модели.
6. Метрики классификации.
Confusion matrix.
Accuracy.
Precision, Recall и F1-Score.
ROC-кривые.
Логистическая регрессия в Scikit-Learn.
Оценка работы модели.
7. Метод k-ближайших соседей. Иерархическая кластеризация данных.
Теория метода KNN.
Решение задач методом k-ближайших соседей.
Иерархическая кластеризация данных.
8. Кластеризация. К-средних. Кластеризация на основе плотности данных.
Принципы кластеризации данных.
Теория кластеризации.
Кластеризация k-средних.
Кластеризация на основе плотности данных.
9. Метод опорных векторов.
Теория метода опорных векторов.
Метод опорных векторов для решения задач классификации.
Метод опорных векторов для решения задач регрессии.
10. Деревья решений. Случайные леса.
Что такое дерево решений?
Энтропия. Энтропия подразделений.
Создание дерева решений.
Случайные леса.
Гиперпараметры случайного леса.
Случайные леса для регрессии и классификации данных.
11. Алгоритмы нейронных сетей. Знакомство с PyTorch.
Введение в ИНС.
Эволюция ИНС.
Обучение нейронной сети.
Перенос обучения.
Введение в PyTorch.
12. Введение в PyTorch.
Понятие тензора.
Работа с тензорами.
Сверточные нейронные сети.
13. Создание и обучение нейронных сетей. Анализ временных рядов.
Создание и обучение нейронных сетей.
Понятие временного ряда.
14. Методология анализа временных рядов и нейросети.
Методология анализа временных рядов и нейросети.
Анализ временных рядов.
Дрейф данных.
RNN.
LSTM.
GRU.
BiLSTM и ConvLSTM.
Популярные архитектуры нейронных сетей.
15-16. Создание API для моделей машинного обучения.