ПРОГРАММА КУРСА
Data Science: машинное обучение и нейронные сети.
Начальный уровень

Тема 1. Введение в машинное обучение и науку о данных.
✓ Что такое наука о данных?
✓ Этапы работ по машинному обучению.
✓ Виды машинного обучения.
✓ Установка Data Science Tools.
✓ Знакомство с Jupyter Notebook.
✓ Установка и настройка Jupyter Notebook.
✓ Введение в язык программирования Python.
✓ Установка и настройка Python.
✓ Выбор среды разработки (IDE).
✓ Работа с менеджером пакетов и виртуальным окружением.
✓ Понятие сложности алгоритма.

Тема 2. Введение в программирование на языке Python.
✓ Введение в программирование на языке Python. Введение в ООП.
✓ Модульность и импорт модулей.
✓ Типы и структуры данных.
✓ Переменны. Функции ввода-вывода. Типизация в Python.
✓ Основы булевой алгебры.
✓ Операторы ветвления и вложенные операторы.
✓ Основы циклов.
✓ Управление исключениями.
✓ Функции.
✓ Приоритет операторов.
✓ Коллекции в Python. Модуль collections.

Тема 3. Система контроля версий. Работа с данными.
✓ Понятие системы контроля версий (VCS).
✓ Установка и настройка Git.
✓ Основные отличия Git от других систем контроля версий.
✓ Основы Git. Основные команды и рабочий процесс.
✓ Применение Git в Data Science.
✓ Значение данных в Data Science. Основы работы с данными.
✓ Типы данных: структурированные и неструктурированные.
✓ Методы и источники сбора данных.
✓ Очистка и предобработка данных.
✓ Использование инструментов Python для EDA.
✓ Визуальный анализ данных.
✓ Лучшие практики и частые ошибки.

Тема 4. Продвинутый Python.
✓ Понятие объекта в Python. Объекты как экземпляры классов.
✓ Атрибуты и методы объектов.
✓ Встроенные методы объектов.
✓ Создание классов в Python.
✓ Определение класса и его структура.
✓ Создание методов класса.
✓ Практическая часть.
✓ Расширенное использование классов.
✓ Модули в Python.
✓ Разработка простого модуля.

Тема 5. Математика: Основы статистики и теории вероятности.
✓ Основные понятия и обозначения.
✓ Знакомство с понятиями вектор, матрица, векторное пространство.
✓ Действия над векторами и матрицами.
✓ Специальные типы матриц.
✓ Теория вероятностей и комбинаторика.
✓ Случайные величины и дисперсия.
✓ Условная вероятность и формула Байеса.
✓ Практическое применение вероятностей и формулы Байеса.
✓ Знакомство с NumPy.

Тема 6. Работа с данными.
✓ Введение в работу с данными.
✓ Типы данных и их использование.
✓ Методы и инструменты для обработки данных.
✓ Обработка, хранение и использование информации.
✓ Типы баз данных.
✓ SQL и Postgres.
✓ Базовый SQL.
✓ Продвинутый SQL.
✓ Безопасность и конфиденциальность данных.
✓ Практическое применение.

Тема 7. Фича Инженеринг. Машинное Обучение.
✓ Введение в фича инженеринг.
✓ Значение фича инженеринга в машинном обучении.
✓ Качество признаков.
✓ Техники преобразования признаков.
✓ Методы Выбора Признаков.
✓ Проклятие размерности.
✓ Практическое применение.
✓ Машинное обучение.

Тема 8. Алгоритмы машинного обучения. Классификация.
✓ Классификатор CatBoost.
✓ Классификатор градиентного бустинга.
✓ Классификатор Ada Boost.
✓ Классификатор Extra Trees.
✓ Квадратичный дискриминантный анализ.
✓ Light Gradient Boosting Machine.
✓ Классификатор K Neighbors.
✓ Классификатор дерева решений.
✓ Экстремальный градиентный бустинг.
✓ Фиктивный классификатор.
✓ SVM - линейное ядро.
✓ Ансамбли моделей.
✓ Дисбаланс классов.

Тема 9. Алгоритмы машинного обучения.Регрессия.
✓ Регрессор Gradient Boosting.
✓ Регрессор LGBM.
✓ Экстремальный градиентный бустинг.
✓ Регрессор Extra Trees.
✓ Регрессор случайного леса.
✓ Регрессор CatBoost.
✓ Регрессор AdaBoost.
✓ Регрессия Лассо.
✓ Гребневая регрессия.
✓ Байесовская регрессия.
✓ Линейная регрессия.
✓ Регрессор Губера.
✓ Регрессор дерева решений.
✓ Ортогональный поиск соответствия.
✓ Пассивно-агрессивный регрессор.
✓ Регрессор K- ближайших соседей.
✓ Фиктивный регрессор.
✓ Elastic Net.

Тема 10. Алгоритмы машинного обучения. Детекция аномалий.
✓ Аномалии.
✓ Обнаружение выбросов на основе углов.
✓ Локальный выброс на основе кластеризации.
✓ Локальный выброс на основе связности.
✓ Лес деревьев.
✓ Обнаружение выбросов на основе гистограммы.
✓ Детектор K-Nearest Neighbors.
✓ Фактор локального выброса.
✓ Одноклассовый SVM-детектор.
✓ Анализ главных компонент.
✓ Минимальный ковариационный детерминант.
✓ Обнаружение выбросов в подпространстве.
✓ Стохастический отбор выбросов.

Тема 11. Алгоритмы машинного обучения. Класстеризация.
✓ Кластеризации.
✓ Методы оценки качества кластеризации.
✓ Автоэнкодеры для кластеризации.
✓ Кластеризация по методу K-Means.
✓ Метод распространения близости.
✓ Кластеризация со средним сдвигом.
✓ Спектральная кластеризация.
✓ Агломеративная кластеризация.
✓ Пространственная кластеризация на основе плотности.
✓ Кластеризация на основе OPTICS.
✓ Кластеризация с помощью иерархий.
✓ Кластеризация на основе K-Modes.

Тема 12. Алгоритмы машинного обучения. Временные ряды и нейросети.
✓ Введение во временные ряды.
✓ Прогнозирование временных рядов.
✓ Основные алгоритмы и их применение.
✓ Модели ARIMA и SARIMA.
✓ Глубокое обучение для временных рядов.
✓ Рекуррентные нейронные сети (RNN).
✓ Сверточные нейронные сети (CNN).
✓ Трансформеры.
✓ Автоэнкодеры.

Тема 13. Машинное обучение. AutoML.
✓ Введение в AutoML.
✓ Популярные инструменты в AutoML.
✓ Ограничения текущих AutoML систем.
✓ AutoML PyCaret 3.0.
✓ AutoML PyCaret 3.0 классификация.
✓ AutoML PyCaret 3.0 регрессия.
✓ AutoML PyCaret 3.0 кластеризация.
✓ AutoML PyCaret 3.0 детекция аномалий.
✓ AutoML PyCaret 3.0 временной ряд.
✓ Наборы данных.

Тема 14. Интеграция знаний - Начало Пути в Data Science.
✓ Финальные проекты, презентация git-репозитория.
✓ Викторина или популярные вопросы на собеседованиях.