Обязанности и достижения:
БАЗОВЫЙ МОДУЛЬ: Основы Python, python для анализа данных, основы решения алгоритмических задач, элементы математической статистики для анализа данных, основы линейной алгебры, основы математического анализа, основы теории вероятностей, основы математической статистики.
ПРОФИЛЬНЫЙ МОДУЛЬ: Первичный анализ данных в Python. Методы машинного обучения (введение в ML, углубленная математика для ML, задачи Регрессии и Классификации, Линейные модели, основы ООП в python, Деревянные алгоритмы – дерево решений и случайный лес, градиентный бустинг, важность признаков). Глубокое обучение (введение в deep learning, временные ряды, computer vision, NLP).
ПРОЕКТЫ И ПРИКЛАДНЫЕ ЗАДАЧИ:
- Решение задачи регрессии: разработка модели машинного обучения для предсказания стоимости бриллиантов.
- Решение задачи классификации: разработка модели машинного обучения для определения гендерной принадлежности или класса физической формы на основе данных о физических параметрах людей разного возраста.
- Решение задачи по сжатию звуковой дорожки при помощи алгоритма PCA.
- Решение задачи классификации изображений.
- Первичный анализ данных: поиск и заполнение пропусков, очистка данных, расчет статистик, работа с категориальными признаками, создание новых признаков.
- Проект по первичному анализу рейтингов шоу Netflix с использованием библиотек Python: Pandas, Numpy, Seaborn, Matplotlib.
- Проект по разработке модели машинного обучения для предсказания стоимости недвижимости в США (конкурс на сайте Kaggle: House Prices - Advanced Regression Techniques) (EDA, Feature Engineering, Pandas, NumPy, Seaborn, Matplotlib, Skiearn, CatBoost).
- Итоговый проект по разработке модели машинного обучения для предсказания стоимости недвижимости в России (сайт Kaggle: Russia Real Estate 2018-2021) (EDA, Feature Engineering, Pandas, NumPy, Seaborn, Matplotlib, Scikit-learn, CatBoost, LightGBM).