Обязанности и достижения:
Стек:
- python (pandas, matplotlib, numpy, keras, sklearn, seaborn, scipy, catboost, lightgbm, XGboost)
- sql - Оконные функции, join'ы, вложенные запросы
- Занимался предобработкой и исследовательским анализом
- визуализировал результаты анализа
- строил пайплайны
- оценивал модели метриками
- подбирал гиперпараметры
Решал задачи регрессии, классификации, кластеризации. Также изучал nlp модели и cv.
В рамках практики была разработана модель по определению удоя коровы с молока, а также вкуса полученного молока. Было обучено 3 модели линейной регрессии с разными признаками. В ходе обучения получилось добиться значения метрики R2 на 3 модели - 81%, метрики MAE, MSE и RMSE были также минимальны у 3 модели. Получилось добиться улучшения показателей на ~20%. Для задачи классификации использовалась логистическая регрессия. В результате ее обучения получилось добиться метрики precision равной 1, а accuracy = 61%.
Также были и другие проекты, например, выявление взаимосвязей между семейным положением и количеством детей у клиента банка и погашением кредита в срок.