С января 2023 года по настоящее время - Data Scientist, студент (SkillFactory, онлайн платформа обучения IT профессиям)
Стэк:
- Python (Base, Pandas, Numpy, SciPy, Math, tqdm)
- ML (Scikit-Learn, LightGBM, XGBoost, Catboost)
- RECSYS (Surprise)
- DL (TensorFlow, Keras)
- NLP (pymorphy2, NLTK)
- Visualization (Matplotlib, Seaborn, Plotly)
- Parsing (bs4)
- PROD (Streamlit, Flask)
- DE (Docker, SQL, Bash, Comet.ML)
- Other (pulp, cvxpy, pickle, os, shutil, zipfile), Linux, Git
- IDE: VS Code, Jupyter Notebook
Задачи:
- Сбор данных из веб-источников или API с последующей обработкой
- Визуализация данных (Pandas, Matplotlib, Seaborn, Plotly)
- Примение методов статистики и теории вероятности для обработки данных
- Обработка естественного языка, обогащение данных и feature engineering
- Создание классических моделей машинного обучения (линейные модели, деревья решений, ансамблевые модели)
- Оценка качества модели и итеррационное улучшение метрик, подбор гиперпараметров.
- Построение ML моделей с использованием временных рядов
- Примение алгоритмов для рекомендательных систем
- Примение систем версионирования кода (Github)
- Интеграция решений в продакшн (Docker и микросервисная архитектура)
Выполненные проекты по DS можно посмотреть ниже в поле "Обо мне" или по ссылке на GitHub: https:github.com/alekseykonotop
В настоящий момент я нахожусь на завершающем этапе обучения в онлайн-школе SkillFactory по специализации Data Scientist.
Работа с данными и возможность создания value, как для обычных людей, так и для бизнеса, сильно заинтересовала меня. Поэтому я решил сменить сферу деятельности и полностью посвятить себя анализу данных и машинному обучению.
Мои выполненные проекты по DS:
- Анализ резюме из HeadHunter (предобработка и разведывательный анализ данных EDA): https://github.com/alekseykonotop/DS_projects/tree/main/project_1
- Анализ вакансий из HeadHunter (работа с базами данных): https://github.com/alekseykonotop/DS_projects/tree/main/project_2
- Разведывательный анализ данных (разведывательный анализ данных EDA): https://github.com/alekseykonotop/ds_projects_by_sf/tree/main/sf_unit_2
- Исследование данных HR-агентства (постановка и проверка гипотез, проведение статистических тестов): https://github.com/alekseykonotop/DS_projects/tree/main/project_3
- Предсказание рейтинга ресторана (на основе модели RandomForest): https://github.com/alekseykonotop/ds_projects_by_sf/tree/main/sf_unit_3
- Прогнозирование вероятности дефолта заемщика (на основе модели LogisticRegression): https://github.com/alekseykonotop/ds_projects_by_sf/tree/main/sf_unit_4
- Прогнозирование стоимости автомобиля по характеристикам (тестирование различных моделей и стекинг): https://github.com/alekseykonotop/ds_projects_by_sf/tree/main/sf_unit_6
- Классификация автомобилей по фото (классификатор изображений с использованием SOTA-моделей): https://github.com/alekseykonotop/ds_projects_by_sf/tree/main/sf_unit_8
- Прогнозирование стоимости автомобиля (ансамбль из градиентного бустинга и нейронных сетей): https://github.com/alekseykonotop/ds_projects_by_sf/tree/main/sf_unit_9
В 2019 закончил онлайн-обучение по Backend разработке на Python-developer.
Полученные знания помогли мне освоить Python, структуры данных, принципы ООП, а так же подходы к парсингу данных и клиент-серверному взаимодействию.
Дополнительно о себе:
Имею опыт управления командой из 7 человек, более 13 лет в B2B и B2C продажах. Более 6 лет занимался развитием своего стартапа в сфере юриспруденции (юридические услуги физ. лицам).
Хорошо представляю важность метрик/аналитики для развития бизнеса и принятия обоснованных бизнес-решений.
Буду рад рассказать о своем опыте подробнее.
Иностранные языки
Английский язык — базовый
Добавить в избранное
Фото, имя и контакты доступны только авторизованным пользователям