Москва
Резюме № 55953994
Обновлено 27 сентября
no-avatar

Data Scientist Junior+

Был в этом месяце
150 000 ₽
Соискатель скрыл дату рождения
Химки
Занятость
полная занятость
Гражданство
Россия
Контакты
Телефон

Почта
Будут доступны после открытия
Профессиональные навыки
  • Показать еще
Фото, имя и контакты доступны только авторизованным пользователям

Опыт работы 11 лет и 5 месяцев

    • Июнь 2006 – октябрь 2017
    • 11 лет и 5 месяцев

    Ведущий инженер-программист

    АО ЦНИИАГ, Москва
    Разработка программного обеспечения, Электронно-вычислительная, оптическая, контрольно-измерительная техника, радиоэлектроника, автоматика (производство)

    Обязанности и достижения:

    - разработал с нуля и внедрил систему автоматического удаленного тестирования, которая позволила кратно увеличить количество проводимых испытаний, качество покрытия тестами, выявить ряд недиагностируемых ранее ошибок и сократить цикл разработки; (c++, qt, Windows, Linux, драйвера) - выявил недочет в протоколах обмена, предложил и реализовал их изменения, что позволило избежать целого класса ошибок, повысило надежность системы в целом и понизило требования к компонентам оборудования; c/c++ - участвовал в адаптации алгоритмов (CV) под железо; c/c++ - участвовал в определении архитектур, оценке сроков и планировании проектов; - взаимодействовал с внутренними и внешними заказчиками для сбора/постановки требований и разработки ТЗ; - участвовал в разработке ПО для встраиваемых систем и сопутствующего ПО; c/c++, qt, python

Обо мне

Дополнительные сведения:

Software Engineer с большим опытом в разработке ПО. Последние годы активно развиваюсь в Data Science/ML через соревнования (таблицы, NLP, Reqsys, CV), pet-проекты, курсы и книги. Ищу позицию ML Engineer, где смогу применить свой знания, опыт, развиваться в ML и приносить пользу бизнесу. Релевантные проекты: Сервис классификации тональности отзывов на телефоны. (NLP) python, selenium, nltk, scikit-learn, catboost, transformers, shap https://github.com/v010ch/sentiment_phone_reviews - собрал/очистил датасет, предобработал отзывы; (selenium, beautifulsoup, pandas, re, nltk) - построил признаки/подобрал гиперпараметры; (tf-idf) - обучил модели + файнтюнинг, применил transfer learning; (logreg, catboost, transformers) - проанализировал ошибки/модель для интерпретации предсказаний; (shap) - упаковал модель в docker-контейнер с onnx-рантаймом для ускорения инференса и реализовал REST API на flask; (onnx, docker + flask) - метрика kaggle inclass Accuracy: 0.977. Предсказание 3х численных характеристик популярности статей РБК (8е место в соревновании). (регрессия: NLP + таблицы) python, selenium, scikit-learn, catboost, transformers. https://github.com/v010ch/hackai_moscow_top_news - метрика R2: 0.748285 (на привате, 8е место); - обогатил датасет (парсинг с РБК); (selenium, pandas, bs4, ray) - извлек признаки, уменьшил размерность; (pandas, sklearn, transformers/tokenaizer, PCA) - обнаружил бимодальные распределения в таргетах; (plotly) - разделил бимодальные распределения, построил отдельные модели; (catboost, xgboost, lgbm) - проанализировал ошибки/модель для интерпретации предсказаний. (feature importance, shap) Определение дистанции до автомобиля по фотографии 9е место в соревновании). (CV) python, pandas, opencv, pil, catboost, torchhub https://github.com/v010ch/car_dist_by_photo - метрика R2: 0.935899 (на привате, 9е место); - детектировал госномера с известными размерами и сами авто; (object detection, yolov5 и resnet101) - очистил от нерелевантных bounding box; (opencv, pandas) - обучил catboost поверх признаков (размеров найденных bounding box госномеров); (catboost) - исследовал доразметку данных (labelimg, roboflow) и дообучение модели yolov5. Анализ требуемых скиллов вакансий DS/ML с HH (дашборд) python, polars, plotly, dash https://github.com/v010ch/hh_vacancy_skills - собрал данные; (polars, hh api, requests, re) - предобработал, очистил данные, объединил синонимы; (polars) - разработал модель определения грейда по описанию; (nltk, scikit-learn, catboost) - разработал интерактивный дашборд с визуализацией трендов, word cloud, кластеризацией и встроил фильтры по грейдам. (dash, plotly, wordcloud, UMAP/t-SNE) Участвовал в ряде соревнований без призовых мест. Списком: reqsys: - предсказание следующего действия пользователя в мобильном приложении; - предсказание следующих покупок пользователя в категории apparel; - предсказание следующего понравившегося трека; time series: - прогнозирования средних цен и объемов потребления отдельных групп товаров - прогнозирование оттока пользователей; - хакатон pet-проектов ods.

Иностранные языки

  • Английский язык — технический
Фото, имя и контакты доступны только авторизованным пользователям
Похожие резюмеВсе 3 похожих резюме
Обновлено 5 августа
Превью фото соискателя
Intern data scientist/ml engineerз/п не указана
Обновлено 25 сентября
Превью фото соискателя
Data Scientist/ Business Analystз/п не указана
Последнее место работы (1 год и 2 мес.)Data ScienceСентябрь 2024 – работает сейчас
Обновлено 23 апреляПоследнее место работы (3 мес.)Ведущий программистЯнварь 2025 – апрель 2025
Работа в МосквеРезюмеIT, Интернет, связь, телекомАдминистрирование баз данных