Москва
Резюме № 56099795
Обновлено 27 ноября
no-avatar

ML-инженер / Data-scientist

Был в этом месяце
По договорённости
35 лет (родился 01 мая 1990)
Тулаготов к переезду: Москва
Условия занятости
Полная занятость
Стандартный график
В офисе/На объекте
Гражданство
Россия
Контакты
Телефон

Почта
Будут доступны после открытия
Профессиональные навыки
  • Показать еще
Фото, имя и контакты доступны только авторизованным пользователям

Опыт работы 15 лет и 4 месяца

    • Сентябрь 2010 – работает сейчас
    • 15 лет и 4 месяца

    Ведущий аналитик ИБ

    Ingate Group, Тула

    Обязанности и достижения:

    Карьерный рост от аналитика до руководства командой из 3 специалистов Текущие проекты: 1) Занимаюсь реализацией AI-агента для работы с документами, сотрудниками и заявками (единое окно обращений) | Python, FastAPI, OpenAI, Supabase, Telegram Bot API, n8n: - Пайплайн сбора и нормализации данных из PDF, DOCX, PPTX, HTML, Excel, Confluence, подготовка текст и метаданных в Supabase и векторного хранилища для поиска. - Формирование системы поиска по сотрудникам и их навыкам, документам и заявкам с генерацией ответов через LLM в Telegram. - Фокус на удобстве взаимодействия: короткие ответы, кнопки действий (“Открыть документ”, “Профиль сотрудника”, “Создать заявку”), реализация возможности автогенерации текста заявок или установка их вручную. - Ожидаемый результат: быстрый и удобный поиск информации по сотрудникам, документам и заявкам, сокращение времени на поиск, автоматизация выдачи ответов с проверкой прав доступа. Реализованные проекты: 1) Разработка и внедрение end-to-end ML пайплайна для прогнозирования увольнений - Реализовал полностью автоматизированный цикл: еженедельный сбор данных, feature engineering (включая фичи на основе NLP-анализа тональности), обучение и валидация моделей (XGBoost, CatBoost). - Настроил автоматическое обновление модели и выгрузку предсказаний в дашборд для HR. - Результат: Модель с ROC-AUC ~0.85 работает в продакшене, помогая выявлять сотрудников группы риска для превентивных мер. 2) Создание NLP-системы для анализа эмоционального состояния сотрудников - Построил пайплайн для транскрибации аудио (Whisper) и анализа текстовых данных с использованием кастомных моделей и GPT API для классификации эмоций. - Результаты анализа интегрированы в модель прогнозирования увольнений как ключевые признаки. - Результат: Система используется для мониторинга настроений. 3) Аналитическое исследование оттока клиентов - Провел комплексный статистический анализ исторических данных, выявив ключевые паттерны и факторы, влияющие на отток. - Построил детальную аналитическую модель для сегментации клиентов по уровню риска. - Результат: Подготовлен прототип системы и рекомендации для отдела маркетинга. Несмотря на отсутствие внедрения, работа заложила методологическую основу для дальнейшего анализа оттока. 4) Система диаризации и идентификации говорящих | Python, RNN, LSTM - Разработал модель для автоматической транскрибации аудиозаписей и идентификации говорящих в диалогах. - Результат: достигнута точность распознавания говорящих >70% на внутреннем датасете. 5) Разработка и запуск Telegram-бота для генерации контента | Python, SQL, Telegram Bot API, OpenAI GPT API - Реализовал end-to-end пайплайн: от приема пользовательских запросов через Telegram Bot API до генерации контента с помощью OpenAI GPT API и управления контекстом. - Настроил интеграцию с SQL-базой данных для хранения истории взаимодействий, обеспечения персистентности контекста и сохранения уникальных стилистических особенностей целевых авторов. - Результат: рабочий продукт (https://t.me/MimicGram_bot) успешно запущен в продакшен, стабильно обрабатывает пользовательские запросы и автоматизирует создание стилистически выверенного контента. Другие достижения (в сфере безопасности и расследований): - Руководство командой из 3 специалистов по безопасности: разработка стратегий мониторинга и расследований - Анализ истории действий пользователей и системных логов для расследования инцидентов - Выявление и документирование сложной схемы мошенничества с помощью анализа аномалий, что предотвратило потенциальные финансовые потери Участие в хакатонах 1) Ozon Хакатон 2025 | Разработка гибридной рекомендательной системы для E-commerce | Python, LightGBM, PyTorch, Dask - Реализовал end-to-end пайплайн обработки больших данных: сбор и очистка 1.6+ млрд событий пользовательского поведения, фильтрация 6+ млн товаров, feature engineering и оптимизация эмбеддингов через PCA (сокращение размерности с 512 до 150 компонент при сохранении 95% дисперсии) - Построил гибридную систему генерации кандидатов, сочетающую popularity-based подход (топ-2000 товаров), co-visitation анализ (2+ млн пар товаров) и ANN-поиск по векторным представлениям - Обучил LightGBM Ranker с инкрементальным обучением и GPU-ускорением, настроил батчинговую обработку данных через Dask для работы с датасетом объемом 65+ GB - Результат: NDCG@100 = 0.018 на лидерборде хакатона — успешно справился с задачей построения работоспособного пайплайна для обработки больших данных в условиях ограниченного времени и ограничений по мощностям. Другие проекты доступны на GitHub: https://github.com/Ankudar

Условия занятости

  • Подходящие условия занятости
Полная занятость
Стандартный график
В офисе/На объекте

Обо мне

Дополнительные сведения:

Больше 15 лет работаю с данными, последние два года активно развиваюсь в машинном обучении. Умею собирать решения от гипотез и feature engineering до обучения, продакшена и анализа результатов. Есть успешные проекты по NLP и прогнозированию, которые реально используются и приносят эффект. Хочу дальше развиваться в ML и делать решения, которые дают измеримую пользу бизнесу. Рассматриваю фуллтайм в формате удалёнки или гибрида. Открыт к интересным и сложным задачам. Навыки и технологии • Языки программирования: Python • ML & Фреймворки: Scikit-learn, PyTorch, TensorFlow, XGBoost, CatBoost, LightGBM • Data Engineering & Анализ: Pandas, NumPy, SQL, ETL, Airflow, n8n, Supabase, Dask, Polars • MLOps & Оркестрация: MLflow, Airflow, автоматизация ML-пайплайнов • Рекомендательные системы: Генерация кандидатов (popularity-based, co-visitation, ANN), ранжирование, матричная факторизация (ALS), оценка качества (NDCG, Precision/Recall) • Работа с большими данными: Обработка миллиардов событий, оптимизация памяти, батчинг, потоковая обработка • Векторные операции и поиск: Эмбеддинги товаров, PCA-оптимизация, семантический поиск • NLP & LLM: OpenAI Whisper, GPT API, Llama2, классификация тональности, транскрибация • Визуализация: Matplotlib, Seaborn, Plotly, построение дашбордов • Инструменты: Git, Jupyter Notebook • Методологии: Машинное обучение, Feature Engineering, MLOps
Фото, имя и контакты доступны только авторизованным пользователям
Похожие резюмеВсе 1 похожее резюме
Обновлено 19 ноября
no-avatar
ML-инженерз/п не указана
Последнее место работы (2 года и 4 мес.)Технический СпециалистАвгуст 2023 – работает сейчас
Работа в МосквеРезюмеIT, Интернет, связь, телекомАдминистрирование баз данныхИнженер



Общество с ограниченной ответственностью «СуперДжоб» Г.Москва, ул. Дмитровка М, дом 20 ИНН 7702319337 ОКВЭД 63.11.1 vip@superjob.ru +7(495)7907277 Программа ЭВМ SuperJob и Программные модули включены в Реестр российского программного обеспечения (ПО), реестровая запись № 9280 от 20.02.2021г. Программный интерфейс API SuperJob включен в Реестр российского программного обеспечения (ПО), реестровая запись № 11081 от 20.07.2021г.
© 2000–2025 SuperJob