Москва
Резюме № 55941239
Обновлено 10 октября
Превью фото соискателя

Data Scientist / ML-инженер

Был в этом месяце
150 000 ₽
Москва
Занятость
полная занятость
Гражданство
Россия
Контакты
Телефон

Почта
Будут доступны после открытия
Профессиональные навыки
  • Показать еще
Фото, имя и контакты доступны только авторизованным пользователям

Опыт работы 14 лет

    • Сентябрь 2023 – работает сейчас
    • 2 года и 3 месяца

    Data Scientist отдела технологий искусственного интеллекта Департамента науки Головного научно-технического центра информационной безопасности

    Группа компаний Астра, Москва
    Разработка программного обеспечения, Системная интеграция, автоматизации технологических и бизнес-процессов предприятия, ИТ-консалтинг

    Обязанности и достижения:

    O Стек/инструменты: Jira, Python, pandas, pytorch, transformers, CNN, LLM, sklearn, numpy, CV, NLP, Google Colab, scikit-learn, seaborn, matplotlib, LogisticRegression, Machine Learning, KNeighborsClassifier, DecisionTreeClassifier, RandomForestClassifier, LightGBM, CatBoost, SHAP, SQL, Docker, Fastapi/Flask, Confluence, MVC GPT o Мой функционал: - участие в развитии и дообучении действующих моделей, в том числе направленных на решение задач в области информационной безопасности - создание моделей машинного обучения и нейронных сетей, в том числе для совершенствования средств защиты информации; - сбор и анализ данных для обучения моделей, в том числе посредством написания запросов SQL; - работа с системами контроля версий (gitflick, gitlab); - проведение исследовательского анализа данных; - выработка архитектуры и принципов построения моделей нейронных сетей, в том числе сверточных и рекурентных (выбор способов обработки и преобразования данных подаваемых в модель, а также слоёв нейронной сети) - взаимодействие с иными структурными подразделениями по вопросам ML и AI - презентация и защита моделей - подготовка технической документации - внедрение и развертывание моделей - разработка RAG-системы на базе RuT5, обеспечивающей генерацию ответов с использованием контекста из корпоративного Confluence - работы с Langflow по создание и управление цепочками обработки данных и взаимодействия с LLM - работа с ОС Astra Linux - использование Hugging Face Transformers - работа с объемными, сложными текстовыми датасетами (более 3 млн. строк) o Достижения: - выполнил fine tuning LLM-модели (на базе RuT5) для генерации рекомендаций на русском языке по настройке специфических средств защиты информации (СЗИ) в соответствии с профилями стандартных СЗИ AppArmor, достигнув BLEU 45+ на тестовых данных - реализовал пайплайн предобработки данных из логов безопасности → предобработка и конкатенация данных → токенизация → обучение → инференс - внедрил модель в production-среду ОС Astra Linux, создал утилиту для использования рекомендательной модели через терминал
    • Октябрь 2022 – сентябрь 2025
    • 3 года

    Data Scientist

    ООО "Экосистема Альфа", Москва
    Интернет-компания (поисковики, платежные системы, соц. сети, информационно-познавательные и развлекательные ресурсы, продвижение сайтов и прочее)

    Обязанности и достижения:

    O Стек/инструменты: Python, Google Colab, pandas, scikit-learn, numpy, seaborn, matplotlib, LogisticRegression, KNeighborsClassifier, DecisionTreeClassifier, RandomForestClassifier, LightGBM, CatBoost, MS Excel o Мой функционал: - работа с библиотеками Python для анализа данных, создания моделей машинного обучения на основе медицинских датасетов - работа в Google Colab - выполнение исследовательского анализа данных, в том числе построение матриц корреляции, графиков важности признаков - предобработка данных, построение пайплайнов для подготовки данных к обучению моделей и подбора гиперпараметров - презентация и защита построенных моделей на митапах, объяснение принципов их работы и причин выбора тех или иных подходов к построению моделей o Достижения: - построены модели классификации (RandomForestClassifier) для предсказания медицинских исходов на дисбалансных датасетах (соотношение классов ~1:8), достигнута F1-score 0.89 - разработан пайплайн предобработки: обработка пропусков и аномалий, кодирование, feature engineering, подбор гиперпараметров (GridSearchCV, RandomSearchCV), обучение модели, анализ важности признаков, оценка (F1-score для несбалансированных данных)
    • Сентябрь 2022 – октябрь 2023
    • 1 год и 2 месяца

    Data Scientist (обучение)

    АНО ДПО «Образовательные технологии Яндекса», Москва
    Повышение квалификации, переквалификация

    Обязанности и достижения:

    Выполнено 13 ML-проектов: от EDA и классического ML до NLP, CV и временных рядов. Из них 4 проекта по аналитике данных, 6 проектов по классическому ML, 1 проект по обучению модели на временных рядах, 1 проект по NLP и 1 проект по разработке моделей Computer Vision. Проекты выполнены на стеке: Python, Jupyter Notebook, pandas, scikit-learn, numpy, seaborn, matplotlib, shap, LinearRegression, LogisticRegression, KNeighborsClassifier, DecisionTreeClassifier, SVC, DecisionTreeRegressor, RandomForestClassifier, LightGBM, CatBoost Другие используемые технологии: SQL, PySpark o Мой функционал: - работа с библиотеками Python для анализа данных, создания моделей машинного обучения и их интерпретации - создание структурированных запросов с помощью SQL - подготовка аналитических отчетов в Jupyter Notebook - выполнение исследовательского и статистического анализов данных, в том числе построение графиков boxplot, scatter, матриц корреляции, графиков важности признаков - проверка гипотез, проведение t-тестов, предобработка данных - создание моделей машинного обучения, в том числе использующих бустинг - построение пайплайнов для подготовки данных к обучению моделей и подбора гиперпараметров o Отдельные из выполненных проектов: - проект «Аналитика покупательской активности». Задача: разработать модель, предсказывающую снизится ли покупательская активность клиентов, проанализировать причины снижения покупательской активности - проект «HR-аналитика». Задача: разработать модель, предсказывающую уровень удовлетворенности сотрудника работой и уволится ли сотрудник - проект «Машинное обучение на текстах». Задача: разработать модель, выявляющую токсичные комментарии на сайте
    • Декабрь 2021 – август 2023
    • 1 год и 9 месяцев

    Заместитель начальника отдела развития законодательства в сфере здравоохранения Правового департамента

    Министерство здравоохранения Российской Федерации, Москва
    Государственные организации

    Обязанности и достижения:

    O Стек/инструменты: СЭД МЗ РФ, Битрикс24, ГИС «Электронный бюджет», MS Outlook, MS Word, MS Excel (СУММ; ЕСЛИ) o Мой функционал: - анализ действующего законодательства на предмет наличия барьеров для бизнеса и граждан и подготовка предложений по оптимизации клиентских путей - участие в согласительных и иных совещаниях - осуществление правовой и юридико-технической экспертизы проектов нормативных правовых актов, подготовка проектов нормативных правовых актов - подготовка аналитических справок, докладов и иных документов o Достижения: - организовано взаимодействие между структурными подразделениями Минздрава России, позволившее сформировать и утвердить Реестр процессов Минздрава России - с Минюстом России согласована редакция проекта федерального закона «О судебно-экспертной деятельности в Российской Федерации», учитывающая все принципиальные позиции Минздрава России
    • Август 2017 – октябрь 2021
    • 4 года и 3 месяца

    Главный специалист Управления по контролю качества пищевой продукции, поставляемой в учреждения социальной сферы

    Государственная инспекция города Москвы по качеству сельскохозяйственной продукции сырья и продовольствия, Москва
    Государственные организации

    Обязанности и достижения:

    O Стек/инструменты: МЭДО ПМ, ЕАИСТ 2.0, ЕГАС СИОПР, ЕГАС ОДОПМ, MS Outlook, MS Word, MS Excel (СУММ; ЕСЛИ; ПРОИЗВЕД; СРЗНАЧ; МИН; МАКС) o Мой функционал: - анализ деятельности исполнителей государственных контрактов на предмет целесообразности заключения/продления государственных контрактов - анализ и мониторинг федерального законодательства и нормативных правовых актов города Москвы - осуществление контроля за соблюдением требований государственных контрактов - обобщение и анализ поступающей информации, подготовка аналитических справок, докладов и иных документов - работа с базами данных ЕГАС СИОПР и ЕГАС ОДОПМ o Достижения: - выстроена работа с ФБУЗ «Центр гигиены и эпидемиологии в городе Москве», позволяющая ежедневно передавать на экспертизу от 80 образцов продукции с 14 производственно-логистических комплексов, расположенных по всей Москве в том числе в Новой Москве
    • Май 2015 – август 2017
    • 2 года и 4 месяца

    Ведущий специалист-эксперт территориального отдела в Северном административном округе города Москвы

    Управление Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека по городу Москве, Москва
    Государственные организации

    Обязанности и достижения:

    O Стек/инструменты: КАИС, ГИС ЕРП, MS Outlook, MS Word, MS Excel (СУММ; ЕСЛИ; ПРОИЗВЕД; СРЗНАЧ) o Мой функционал: - осуществление государственного контроля за исполнением требований законодательства в области защиты прав потребителей и санитарно-эпидемиологического благополучия - участие в судебных процессах, в том числе составление исков, отзывов - подготовка аналитических справок, докладов и иных документов o Достижения: - отсутствие проигранных судебных процессов по делам, связанным с защитой прав потребителей, а также по административным делам, рассмотрение которых отнесено к компетенции судей
    • Сентябрь 2011 – февраль 2015
    • 3 года и 6 месяцев

    Администратор

    Азия Кафе ООО «Альмадор», Москва
    Ресторан, общественное питание, фаст-фуд

    Обязанности и достижения:

    O Стек/инструменты: 1С Управление рестораном, 1С Бухгалтерия, MS Outlook, MS Word, MS Excel (СУММ; ЕСЛИ; ПРОИЗВЕД; СРЗНАЧ; МИН; МАКС) o Мой функционал: - организация работы кафе - подбор и обучение персонала - работа в 1С o Достижения: - заменен весь персонал кафе, что позволило поднять ежемесячную выручку на ~20%

Обо мне

Дополнительные сведения:

Data Scientist с коммерческим опытом разработки ML-моделей и нейронных сетей. Выполняю все этапы создания модели: сбор данных, EDA, построение пайплайнов, обучение, оценка, презентация, интеграция. Имею аналитический склад ума, ответственнен и быстро развиваю недостающие навыки. Умею работать в режиме мультизадачности. Готов изучать новые языки программирования. Готов работать по часовому поясу работодателя, в наличии имеется техника, подходящая для аналитики данных, решения задач классического ML. Машинное обучение, Python, Matplotlib, Scikit-learn, Machine Learning, Pipeline, Numpy, ML, Seaborn, Классическое машинное обучение, SQL, MS Excel, pandas, Atlassian Jira, Data Science, Google Colab, Jupyter Notebook, Исследовательский анализ данных, PyTorch, Plotly, Deep Learning, Big Data
Фото, имя и контакты доступны только авторизованным пользователям
Похожие резюмеВсе 4 похожих резюме
Обновлено 29 октября
Обновлено 7 июня 2023Последнее место работы Data ScientistМай 2023 – май 2023
Обновлено 23 октября 2024
no-avatar
Data Scientist / ML-Инженерз/п не указана
Обновлено 28 апреляПоследнее место работы (1 год)Data EngineerНоябрь 2024 – работает сейчас
Работа в МосквеРезюмеIT, Интернет, связь, телекомИнженер

Смотрите также резюме