Обязанности и достижения:
O Стек/инструменты: Jira, Python, pandas, pytorch, transformers, CNN, LLM, sklearn, numpy, CV, NLP, Google Colab, scikit-learn, seaborn, matplotlib, LogisticRegression, Machine Learning, KNeighborsClassifier, DecisionTreeClassifier, RandomForestClassifier, LightGBM, CatBoost, SHAP, SQL, Docker, Fastapi/Flask, Confluence, MVC GPT
o Мой функционал:
- участие в развитии и дообучении действующих моделей, в том числе направленных на решение задач в области информационной безопасности
- создание моделей машинного обучения и нейронных сетей, в том числе для совершенствования средств защиты информации;
- сбор и анализ данных для обучения моделей, в том числе посредством написания запросов SQL;
- работа с системами контроля версий (gitflick, gitlab);
- проведение исследовательского анализа данных;
- выработка архитектуры и принципов построения моделей нейронных сетей, в том числе сверточных и рекурентных (выбор способов обработки и преобразования данных подаваемых в модель, а также слоёв нейронной сети)
- взаимодействие с иными структурными подразделениями по вопросам ML и AI
- презентация и защита моделей
- подготовка технической документации
- внедрение и развертывание моделей
- разработка RAG-системы на базе RuT5, обеспечивающей генерацию ответов с использованием контекста из корпоративного Confluence
- работы с Langflow по создание и управление цепочками обработки данных и взаимодействия с LLM
- работа с ОС Astra Linux
- использование Hugging Face Transformers
- работа с объемными, сложными текстовыми датасетами (более 3 млн. строк)
o Достижения:
- выполнил fine tuning LLM-модели (на базе RuT5) для генерации рекомендаций на русском языке по настройке специфических средств защиты информации (СЗИ) в соответствии с профилями стандартных СЗИ AppArmor, достигнув BLEU 45+ на тестовых данных
- реализовал пайплайн предобработки данных из логов безопасности → предобработка и конкатенация данных → токенизация → обучение → инференс
- внедрил модель в production-среду ОС Astra Linux, создал утилиту для использования рекомендательной модели через терминал