Дополнительные сведения:
Больше 15 лет работаю с данными, последние два года активно развиваюсь в машинном обучении. Умею собирать решения от гипотез и feature engineering до обучения, продакшена и анализа результатов. Есть успешные проекты по NLP и прогнозированию, которые реально используются и приносят эффект.
Хочу дальше развиваться в ML и делать решения, которые дают измеримую пользу бизнесу. Рассматриваю фуллтайм в формате удалёнки или гибрида. Открыт к интересным и сложным задачам.
Навыки и технологии
• Языки программирования: Python
• ML & Фреймворки: Scikit-learn, PyTorch, TensorFlow, XGBoost, CatBoost, LightGBM
• Data Engineering & Анализ: Pandas, NumPy, SQL, ETL, Airflow, n8n, Supabase, Dask, Polars
• MLOps & Оркестрация: MLflow, Airflow, автоматизация ML-пайплайнов
• Рекомендательные системы: Генерация кандидатов (popularity-based, co-visitation, ANN), ранжирование, матричная факторизация (ALS), оценка качества (NDCG, Precision/Recall)
• Работа с большими данными: Обработка миллиардов событий, оптимизация памяти, батчинг, потоковая обработка
• Векторные операции и поиск: Эмбеддинги товаров, PCA-оптимизация, семантический поиск
• NLP & LLM: OpenAI Whisper, GPT API, Llama2, классификация тональности, транскрибация
• Визуализация: Matplotlib, Seaborn, Plotly, построение дашбордов
• Инструменты: Git, Jupyter Notebook
• Методологии: Машинное обучение, Feature Engineering, MLOps