Обязанности и достижения:
Проект "Поисковик по изображениям": Создал поисковик по изображениям. Задачу решал следующим образом. Получил эмбеддинги через ResNet50 и Bert на TensorFlow. Эмбеддинги передал в нейросеть на Keras. C помощью scikeras подобрал гиперпараметры. Нейросеть решает задачу регрессии на отрезке. Выдается наиболее релевантное изображение. Модель регрессии на отрезке сравнил с моделью LightGBM. Чтобы перейти к задаче ранжирования или рекомендаций, нужно заменить loss и метрику.
Проект "Нейросеть на PyTorch для определения температуры звезды": Написал модель на PyTorch, которая предсказывает температуру звезд. Нейросеть внедрил в пайплайн sklearn. Перед созданием нейросети очистил данные и отобрал лучшие признаки.
Проект "Нейросеть на Keras для определения возраста": Разработал нейросеть на Keras для определения возраста. Решал задачу так: изучил данные, создал загрузчик изображений с аугментациями, модифицировал голову предобученной нейросети под задачу.
Проект "Трансформер на PyTorch для расстановки пробелов": Решил задачу Авито по повышению качества поиска. Требовалось создать модель, которая расставит пробелы в запросах со скленными словами. Действовал так. Собрал корпус текстов из открытых источников. Склеил тексты и создал таргет для обучения. Далее спроектировал и обучил трансформер. В конце протестировал модель на данных Авито и подтвердил её адекватность.
Проект "Предсказание стоимости жилья с помощью PySpark": Используя PySpark, предобработал данные о жилье в Калифорнии. Затем создал pipeline линейной регрессии. И предсказал медианную стоимость жилья в районе.
Проект "Бот для озвучивания текста на PyTorch и coqui TTS": Руководил командой. Создали и презентовали сервис по озвучиванию текста в Telegram.
Проект "Анализ данных c помощью PostgreSQL": Проанализировал данные StackOverflow с помощью продвинутого SQL. В запросах использовал оконные функции, CTE, подзапросы.
Буду рад рассказать об остальных проектах!