Москва
Резюме № 53544184
Обновлено 31 января 2023
Превью фото соискателя

Data Scientist

Был больше месяца назад
200 001 ₽
27 лет (родился 20 октября 1998)
Москваудаленная работаготов к переезду
Условия занятости
Полная занятость
Стандартный график
Удалённая работа
Гражданство
Россия
Контакты
Телефон

Почта
Будут доступны после открытия
Профессиональные навыки
  • Показать еще
Фото, имя и контакты доступны только авторизованным пользователям

Опыт работы 5 лет и 2 месяца

    • Ноябрь 2020 – работает сейчас
    • 5 лет и 2 месяца

    Специалист по анализу данных

    Университет Национальной технологической инициативы 2035

    Обязанности и достижения:

    - Сбор и анализ данных - Предобработка данных - Работа с базами данных - Принимал участие в создании аналитической платформы для объективной оценки уровня работы с молодежью в регионах - Проектировал и обучал модели, как классического машинного обучения, так и глубокого. В том числе модели применяемые к аудио: для автоматической транскрибации записей на русском языке, для определения временных промежутков хезитаций в речи, анализа эмоциональности аудио и видео; к тексту: для автоматического извлечения названий инструментов из текстов вакансий, анализа тональности, токсичности, эмоциональности; к табличным данным: для определения стоимости скличет и дальнейших рекомендаций возможных траекторий профессионального развития; к временным рядам: для кластеризации инструментов разработчика с целью определения их этапов развития, какие из инструментов будут набирать популярность, какие прошли пик и скоро перестанут быть востребованными; Кроме того принимал активное участие в реализации сервиса с использованием Flask, Celery, RabbitMQ для анализа качества устной речи.

Условия занятости

  • Подходящие условия занятости
Полная занятость
Стандартный график
Удалённая работа

Обо мне

Дополнительные сведения:

Выполнял проекты по машинному обучению, клиентской аналитике, нейронным сетям и сбору информации. Работал с фраймворком распределений обработки Spark, также реализовывал web-интерфейсы при помощи Flask. Во время учебы в бакалавриата написал дипломную работу по теме «Ответы на вопросы по изображениям с использованием рассуждений». Ссылка на описание и текст: https://www.hse.ru/edu/vkr/366243370 Кроме того, проходил летнюю практику после каждого курса университета: На первом курсе по теме “Разработка система сбора данных на основе Scrapy”, На втором “Изучение основных криптографических протоколов и связанной с ними теории чисел”, На третьем “Сбор и анализ данных о поступающих в ВУЗы России”; В рамках курса «Анализ данных в бизнесе» в компании SAS выполнял командный программный проект «Оптимизация списка клиентов на коммуникацию». Цель проекта заключалась в поиске группы людей с которыми необходимо связаться одним из выбранных средств для максимизации отклика в рамках заданого бюджета и цен на коммуникацию. По исторической выборке, используя дерево решений, строились прогнозы отклика клиентов на коммуникацию по SMS и e-mail. Исходя из полученных вероятностей отклика, цен и бюджета, выбирались оптимальные группы людей для связи каждым из предложенных способов. Выполнял программный проект в компании OpenTRM по теме «Применение современных подходов к извлечению информации из документов». В рамках которого, был реализован Web-интерфейс для ручной разметки документов. Вручную была получена размеченная выборка из порядка 1000 документов, в каждом из которых выделялись такие поля, как название фирмы, сумма, кто заключил договор. Также полученная выборка при помощи замены переменных искусственно расширялась до 50000 документов. Имея историческую выборку, была обучена символьная seq2seq модель. По итогам работы удалось добиться точности 85% Уже больше года работаю в НТИ Университет 2035 на позиции специалиста по анализу данных. Занимался аналитикой, сбором, обработкой данных и построением моделей для задач из разных областей. Имею опыт работы с изображениями, видео, аудио, текстами и табличными данными. На данный момент обучаюсь на 2 курсе магистратуры НИУ ВШЭ «Финансовые технологии и анализ данных». На первом курсе написал курсовую работу по теме «RGB-D segmentation using Capsule networks», в которой исследовал возможности новой капсульной архитектуры нейронных сетей. Капсульные сети уже выигрывают у сверточных на простых задачах, таких как MNIST, и в теории могут прийти им на смену. Сейчас занимаюсь написанием диплома по теме «Предсказание смены тренда в финансовых временных рядах» Хотелось бы найти работу в IT-компании. Python, C++, SQL, Pandas, PyTorch, Keras, SciKit-Learn, PySpark, NLTK, Анализ данных, Data Mining, Linux, Математическая статистика, CatBoost, XGBoost, Machine Learning, Deep Learning, NumPy, TesnorFlow, ScraPy, Анализ временных рядов, Git, Flask, Численные методы, Celery, RabbitMQ, Cython, FastAPI, Neo4j, Plotly

Иностранные языки

  • Английский язык — cвободное владение
Фото, имя и контакты доступны только авторизованным пользователям
Работа в МосквеРезюмеIT, Интернет, связь, телекомАналитикаData Scientist

Смотрите также резюме




Общество с ограниченной ответственностью «СуперДжоб» Г.Москва, ул. Дмитровка М, дом 20 ИНН 7702319337 ОКВЭД 63.11.1 vip@superjob.ru +7(495)7907277 Программа ЭВМ SuperJob и Программные модули включены в Реестр российского программного обеспечения (ПО), реестровая запись № 9280 от 20.02.2021г. Программный интерфейс API SuperJob включен в Реестр российского программного обеспечения (ПО), реестровая запись № 11081 от 20.07.2021г.
© 2000–2025 SuperJob