Москва
Резюме № 56028926
Обновлено в 0:52
no-avatar

AI Engineer / LLM Systems Architect / RAG and Multi-Agent Frameworks

Был сегодня в 0:53
По договорённости
Соискатель скрыл дату рождения
Москваудаленная работа
Условия занятости
Полная занятость
Стандартный график
Удалённая работа
Гражданство
Россия
Контакты
Телефон

Почта
Будут доступны после открытия
Профессиональные навыки
  • Показать еще
Фото, имя и контакты доступны только авторизованным пользователям

Опыт работы 1 год и 8 месяцев

    • Май 2024 – работает сейчас
    • 1 год и 8 месяцев

    AI инженер

    freelance, Москва

    Обязанности и достижения:

    Проектировал и внедрял прикладные LLM-решения для клиентов, а также занимался R&D и прототипированием новых архитектурных подходов в области AI-систем. Разработал собственную инженерную платформу для проектирования, тестирования и оценки LLM- и RAG-систем; примеры интерфейсов и инструментов — https://drive.google.com/drive/folders/1wOEzp6U-AlxNwr2Ig9ICXALfpMRda4wb Клиентские проекты - Разработка кастомных AI-ассистентов: чат-боты, бренд-аватары, корпоративные помощники. - Проектирование и внедрение RAG-систем для поиска по документам, инструкциям и базам знаний. - Интеграция LLM через API (OpenRouter, OpenAI-совместимые модели). - Встраивание AI-решений в бизнес-процессы: Telegram-боты, CRM, пользовательские интерфейсы. - Настройка векторных баз данных (Qdrant, FAISS) и ingestion-пайплайнов. - Проектирование мультиагентных сценариев: routing, memory layers, tools, fallback-логика. - R&D и архитектурные эксперименты - Тестирование и сравнение современных LLM-моделей и фреймворков (LangChain, LangGraph, Pydantic AI). - Построение собственных RAG-архитектур, включая hybrid RAG и re-ranking стратегии. - Исследование retrieval-качества, chunking-стратегий, reranking и memory-инъекций. - Эксперименты с мультиагентными подходами, маршрутизацией запросов и self-check механизмами. Результат Создал десятки рабочих прототипов и готовых решений, которые использовались клиентами в реальной работе. В работе совмещаю инженерный подход, продуктовое мышление и исследовательский цикл: быстро проверяю гипотезы, довожу их до работающих инструментов и улучшаю архитектуру на основе реальных тестов и метрик. Подход Работаю на нескольких уровнях абстракции одновременно — данные → методы → архитектура → продукт → пользователь → экономика. Это позволяет проектировать LLM- и RAG-системы как целостные и масштабируемые AI-инфраструктуры, а не как набор разрозненных компонентов, с учётом устойчивости, изменений стека и требований production-среды.

Условия занятости

  • Подходящие условия занятости
Полная занятость
Стандартный график
Удалённая работа

Обо мне

Дополнительные сведения:

AI Engineer / Architect of LLM-based Systems Архитектор и разработчик прикладных AI-систем на базе LLM, RAG и мультиагентных подходов. Проектирую и внедряю retrieval-based решения, агентные сценарии и LLM-системы с памятью, контекстом и механизмами защиты. Фокус — перевод AI-решений из стадии прототипа в production: масштабируемые, наблюдаемые и устойчивые к сбоям и атакам системы. КЛЮЧЕВЫЕ КОМПЕТЕНЦИИ LLM & Retrieval-based Systems Проектирование и внедрение RAG-систем, retrieval-стратегий, memory-слоёв и генерации с опорой на источники (LangChain, Hugging Face, Qwen, ChatGPT, DeepSeek, FAISS, Qdrant, Deep Lake). Мультиагентные архитектуры - Разработка ансамблей агентов с маршрутизацией, памятью, self-check и распределением ролей. - Адаптация и дообучение моделей - Практический опыт с LoRA и дообучением LLM, подготовкой датасетов, evaluation-пайплайнами и оркестрацией обучения. - Инфраструктура и продакшн - Развёртывание AI-сервисов и API, логирование, мониторинг и CI/CD (FastAPI, Docker, Streamlit, MLflow, GitHub CI, Airflow, Prometheus/Grafana). Безопасность и устойчивость LLM - Защита от prompt injection и некорректных входных данных, проектирование guardrails и validation-слоёв. ПРОЕКТНЫЙ ОПЫТ (выборочно) Retrieval-QA платформа — локальная RAG-система с ingestion документов, семантическим поиском и генерацией с цитированием. Мультиагентный фреймворк — агенты с памятью, самопроверкой и динамическим распределением ролей. LoRA-пайплайн — модульная система адаптации LLM под домены и стили общения. Диалоговые ассистенты (production) — ассистенты с адаптивным поведением и API-интеграциями. Retrieval + Routing платформа — многостратегийный retrieval, состояние памяти и структурное логирование. ТЕХНОЛОГИИ Python, LangChain, Hugging Face, FAISS, Qdrant, Deep Lake, FastAPI, Streamlit, Docker, MLflow, Airflow, Prometheus/Grafana, PostgreSQL, PyTorch. ЯЗЫКИ Русский — родной Английский — (техническая коммуникация) ИНТЕРЕСЫ Архитектура надёжных LLM-систем, мультиагентные подходы, self-check и устойчивость retrieval-механизмов.

Иностранные языки

  • Английский язык — технический
Фото, имя и контакты доступны только авторизованным пользователям
Похожие резюмеВсе 6 похожих резюме
Обновлено 30 октября
no-avatar
ML/AI Engineer100 000 ₽
Последнее место работы (10 мес.)Ml engineerФевраль 2025 – работает сейчас
Обновлено 20 июля
Превью фото соискателя
AI/ML Engineerз/п не указана
Обновлено 29 июля
no-avatar
AI/ML Engineerз/п не указана
Обновлено 24 сентября
Превью фото соискателя
System engineerз/п не указана
Последнее место работы System engineerИюль 2025 – июль 2025
Обновлено 12 августа 2016
no-avatar
System Engineerз/п не указана
Обновлено 8 января 2023
Работа в МосквеРезюмеIT, Интернет, связь, телекомИнжинирингИнженер-архитектор

Смотрите также резюме




Общество с ограниченной ответственностью «СуперДжоб» Г.Москва, ул. Дмитровка М, дом 20 ИНН 7702319337 ОКВЭД 63.11.1 vip@superjob.ru +7(495)7907277 Программа ЭВМ SuperJob и Программные модули включены в Реестр российского программного обеспечения (ПО), реестровая запись № 9280 от 20.02.2021г. Программный интерфейс API SuperJob включен в Реестр российского программного обеспечения (ПО), реестровая запись № 11081 от 20.07.2021г.
© 2000–2025 SuperJob