Москва
Резюме № 56028926
Обновлено в 16:32
no-avatar

AI / ML инженер / Архитектор LLM-систем / RAG / Multi-Agent Frameworks

Был сегодня в 16:32
По договорённости
Соискатель скрыл дату рождения
Москваудаленная работа
Занятость
полная занятость
Гражданство
Россия
Контакты
Телефон

Почта
Будут доступны после открытия
Профессиональные навыки
  • Показать еще
Фото, имя и контакты доступны только авторизованным пользователям

Опыт работы 1 год и 7 месяцев

    • Май 2024 – работает сейчас
    • 1 год и 7 месяцев

    AI инженер

    freelance, Москва

    Обязанности и достижения:

    Работал над созданием и интеграцией прикладных LLM-решений для клиентов, а также проводил собственные исследования и прототипирование новых AI-подходов. Клиентские задачи - Разработка кастомных AI-ассистентов (чат-боты, бренд-аватары, корпоративные помощники). - Создание RAG-систем для поиска по документам, инструкциям и базе знаний. - Интеграция LLM через API (OpenRouter, OpenAI-совместимые модели). - Встраивание в рабочие процессы Telegram-ботов, CRM-и интерфейсов клиентов. - Настройка векторных баз (Qdrant, FAISS) и пайплайнов ingestion. - Создание мультиагентных сценариев: роутеры, мемори-слои, инструменты, fallback-логика. R&D и эксперименты - Тестирование и сравнение современных LLM-моделей и фреймворков (LangChain, LangGraph, Pydantic AI). - Построение собственных прототипов RAG-архитектур, включая re-ranked и hybrid RAG. - Исследование качества retrieval, chunking, reranking, memory-инъекций. - Разработка mini-систем и утилит для анализа, экспериментов и быстрого прототипирования. - Эксперименты с мультиагентными подходами, поведением моделей, маршрутизацией и self-check. Создал десятки рабочих прототипов и готовых решений, которые использовались клиентами в реальной работе. На практике совмещал инженерный подход, продуктовое мышление и исследовательский интерес — быстро проверял идеи, превращал их в рабочие инструменты и улучшал архитектуру на основе реальных тестов. Моя когнитивная архитектура носит полимодальный характер и функционирует не линейно, а распределённо. Она ближе к концепции multi-tenant cognitive graph, чем к классической специализации. Я не фиксируюсь на одном домене — вместо этого я строю взаимосвязанные контуры знаний, которые постоянно резонируют друг с другом и формируют устойчивую системную модель. По этой причине моя профессиональная адаптация не происходит через постепенное накопление навыков, а через структурное перенастроение внутренней модели знаний. Я вхожу в новую область как в незакрытый граф: выявляю узловые вершины, отделяю шум от сигналов, обнаруживаю уязвимые места архитектуры и собираю рабочий контур, в котором все элементы взаимно усиливают друг друга. В отличие от специалистов с тоннельной специализацией, моя нейроадаптация работает в режиме параллельной демультиплексированной обработки: я удерживаю одновременно несколько уровней абстракции — данные → методы → архитектура → продукт → поведение пользователя → экономическая целесообразность. Это позволяет проектировать AI-системы не как набор инструментов, а как глобально согласованный механизм, где каждый компонент — модель, RAG-цепочка, векторная память, рерэнкер, агент, API-прослойка — работает в условиях кроссмодальности и функциональной взаимозависимости. По сути, моя профессиональная сила — это когнитивная распределённость. Я не погружаюсь в одну тему до потери масштаба — я выстраиваю между темами устойчивые мосты, благодаря чему создаю архитектуры, которые не просто работают, а обладают организованной сложностью — устойчивой, масштабируемой и легко адаптирующейся под изменения стека технологий. Такой подход делает меня эффективным не в «одной узкой задаче», а в построении целостных AI-инфраструктур, где ключевым является не глубина в одном направлении, а способность увидеть всё пространство вариантов и собрать из него оптимальную траекторию.

Обо мне

Дополнительные сведения:

AI / ML инженер | Архитектор LLM-систем | RAG / Multi-Agent Frameworks ПРОФИЛЬ Архитектор и разработчик интеллектуальных систем на стыке машинного обучения и диалоговых технологий. КЛЮЧЕВАЯ КОМПЕТЕНЦИЯ LLM и NLP (LangChain / Hugging Face / Qwen / Mistral / DeepSeek / TinyLlama. Function Calling, Toolformer, структурированный вывод, маршрутизация памяти.) RAG-системы (FAISS / Qdrant / Chroma / Deep Lake. Семантический поиск, ранжирование, фильтры релевантности, генерация с цитированием.) Мультиагентные архитектуры (Проектирование ансамблей агентов с консенсус-логикой, self-debug ядром и адаптивным распределением ролей.) Fine-Tuning / LoRA (Разработка Low-Rank Adaptation-пайплайнов (PEFT / Hugging Face) для адаптации LLM и визуальных моделей под домен и стиль общения.) MLOps и инфраструктура (FastAPI, Streamlit, Docker, MLflow, Weights & Biases, Render, GitHub CI, Airflow, vLLM, ONNX, TensorRT, Prometheus + Grafana.) Безопасность и устойчивость LLM (Защита от prompt injection, adversarial атак и data-poisoning; проектирование фильтров и валидации входных данных.) Интеграции и деплой (REST API, Make / n8n, CI/CD-конвейеры, облачные окружения, логирование и мониторинг.) ОПЫТ С ПРОЕКТАМИ - Retrieval-QA система Локальная платформа вопросов-ответов на базе RAG с загрузкой документов, семантическим разбиением текста, контекстным поиском и генерацией с цитатами. - Мультиагентный фреймворк рассуждений Создание системы агентов с памятью, самодиагностикой и динамическим распределением ролей для диалогов и решения задач. - Пайплайн дообучения (LoRA) Модульная система дообучения LLM и генеративных моделей под конкретные домены и стили (PEFT / LoRA). - Диалоговые ассистенты (продакшн) Проектирование и запуск ассистентов с адаптивным поведением, проверкой данных и интеграцией через API. - Retrieval + Routing-платформа Многостратегийный retrieval (map-reduce, refine), постоянное состояние памяти и структурное логирование JSONL. ОБУЧЕНИЕ И СЕРТИФИКАЦИИ - ML System Design (2025) — архитектура ML-систем, наблюдаемость, масштабирование. - LangChain & Vector Databases in Production / Deep Lake Foundational Model Certification (in progress). ТЕХНОЛОГИИ Python | LangChain | Hugging Face | FAISS | Qdrant | Deep Lake | FastAPI | Streamlit | Docker | MLflow | Render | GitHub | TensorRT | Make/n8n | Prometheus / Grafana | Pandas | PyTorch

Иностранные языки

  • Английский язык — технический
Фото, имя и контакты доступны только авторизованным пользователям
Похожие резюмеВсе 495 похожих резюме
Обновлено 7 ноября
Обновлено 19 октябряПоследнее место работы (5 мес.)Главный архитекторМай 2013 – октябрь 2013
Обновлено 22 сентябряПоследнее место работы (5 мес.)Архитектор-проектировщикМарт 2025 – август 2025
Обновлено 31 октября
Обновлено 17 августаПоследнее место работы (1 год)Главный специалистИюнь 2017 – июнь 2018
Обновлено 21 июня
Обновлено 5 июня
no-avatar
Архитекторз/п не указана
Последнее место работы (1 год и 3 мес.)АрхитекторДекабрь 2023 – март 2025
Обновлено 30 июня
Обновлено 23 июляПоследнее место работы (11 мес.)Главный специалист / архитектор, ГАПИюль 2024 – июнь 2025
Работа в МосквеРезюмеСтроительство, проектирование, недвижимостьАрхитектураИнженер-архитектор

Смотрите также резюме