Обязанности и достижения:
- Перевёл управление конфигурациями из статичных локальных файлов на централизованное API-управление - повысил гибкость, ускорил time-to-change и снизил вероятность человеческой ошибки, внедрил QA-процессы для инфраструктурных изменений. Время внедрения изменений сократилось с 4 часов до 5 минут и снизило риск инцидента из-за ошибки конфигурации до нуля.
- Автоматизировал управление списками доступов с использованием сервиса собственной разработки и RBAC - сократил операционные риски, обеспечил соответствие требованиям безопасности и ускорил процесс доступа c 1 недели до 15 минут, устранив человеческий фактор в IAM.
- Реализовал глобальную платформу CDN по России в странам СНГ для статического и динамического контента (Nginx, S3, DPDK): открыл 5 новых точкек присутствия, что дало снижение TTFB/TTLB на 40% для ключевых регионов, повысив качество клиентского опыта и улучшив пользовательские метрики.
- В рамках реализации указа Президента о технологическом суверенитете отказался от внешних систем защиты (DDoS, WAF) и развернул внуреннюю anti-DDoS платформу (BGP, TCP, Nginx, DPDK, C, Golang), обеспечив защиту от атак свыше 500Gbps без привлечения внешних провайдеров.
- Запустил платформу автоматизации DNS (Golang, Bind, PowerDNS) - снизил время изменения записей с 3 часов до 5 минут, исключив риск ошибки при ручных операциях.
- Руководил созданием и запуском VideoCDN (Golang, S3, Nginx) - построил с нуля систему доставки видеоконтента клиентам с упором на производительность и масштабируемость.- Успешно масштабировал кластеры внутреннего облака - увеличил ёмкость платформы и улучшил изоляцию по нагрузке, снизив частоту деградаций. Обеспечил 100% SLA и снижение латентности видеопотока до 40%.
- Построил систему автоматического управления SSL-сертификатами (ACME, Let's Encrypt, GlobalSign, Внутренний УЦ, ГОСТ/Минцифры) - выпуск, продление, ротация, отзыв. Обеспечил непрерывность работы сервисов и исключил ручные сбои, обеспечил 100% SLA TLS-сессий.
- Управлял инфраструктурой внутреннего облака - развил платформу балансировки, с 60 серверов обеспечил рост клиентского трафика и утилизацию свыше 800 железных серверов, 1,2m+ RPS, highload-сервисы принимающие и обслуживающие клиентские запросы, L7/L4 балансировка. Обеспечил 99,999% доступность и отказоустойчивость платформы.
- Проектировал и внедрял архитектурные решения на кросс-доменных проектах (свыше 300 команд) для обеспечения высокой доступности
- Снизил MTTR и обеспечил рост SLO по внутренним платформам
- Развил систему Observability, алертинга и диагностики проблем (Prometheus, Grafana, Opszone, Alertmanager), снизив время реакции на инциденты до 3 минут.
- Построение процессов CI/CD, инфраструктура как код (Ansible)
- Руководил командой из 16 инженеров (DevOps, SRE, QA, Backend), применил Performance Review и Agile-подходы, увеличив скорость релизов на 50% и средний TTM после подготовки релиза - 5 минут.
- Работа с Kubernetes, S3, Nginx, Ceph, DPVS/DPDK
- Планирование работы юнита, постановка целей командам на неделю, месяц, полгода, год и контроль следования им