Обязанности и достижения:
Организация и поддержка различных стендов (production, uat, hotfix): обеспечение полной работоспособности платформ, регулярное обновление и контроль изменений.
Поддержка работоспособности и конфигурирование более 90 микросервисов: обеспечение стабильности сервисов и взаимодействия, своевременное обновление и устранение возникающих проблем.
OTLP: настройка подключений и маршрутизации трафика данных для обеспечения корректного обмена между компонентами системы.
ClickHouse: написание SQL-запросов, работа с функциями и особенностями СУБД.
Работа с контейнерными и облачными технологиями: Docker, Openshift, Kubernetes - администрирование через терминал, редактирование Helm-чартов, составление и отладка docker-compose файлов, настройка сетевых взаимодействий между микросервисами.
TeamCity: создание и поддержка пайплайнов, настройка автоматических сборок и проектов.
Git: выполнение всего необходимого набора операций по работе с репозиториями и ветками кода.
Мониторинг и визуализация: Prometheus, Elasticsearch, Grafana - настройка экспортеров, создание и поддержка дашбордов и алертов, анализ метрик.
Zabbix: разработка шаблонов мониторинга, настройка алертов для своевременного выявления нештатных ситуаций.
S3, Minio: настройка бакетов, управление правами доступа и обеспечение сохранности данных.
MSSQL, PostgreSQL: написание SQL-запросов, активное использование функционала баз данных для решения бизнес-задач.
Confluence: регулярное наполнение и актуализация документации, поддержание базы знаний в актуальном состоянии.
Python: написание вспомогательных и автоматизационных скриптов, опыт объектно-ориентированного программирования, участие в разработке на Django.
Bash: написание скриптов для автоматизации рутинных задач и обслуживания серверов.
Ansible: создание новых плейбуков и ролей, оптимизация и отладка текущих автоматизаций.
Kafka: настройка подключений для обеспечения стабильного обмена сообщениями между компонентами.
Graylog (Windows/Linux): настройка инпутов, стримов, сайдкаров для централизованного логирования и анализа.
Sentry: настройка сервисов мониторинга ошибок для улучшения качества продуктов.
Vault, Consul: развертывание и поддержка сервисов управления секретами и сервис-дискавери.
Оперативное решение инцидентов, анализ и устранение проблем и аварий для поддержания высокой доступности и надежности систем.