Обязанности и достижения:
DevOps-инженер с опытом в автоматизации инфраструктуры, управлении высоконагруженными системами и оркестрации контейнеров.
Ключевые компетенции
- IaC и автоматизация: Ansible, Python, Bash, Go.
- Контейнеризация и оркестрация: Docker, Kubernetes (K8s).
- Мониторинг и логирование: Prometheus, Grafana, Alertmanager, Grafana Loki.
- Веб-серверы и прокси: Nginx.
- Базы данных: PostgreSQL.
- ОС и системное администрирование: Linux (Ubuntu, CentOS), настройка, мониторинг, обеспечение безопасности.
Оркестрация и контейнеризация (Kubernetes & Docker)
- Управлял полным жизненным циклом приложений в кластерах Kubernetes (K8s): развертывал, масштабировал и обновлял сервисы
- Контейнеризировал приложения с использованием Docker, создавая оптимизированные `multi-stage` Dockerfile для уменьшения размера образов и повышения безопасности.
- Обеспечивал стабильную работу и масштабируемость высоконагруженного REST API с глубокой интеграцией с PostgreSQL в контейнерной среде.
Автоматизация и системное администрирование (Ansible & Linux)
- Автоматизировал настройку и управление конфигурациями Linux-серверов (Ubuntu, CentOS) с помощью Ansible Playbooks, обеспечивая консистентность окружений.
- Разрабатывал скрипты на Python/Bash/Go для автоматизации рабочих процессов, включая резервное копирование, развертывание и мониторинг.
- Организовал стабильный обмен данными с промышленным оборудованием, реализовав надежную интеграцию между контроллерами и backend-сервисами.
Мониторинг и логирование (Observability)
- Настроил комплексную систему мониторинга на базе стека Prometheus + Grafana + Alertmanager для отслеживания системных метрик и производительности приложений.
- Создал интерактивные дашборды в Grafana для визуализации ключевых производственных показателей в реальном времени (температура, загрузка, ошибки станков).
- Настроил централизованный сбор и анализ логов с использованием Grafana Loki для агрегации логов из различных источников.
Достижения
- Сократил время реакции на производственные инциденты на 50% благодаря внедрению проактивного мониторинга и системы алертов.
- Автоматизировал более 80% рутинных задач по настройке серверов и развертыванию сервисов с помощью Ansible и скриптов.