Обязанности и достижения:
- Развернул и настроил "с нуля" DBT как слой трансформации, перенес функционал трансформации из AirFlow в DBT;
- В DBT настроил инкриментальную загрузку некоторых таблиц, логирование и тесты;
- Разработка парсеров, скраперов на Python (beautifulsoup, selenium, requests) очистка данных в рамках ETL
Используемые технологии:
Python 3, PyTest (для дагов AirFlow), Git, Gitlab, Docker;
Cloud Services: AirFlow, BigQuery, AWS Redshift, DBT.