Дополнительные сведения:
Для меня аналитика данных это базовый инструмент для понимания закономерностей и принятия эффективных решений.
Систематизировал и обрабатывал комплексный набор потоковых и исторических данных, оптимизируя цикл от выгрузки до визуализации. Свой аналитический процесс строил на основе декомпозиции и преобразования информации в реляционные структуры для извлечения статистики, выявления устойчивых закономерностей и формирования обоснованных гипотез.
Стек практических и теоретических навыков:
- Аналитика и статистика
Законченный цикл статистического анализа от проверки распределений и нормализации данных (Box–Cox, Yeo–Johnson и др.) до выбора подходящих тестов (t-тест, u-тест, ANOVA и др.) и интерпретации результатов с учётом доверительных интервалов.
Понимание принципов A/B тестирования и интерпретации результатов гипотез при заданных метриках.
- E-commerce и unit метрики
Есть понимание концептуальной системы цифровых и товарных метрик, их синтеза, связях между собой и бизнесом: от базовых финансовых до продуктовых и маркетинговых. Понимание специфики контекста маркетплейсов (Ozon/WB).
Представление о том, как на этой базе выстраивать KPI-модели.
- SQL
Работал с SQLite, PostgreSQL, знаком с MS SQL.
Составление запросов с JOIN, подзапросы, оконные функции, CTE. Опыт создания структуры БД (определение ключей, типов данных), наполнения, обновления и создания таблиц, подключения к python через SQLAlchemy.
- Python
Анализ данных в Jupyter Notebook (pandas, numpy, scipy, statsmodels, seaborn) и ETL-скрипты.
Понимание логики DataFrame, этапов обработки и визуализации.
- Excel и моделирование данных
Формирование реляционных структур на базе Excel для анализа временных рядов и выявления закономерностей. Использование Power Query для ETL-процессов (обработка данных из API и скриптов), динамических массивов, формул (LET, FILTER, INDEX, MATCH, VLOOKUP) и VBA для автоматизации вычислений.
- Визуализация и представление данных (Power BI)
Построение распределений, гистограмм, scatter plot, boxplot и CDF. Использование базовых DAX-запросов и интеграция данных из разных источников.