Обязанности и достижения:
В рамках программы Яндекс.Практикума "Аналитик данных" выполнены следующие проекты:
1. Предобработка данных. Исследование надёжности заёмщиков банка, построение модели кредитного скоринга банка.
2. Исследовательский анализ данных. Исследование объявлений о продаже квартир. Определение ключевых параметров для отслеживания системой аномалий и мошеннической деятельности.
3. Статистический анализ данных. Определение перспективного тарифа для телеком-компании. • Анализ поведения клиентов. • Проверка статистических гипотез о равенстве средних.
4. Сборный проект. Изучение рынка компьютерных игр на основе данных о продажах за 30 лет. Анализ закономерностей определяющих коммерческую успешность игр.
5. Исследование данных авиакомпании. • Выгрузка и подготовка данных с помощью SQL. • Проверка гипотез. • Определение интенсивности использования авиапарка.
6. Анализ бизнес-показателей. Оптимизация маркетинговых затрат. • Определение сценария использования продукта (сайта); • Расчет бизнес-показателей: выручка, средний чек, LTV, CAC, Retention rate. • Определение срока окупаемости затрат на клиента, ROI (ROMI).
7. A/B-тест, приоритизация гипотез. • Приоритизация с помощью алгоритмов ICE, RICE. • Анализ А/B теста, проверка гипотез • Непараметрический тест Уилкоксона-Манна-Уитни
8. Анализ и подготовка данных для презентации. Рынок заведений общественного питания Москвы • Анализ состава сетевых и несетевых структур по типам предприятий, местоположению, количеству посадочных мест.
9. Анализ пользовательского поведения в мобильном приложении • Оценка результатов A/A/B-эксперимента по изменению шрифтов в приложении. Применяемый стек технологий: Python, Pandas, Matplotlib, Seaborn, Plotly, PyMystem3 (лемматизация), категоризация данных, NumPy, SciPy, Когортный анализ, SQL, A/B тестирование, описательная статистика, проверка статистических гипотез, продуктовые метрики, событийная аналитика. Проекты доступны для просмотра по ссылке
Все работы проходят обязательную верификацию код-ревьюверами и должны быть приняты в зачет по правилам обучения.
Навыки, полученные в процессе обучения:
• Python (Pandas) и SQL на базовом уровне: умение использовать их для извлечения данных и произведения вычислений над ними.
• Визуализация данных с помощью сторонних библиотек Seaborn, Matplotlib, Plotly.
• Знание основ статистики и теории вероятности, умение работать с гипотезами.
• Понимание потребностей бизнеса в части аналитики.
• Применение А/В тестов в анализе данных.
• Сбор и обработка данных из разных источников, применение SQL запросов и Web Mining.
• Регулярные выражения.
• Использование методов web-аналитики, событийной аналитики. • Автоматизации процессов сбора и анализа данных.
• Построение пайплайнов и дашбордов, основы работы в Tableau.