Обязанности и достижения:
Python (библиотеки Pandas, matplotlib, numpy, seaborn, plotly), Jupiter Notebook, PostgreSQL (подзапросы, оконные функции), теория вероятности, математическая статистика, продуктовые метрики, А/В тестирование.
1. Музыка больших городов.
Провела предобработку и анализ данных с помощью Python и pandas. На реальных данных Яндекс Музыки проверила гипотезы и сравнила поведение пользователей двух столиц: Оптимизировала работу службы поддержки, сформулировала рекомендации, на основе которых можно проверять гипотезы.
2. Исследование надежности заемщиков.
Разобралась, влияет ли семейное положение, количество детей клиента и уровень дохода на факт погашения кредита в срок. Также выявила наиболее рискованную категорию кредита.
3. Исследовательский анализ данных. Исследование объявлений о продаже квартир.
Определила рыночную стоимость объектов недвижимости. Визуализировала параметры с помощью библиотеки Matplotlib, используя гистограммы, боксплоты, диаграммы, графики. Провела исследовательский анализ данных, который помог установить параметры, влияющие на цену объектов.
4. Статистический анализ данных. Анализ сервиса аренды самокатов.
Предобработала, проанализировала, визуализировала данные (с помощью библиотек Pandas, Matplotlib, Numpy, Math), которые могут помочь бизнесу вырасти. Используя объединение таблиц, а также сводные таблицы получила совокупные данные, на основании которых проверила статистическую гипотезу о ра-венстве средних двух совокупностей (с помощью библиотеки Scipy и метода ttest_ind), гипотезу о равен-стве среднего генеральной совокупности некоторому значению (метод ttest_1samp) по использованию самокатов.
5. Анализ работы интернет-магазина.
Составила портреты пользователей в разных регионах мира. Используя различные виды графиков, ги-стограммы, сводные таблицы, группировки, мне удалось выявить закономерности, которые определяют успешность компьютерных игр (выявила лидеров по платформам, по жанрам, по годам продажи). Изучила влияние оценки пользователей и экспертов на продажи. Выявили самые популярные платформы и жанры по регионам. Это позволило сделать ставку на потенциально популярный продукт и спланировать рекламные кампании.
6. SQL.
Проанализировала данные о фондах и инвестициях и написала запросы к базе, обработала и выгрузила данные, написала SQL-запросы разных уровней сложности (подзапросы, оконные функции).
7. Анализ бизнес-показателей.
Выяснила откуда приходят пользователи и какими устройствами они пользуются, сколько стоит привле-чение пользователей из различных рекламных каналов, сколько денег приносит каждый клиент, когда расходы на привлечение клиента окупаются, какие факторы мешают привлечению клиентов.
Для этого: построила маркетинговые и продуктовые воронки в Python, рассчитала экономику одного по-купателя, провела анализ бизнес-показателей, рассчитала маркетинговые и продуктовые метрики (LTV, CAC, retention rate, DAU, WAU, MAU и другие), использовала когортный анализ и функции расчёта метрик, визуализировала результаты когортного анализа, сделала вывод о причинах убытков на основе подсчитанных показателей и построенных графиков, Нашла метрики, улучшением которых нужно заниматься.
8. Принятие решений в бизнесе.
Сгенерировала гипотезы, выбрала метод их проверки, приоритизировала гипотезы (методом ICE и Rice), анализировала данные A/B-тестов, построила графики кумулятивной выручки, применила статистический анализ к результатам A/B-теста (непараметрический тест Манна-Уитни).
9. Анализ пользовательского поведения в мобильном приложении
Изучила данные об использовании фудтех-приложения (использовала групповые барплоты, гистрограммы), проанализировала и построила воронку продаж (библиотека Plotly), оценила результаты A/A/B-тестирования., исследовала пути пользователя до покупки, проанализировала результаты A/B-теста, про-вела статистический тест (z-критерий, который позволяет определить различаются ли два средних значения генеральной совокупности, когда дисперсии известны и размер выборки велик).
10. Как рассказать историю с помощью данных. Рынок заведений общественного питания Москвы
Создала презентацию и рекомендации для заказчика по открытию кофейни на основе полученных данных о заведениях общественного питания в г. Москва:
- сделала выводы на основе исследования;
- подготовила различные виды отчётов для заказчиков;
- работала с библиотеками визуализации seaborn и plotly;
- подбирала вид графика, исходя из данных;
- подбирала цветовые палитры для графика;
- строила информативные графики без лишних элементов.
11. Построение дашбордов в Tableau
Исследовала историю TED-конференций и создала дашборды и презентацию в Tableau на основе полученных данных.
12. Банки - Анализ оттока клиентов. Исследовала данные клиентов банка, выделила сегменты, которые наиболее склонны уходить из банка, дала рекомендации отделу маркетинга, нацеленные на снижение оттока.
13. Анализ базы данных крупного сервиса для чтения книг по подписке. Анализировала базу данных крупного сервиса для чтения книг по подписке.