Este proyecto analiza datos de reseñas de café a nivel mundial para identificar tendencias, calificaciones y precios. Incluye un pipeline completo de datos, desde la limpieza hasta la visualización en un dashboard interactivo en Looker Studio. Está diseñado como un caso práctico para un analista de datos junior, transformando datos en insights útiles para entender el comportamiento de los consumidores de café.
project/
│
├── data/
│ ├── raw/ # Datos originales
│ └── processed/ # Datos limpios
│ ├── coffee_reviews_clean.csv
│ └── coffee_reviews.db
│
├── notebooks/
│ ├── 01_data_cleaning.ipynb # Limpieza y preparación de datos
│ └── 02_exploratory_analysis.ipynb # Análisis exploratorio y visualizaciones
│
├── reportes/
│ └── Coffee_Trends.pdf # Exportación estática del dashboard
│
├── README.md
└── requirements.txt
- Dataset: Coffee Reviews Dataset (versión simplificada)
- Tamaño: 1246 reseñas, 9 columnas
- Columnas principales:
name: Nombre del blendroaster: Tostadorroast: Tipo de tuesteorigin: País de origen de los granosloc_country: País del tostador100g_usd: Precio por 100grating: Calificación del caféreview_date: Fecha de la reseñareview: Texto de la reseña
-
Limpieza y Transformación
- Conversión de formatos de fecha.
- Tratamiento de valores nulos.
- Generación de una base de datos SQLite (
coffee_reviews.db) y un archivo CSV limpio.
-
Análisis Exploratorio
- Estadísticas descriptivas de variables categóricas y numéricas.
- Cálculo de métricas: promedio de calificaciones, precios promedio, conteo de reseñas por país y tipo de tueste.
- Análisis de correlaciones entre precio y calificación (Pearson: 0.277, Spearman: 0.291, p < 0.05).
-
Dashboard Interactivo en Looker Studio
- Hoja 1: Resumen Ejecutivo y Mapa
KPIs: total de reseñas, promedio de calificación, precio promedio, número de países.
Mapa interactivo con calificaciones promedio por país y tamaño de burbuja según número de reseñas. - Hoja 2: Calificaciones por País
Tabla condicional (heatmap) con calificaciones promedio por país. - Hoja 3: Distribución de Tuestes
Gráfico de barras con cantidad de reseñas por tipo de tueste y línea de calificación promedio. - Hoja 4: Relación Precio-Calificación
Gráfico de dispersión mostrando la relación entre precio por gramo y calificación.
- Hoja 1: Resumen Ejecutivo y Mapa
-
Filtros Interactivos
- Filtros por país de origen (
origin) y tipo de tueste (roast). - Actualización dinámica de KPIs, gráficos y tablas según selección del usuario.
- Filtros por país de origen (
- Panamá, Ecuador y Kenia lideran en calificaciones promedio.
- Los tuestes Medium-Light y Light son los más comunes en las reseñas.
- Existe una correlación positiva moderada entre precio y calificación.
- Mapas y tablas permiten identificar combinaciones destacadas de país y tueste.
Explora el dashboard interactivo:
Coffee Trends Dashboard
- Python: pandas, matplotlib, seaborn, SQLAlchemy
- SQL: SQLite para gestión de datos
- Looker Studio: Visualización interactiva
- Estadística: Análisis exploratorio y correlaciones
pip install -r requirements.txt
Alejandro Montalvo Lupercio