Skip to content

Coded-by-Alejandro/coffeetrends

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Coffee Trends - Análisis de Datos de Café

Descripción

Este proyecto analiza datos de reseñas de café a nivel mundial para identificar tendencias, calificaciones y precios. Incluye un pipeline completo de datos, desde la limpieza hasta la visualización en un dashboard interactivo en Looker Studio. Está diseñado como un caso práctico para un analista de datos junior, transformando datos en insights útiles para entender el comportamiento de los consumidores de café.

Estructura del Proyecto

project/
│
├── data/
│   ├── raw/                        # Datos originales
│   └── processed/                  # Datos limpios
│       ├── coffee_reviews_clean.csv
│       └── coffee_reviews.db
│
├── notebooks/
│   ├── 01_data_cleaning.ipynb      # Limpieza y preparación de datos
│   └── 02_exploratory_analysis.ipynb  # Análisis exploratorio y visualizaciones
│
├── reportes/
│   └── Coffee_Trends.pdf # Exportación estática del dashboard
│
├── README.md
└── requirements.txt

Datos

  • Dataset: Coffee Reviews Dataset (versión simplificada)
  • Tamaño: 1246 reseñas, 9 columnas
  • Columnas principales:
    • name: Nombre del blend
    • roaster: Tostador
    • roast: Tipo de tueste
    • origin: País de origen de los granos
    • loc_country: País del tostador
    • 100g_usd: Precio por 100g
    • rating: Calificación del café
    • review_date: Fecha de la reseña
    • review: Texto de la reseña

Análisis Realizado

  1. Limpieza y Transformación

    • Conversión de formatos de fecha.
    • Tratamiento de valores nulos.
    • Generación de una base de datos SQLite (coffee_reviews.db) y un archivo CSV limpio.
  2. Análisis Exploratorio

    • Estadísticas descriptivas de variables categóricas y numéricas.
    • Cálculo de métricas: promedio de calificaciones, precios promedio, conteo de reseñas por país y tipo de tueste.
    • Análisis de correlaciones entre precio y calificación (Pearson: 0.277, Spearman: 0.291, p < 0.05).
  3. Dashboard Interactivo en Looker Studio

    • Hoja 1: Resumen Ejecutivo y Mapa
      KPIs: total de reseñas, promedio de calificación, precio promedio, número de países.
      Mapa interactivo con calificaciones promedio por país y tamaño de burbuja según número de reseñas.
    • Hoja 2: Calificaciones por País
      Tabla condicional (heatmap) con calificaciones promedio por país.
    • Hoja 3: Distribución de Tuestes
      Gráfico de barras con cantidad de reseñas por tipo de tueste y línea de calificación promedio.
    • Hoja 4: Relación Precio-Calificación
      Gráfico de dispersión mostrando la relación entre precio por gramo y calificación.
  4. Filtros Interactivos

    • Filtros por país de origen (origin) y tipo de tueste (roast).
    • Actualización dinámica de KPIs, gráficos y tablas según selección del usuario.

Insights Principales

  • Panamá, Ecuador y Kenia lideran en calificaciones promedio.
  • Los tuestes Medium-Light y Light son los más comunes en las reseñas.
  • Existe una correlación positiva moderada entre precio y calificación.
  • Mapas y tablas permiten identificar combinaciones destacadas de país y tueste.

Dashboard

Explora el dashboard interactivo:
Coffee Trends Dashboard

Tecnologías

  • Python: pandas, matplotlib, seaborn, SQLAlchemy
  • SQL: SQLite para gestión de datos
  • Looker Studio: Visualización interactiva
  • Estadística: Análisis exploratorio y correlaciones

Instala dependencias

pip install -r requirements.txt

Autor

Alejandro Montalvo Lupercio

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published