Skip to content

Latest commit

 

History

History
39 lines (25 loc) · 3.36 KB

README.md

File metadata and controls

39 lines (25 loc) · 3.36 KB

Curso de Python para Ciencia de Datos

Hola, Soy tu profesora Carli Code. Bienvenido al Curso de Python para Ciencia de Datos. Este curso está diseñado para llevarte desde los fundamentos del análisis de datos hasta técnicas avanzadas de visualización y optimización, utilizando las bibliotecas más populares de Python como NumPy, Pandas y Matplotlib. A lo largo del curso, aprenderás a manipular, analizar y visualizar datos, desarrollando una comprensión profunda de cómo utilizar Python para resolver problemas en ciencia de datos. Puedes acceder al curso completo en Curso de Python para Ciencia de Datos en Platzi.

Módulo 1: NumPy para Ciencia de Datos

En este módulo, explorarás las bases del cálculo matricial y la manipulación de arrays en Python utilizando NumPy. Aprenderás a trabajar con arrays multidimensionales, realizar cálculos algebraicos, y aplicar técnicas de optimización y escalabilidad para manejar grandes volúmenes de datos.

Módulo 2: Introducción a Pandas

Este módulo se enfoca en Pandas, la biblioteca esencial para la manipulación de datos en Python. Aprenderás a trabajar con DataFrames, realizar transformaciones complejas, manejar datos faltantes y realizar agrupaciones. También se abordarán técnicas avanzadas como el filtrado y la fusión de datos.

Módulo 3: Visualización de Datos con Matplotlib

En este módulo, te sumergirás en la visualización de datos utilizando Matplotlib. Aprenderás a crear gráficos básicos y avanzados, personalizar visualizaciones, trabajar con subplots y manejar series de tiempo. La integración de Matplotlib con Pandas también será cubierta para maximizar la eficiencia en la presentación de datos.

Módulo 4: Proyecto Práctico

El curso culmina con un proyecto práctico que te permitirá aplicar todos los conocimientos adquiridos en un caso de estudio real. Utilizaremos el dataset "Online Retail", disponible en el Repositorio de Machine Learning de la UCI.

Descripción del Dataset "Online Retail":

Este dataset contiene todas las transacciones realizadas entre el 1 de diciembre de 2010 y el 9 de diciembre de 2011 por una empresa minorista en línea con sede en el Reino Unido. La empresa vende principalmente regalos únicos de todos los rincones de Europa.

  • InvoiceNo: Número de factura. Es el identificador único de cada transacción.
  • StockCode: Código del producto. Identificador único de cada producto.
  • Description: Descripción del producto.
  • Quantity: Cantidad de productos en la transacción.
  • InvoiceDate: Fecha y hora en que se generó la factura.
  • UnitPrice: Precio unitario de cada producto.
  • CustomerID: Identificador único del cliente.
  • Country: País del cliente.

Proyecto Final:

Desarrollarás un análisis completo utilizando Python, desde la manipulación de datos hasta la visualización y reporte de insights clave. Este proyecto servirá como un excelente ejemplo para tu portafolio de ciencia de datos.

Podrás realizar análisis de ventas, segmentación de clientes, y aplicar técnicas de análisis exploratorio sobre el dataset proporcionado.

Derechos Reservados Este contenido es propiedad de Platzi. Todos los derechos reservados. El uso de este material está sujeto a los términos y condiciones de Platzi.