Lugar donde scrapeo cosas
Extrae información de las comisiones de la Cámara de Diputados, incluyendo integrantes y reuniones.
Archivos generados:
comisiones_diputados.csv
: Información general de las comisionesintegrantes_comisiones.csv
: Histórico de integrantes con fechas de inicio y finreuniones_diputados.csv
: Reuniones de todas las comisiones
Automatización: Se ejecuta el 1° de cada mes
Funcionalidad especial: Mantiene un histórico de cambios en los integrantes. Cuando alguien es reemplazado, se cierra la fecha de fin del anterior y se agrega el nuevo con su fecha de inicio.
Extrae información sobre los legisladores de la Legislatura de la Ciudad de Buenos Aires con seguimiento histórico.
Datos extraídos:
- Nombre completo, bloque político, mandatos
- URLs de perfil e imagen
- Correo electrónico y teléfono (cuando disponible)
- Comisiones de pertenencia
Archivos generados:
legisladores_historico.csv
: Registro histórico completo de todos los legisladores (activos e inactivos)legisladores_activos.csv
: Solo legisladores actualmente en funciones- Archivos de análisis por bloque y período
Automatización: Se ejecuta el 1° de cada mes
Funcionalidad especial: Sistema incremental que detecta cuando un legislador deja su cargo y registra automáticamente las fechas de baja, manteniendo un historial completo.
Para ejecutar cualquier scraper localmente:
- Clone este repositorio
- Instale las dependencias:
pip install requests beautifulsoup4 pandas
- Ejecute el script correspondiente:
python scraper_comisiones_mejorado.py
python scraper_legiscaba.py
Este proyecto está bajo la licencia MIT.