Skip to content

marcoscardenasmancilla/html_to_dataframe_py

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 

Repository files navigation

HTML_to_DataFrame_PY

Author : Dr. Marcos H. Cárdenas Mancilla

Date of creation : 2024-11-15

Licence : AGPL V3

Copyright (c) 2024 Marcos H. Cárdenas Mancilla.

Descripción de HTML_to_DataFrame_PY:

Este código Python extrae y organiza información de un archivo HTML que contiene datos lingüísticos preprocesados con IA.

Características:

1. parsea el HTML usando BeautifulSoup para identificar y extraer procesos verbales.

2. asocia los datos a un identificador único y un código de color (amarillo o rojo).

3. organiza estos datos en un DataFrame de pandas, añadiendo información adicional como la traducción al inglés de cada proceso verbal obtenida también del HTML.

4. exporta este DataFrame a un archivo Excel, creando un conjunto de datos limpio y estructurado listo para su análisis, donde cada fila representa un proceso verbal.

imagen

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages