Skip to content

NodeJs WebScraping πŸ•·πŸ•·πŸ•·πŸ•·

License

Notifications You must be signed in to change notification settings

PipoLucido/Themisto

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

20 Commits
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

Themisto

Hola! Themisto es una app en node.js que utiliza el modulo Puppeteer para realizar simulacion y abstraccion de datos en paginas web (web scraping) con fines educativos πŸ‘¨β€πŸ’»πŸ“š.

Puppeteer

Toda la documentacion de puppeteer esta disponible en su sitio oficial y en su propio repositorio que les dejo a continuacion:

enter image description here

Funcionamiento

Themisto ingresa a un sitio web y abre un navegador preparado para ser controlado completa mente por codigo, es decir estariamos haciendo una automatizacion de procesos en el navegador. Esto sirve por ejemplo para rotar contraseΓ±as en mas de una cuenta a la vez o publicar varios avisos en varios sitios web de una sola vez.

 const  puppeteer = require('puppeteer');

Puppeter utiliza mayor mente async await debido a que debemos tener en cuenta el tiempo en el que el navegador se tarda en realizar ciertas operaciones :

async () => { 
	    const  browser = await  puppeteer.launch({
	    headless: false,
	    defaultViewport:null
	    });
    	    const  page = await  browser.newPage();
    }

Un ejemplo de funcionamiento seria que a travez de themisto se programara una secuencia en la cual, se ingresan usuario y contraseΓ±a para logearse en varios sitios a la vez.

Para comenzar a utilizar la aplicacion se debe clonar o descargar el repositorio en su maquina y instalar las dependencias de npm

npm install

Luego ejecutaremos el archivo index.js con un parametro extra en la ejecucion el cual sera el nombre del articulo que deseamos buscar en el sitio web

node index.js silla

About

NodeJs WebScraping πŸ•·πŸ•·πŸ•·πŸ•·

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published