Hola! Themisto es una app en node.js que utiliza el modulo Puppeteer para realizar simulacion y abstraccion de datos en paginas web (web scraping) con fines educativos π¨βπ»π.
Toda la documentacion de puppeteer esta disponible en su sitio oficial y en su propio repositorio que les dejo a continuacion:
Themisto ingresa a un sitio web y abre un navegador preparado para ser controlado completa mente por codigo, es decir estariamos haciendo una automatizacion de procesos en el navegador. Esto sirve por ejemplo para rotar contraseΓ±as en mas de una cuenta a la vez o publicar varios avisos en varios sitios web de una sola vez.
const puppeteer = require('puppeteer');
Puppeter utiliza mayor mente async await debido a que debemos tener en cuenta el tiempo en el que el navegador se tarda en realizar ciertas operaciones :
async () => {
const browser = await puppeteer.launch({
headless: false,
defaultViewport:null
});
const page = await browser.newPage();
}
Un ejemplo de funcionamiento seria que a travez de themisto se programara una secuencia en la cual, se ingresan usuario y contraseΓ±a para logearse en varios sitios a la vez.
Para comenzar a utilizar la aplicacion se debe clonar o descargar el repositorio en su maquina y instalar las dependencias de npm
npm install
Luego ejecutaremos el archivo index.js con un parametro extra en la ejecucion el cual sera el nombre del articulo que deseamos buscar en el sitio web
node index.js silla