Una tarea común es descargar imágenes de un sitio web, con GrabzIt's Web Scraper esto es facil. En primer lugar, cree un nuevo raspado con los detalles normales, como la página de inicio del raspado y cualquier otra opción.
Luego ve al Instrucciones de raspado ficha y haga clic en el botón. Esto ingresará al
Page
keyword into las instrucciones de raspado y se abrirá un menú desplegable. Seleccionar getTagAttributes
de la lista. Siguiente agregar 'src'
como primer parámetro, esto le dice al Web Scraper que extraiga el atributo src, luego escriba una coma.
Luego haga clic en esto le permite decirle al Web Scraper de qué elementos extraer el atributo src. En la ventana de filtro, asegúrese de que el tipo esté configurado en 'Página web' y la restricción sea 'nombre de etiqueta' e 'igual a'. Luego ingrese
img
en el cuadro de texto y luego haga clic en el botón Agregar y luego en el botón Insertar filtro. Termine la instrucción agregando un punto y coma al final de la línea.
Deberías quedarte con algo como lo que se muestra a continuación.
Page.getTagAttributes('src', {"tag":{"equals":"img"}});
El código anterior extraerá todas las URL de imágenes de la página web, pero ahora necesitamos usar esas URL de imágenes para save esas imágenes como archivos. Para hacer esto, envolveremos este comando menos el punto y coma en un Data.saveFile
mando. Para hacerlo, vaya al comienzo de la línea y seleccione el botón. Luego, en el menú desplegable, seleccione
saveFile
, luego vaya al final de la línea y agregue un )
antes del punto y coma.
Ahora debería tener las siguientes instrucciones de raspado.
Data.saveFile(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
Ahora, si ejecuta el raspado, extraerá todas las imágenes del sitio web. Gran parte de este tutorial también podría haberse logrado utilizando el botón del asistente en la barra de herramientas de Instrucciones de Scrape.