Una tarea común es descargar imágenes de un sitio web, con GrabzIt's Web Scraper esto es facil. En primer lugar, cree un nuevo raspado con los detalles normales, como la página de inicio del raspado y cualquier otra opción.
Luego ve al Instrucciones de raspado ficha y haga clic en el botón. Esto ingresará al Page palabra clave into las instrucciones de raspado y se abrirá un menú desplegable. Seleccionar getTagAttributes de la lista. Siguiente agregar 'src' como primer parámetro, esto le dice al Web Scraper que extraiga el atributo src, luego escriba una coma.
Page
getTagAttributes
'src'
Luego haga clic en esto le permite decirle al Web Scraper de qué elementos extraer el atributo src. En la ventana de filtro, asegúrese de que el tipo esté configurado en 'Página web' y la restricción sea 'nombre de etiqueta' e 'igual a'. Luego ingrese img en el cuadro de texto y luego haga clic en el botón Agregar y luego en el botón Insertar filtro. Termine la instrucción agregando un punto y coma al final de la línea.
img
Deberías quedarte con algo como lo que se muestra a continuación.
Page.getTagAttributes('src', {"tag":{"equals":"img"}});
El código anterior extraerá todas las URL de imágenes de la página web, pero ahora necesitamos usar esas URL de imágenes para save esas imágenes como archivos. Para hacer esto, envolveremos este comando menos el punto y coma en un Data.saveFile mando. Para hacerlo, vaya al comienzo de la línea y seleccione el botón. Luego, en el menú desplegable, seleccione saveFile, luego vaya al final de la línea y agregue un ) antes del punto y coma.
Data.saveFile
saveFile
)
Ahora debería tener las siguientes instrucciones de raspado.
Data.saveFile(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
Ahora, si ejecuta el raspado, extraerá todas las imágenes del sitio web. Gran parte de este tutorial también podría haberse logrado utilizando el botón del asistente en la barra de herramientas de Instrucciones de Scrape.