Herramientas para capturar y convertir la web

Descargar todas las imágenes de un sitio web

Este ejemplo también está disponible como plantilla.

Una tarea común es descargar imágenes de un sitio web, con GrabzIt's Web Scraper esto es facil. En primer lugar, cree un nuevo raspado con los detalles normales, como la página de inicio del raspado y cualquier otra opción.

Luego ve al Instrucciones de raspado ficha y haga clic en el Botón de página web botón. Esto ingresará al Page palabra clave into las instrucciones de raspado y se abrirá un menú desplegable. Seleccionar getTagAttributes de la lista. Siguiente agregar 'src' como primer parámetro, esto le dice al Web Scraper que extraiga el atributo src, luego escriba una coma.

Luego haga clic en Botón de filtro esto le permite decirle al Web Scraper de qué elementos extraer el atributo src. En la ventana de filtro, asegúrese de que el tipo esté configurado en 'Página web' y la restricción sea 'nombre de etiqueta' e 'igual a'. Luego ingrese img en el cuadro de texto y luego haga clic en el botón Agregar y luego en el botón Insertar filtro. Termine la instrucción agregando un punto y coma al final de la línea.

Deberías quedarte con algo como lo que se muestra a continuación.

Page.getTagAttributes('src', {"tag":{"equals":"img"}});

El código anterior extraerá todas las URL de imágenes de la página web, pero ahora necesitamos usar esas URL de imágenes para save esas imágenes como archivos. Para hacer esto, envolveremos este comando menos el punto y coma en un Data.saveFile mando. Para hacerlo, vaya al comienzo de la línea y seleccione el Botón de datos botón. Luego, en el menú desplegable, seleccione saveFile, luego vaya al final de la línea y agregue un ) antes del punto y coma.

Ahora debería tener las siguientes instrucciones de raspado.

Data.saveFile(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

Ahora, si ejecuta el raspado, extraerá todas las imágenes del sitio web. Gran parte de este tutorial también podría haberse logrado utilizando el botón del asistente en la barra de herramientas de Instrucciones de Scrape.