Herramientas para capturar y convertir la web

Grandes mejoras de web scraper para 2019

Viernes, Marzo 8, 2019

Además de un rediseño y un montón de correcciones de errores, hemos realizado mejoras drásticas en el raspador web de Grabz, que incluyen:

  • Apoyar la extracción de contenido contenido en estilos CSS
  • Ahora puede elegir el país desde el que se ejecuta un raspado. Por el momento, las opciones son los Estados Unidos o el Reino Unido.
  • Ahora puede elegir si respeta las reglas de robots.txt o no. Por defecto, un raspado hace.
  • Los datos relativos ahora se pueden asociar automáticamente, esto es útil cuando tiene datos que están presentes en algunos elementos HTML pero no en otros. Al asociar esos elementos, los valores aparecerán contra los elementos de datos correctos en el conjunto de datos resultante.
  • Al crear un conjunto de datos, diferentes columnas pueden pertenecer a diferentes plantillas, lo que significa que algunas columnas se pueden completar desde un tipo de página y otras columnas desde diferentes tipos de página. Un ejemplo de esto sería una página de listado de productos y una página de detalles del producto. Esto le permitiría obtener los detalles generales de la página de listado y luego la información detallada de la página de detalles del producto.
  • Otra forma en que se ha mejorado el generador de conjuntos de datos es permitir que los efectos de una operación, como un contenido, menos que etc., se apliquen a todas o algunas columnas.
  • Ahora hay varios nuevos comandos disponible desde el asistente de raspado.
    • Eliminar: ahora puede eliminar elementos, lo que es útil en algunas circunstancias para evitar que los mismos elementos se lean varias veces.
    • Desplazamiento: el raspador web ahora puede desplazar elementos HTML que lo admiten.
    • Desplazar: este comando desplazará el mouse sobre un elemento especificado, lo que puede ser útil para revelar información.
    • Paginación: esta es una nueva característica para la acción Hacer clic y permite que la paginación se realice automáticamente en los enlaces de paginación seleccionados. Esto significa que incluso si el raspador hace clic en algún lugar de los datos paginados, como parte del raspado, encontrará su camino de regreso a la página paginada actual para continuar con el raspado.
  • La mejor parte de Grabz es Raspador web es que puedes usarlo gratis todos los meses. Entonces, ¿qué esperas para probarlo y por favor envíanos cualquier comentario que tengas y nos encantaría hacer que el nuestro sea el mejor raspador web en línea!

Ver las últimas publicaciones del blog