Herramientas para capturar y convertir la web

Cómo rellenar un conjunto de datos

A veces cuando construir un conjunto de datos en el objeto Raspador web se agregan más valores into una columna que otra. En el siguiente ejemplo, después de que se raspa la primera página, se agrega el nombre John a la columna Nombre junto con tres colores y en la página siguiente se agrega el nombre David junto con otros dos colores. Para dar el siguiente conjunto de datos.

Nombre y ApellidosColor
JuanUniformes Amarillos
DavidRojo
Verde
Azul
Púrpura

Sin embargo, esta tabla es engañosa ya que no muestra qué nombre se encontró con qué colores. En cambio el pad El método se puede utilizar para agregar automáticamente celdas vacías al final de las columnas del conjunto de datos hasta que todas las columnas tengan la misma longitud. Un ejemplo de la pad El método utilizado se muestra a continuación.

Data.save(Page.getTagValue({"class":{"equals":"Name"}}), 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad();

Estas instrucciones de raspado producen un conjunto de datos que se ve así.

Nombre y ApellidosColor
JuanUniformes Amarillos
Rojo
Verde
DavidAzul
Púrpura

Podríamos mejorar esto aún más especificando el padValue parámetro de la pad método para ser el nombre encontrado por el raspador. Como en este ejemplo, solo hay un nombre por página en el que se convierten las instrucciones de raspado.

var name = Page.getTagValue({"class":{"equals":"Name"}});
Data.save(name, 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad(name);

Lo que pone un nombre en cada celda vacía de la columna de nombre como se muestra a continuación.

Nombre y ApellidosColor
JuanUniformes Amarillos
JuanRojo
JuanVerde
DavidAzul
DavidPúrpura