A menudo, la información textual importante se puede almacenar en imágenes. sin embargo GrabzIt's Web Scraper proporciona la capacidad de extraer automáticamente esta información mediante el reconocimiento óptico de caracteres. Aunque como esta es una forma de artificial intLos resultados no siempre son perfectos.
Para extraer texto de imágenes, debe usar el Utility.Image.extractText
método como se muestra a continuación.
var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
Estos ejemplos obtienen todas las URL de imágenes de la página web y luego pasan las URL al método extractText que intenta extraer datos textuales de cada imagen y devuelve las coincidencias como una matriz de strings.
Si el texto de la imagen está en un idioma diferente, debe especificar el código de idioma correcto utilizando el formato de dos letras (ISO 639-1) como se muestra a continuación.
var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');