Herramientas para capturar y convertir la web

Convierta URL y HTML a DOCX

API de rubí

Agregar la capacidad de convertir HTML o páginas web into Los documentos de Word para su aplicación nunca han sido tan fáciles con API de Ruby de GrabzIt. Sin embargo, antes de comenzar, recuerde que después de llamar al url_to_docx, html_to_docx or file_to_docx métodos de save or save_to Se debe llamar al método para crear realmente el DOCX.

Opciones basicas

La captura de páginas web a medida que DOCX convierte la página web completa into un documento de Word que puede constar de muchas páginas. Solo se requiere un parámetro para convertir una página web into un documento de Word o para convertir HTML a DOCX como se muestra en los ejemplos a continuación.

grabzItClient.url_to_docx("https://www.tesla.com")
# Then call the save or save_to method
grabzItClient.html_to_docx("<html><body><h1>Hello World!</h1></body></html>")
# Then call the save or save_to method
grabzItClient.file_to_docx("example.html")
# Then call the save or save_to method

Identificador personalizado

Puede pasar un identificador personalizado a DOCX métodos como se muestra a continuación, este valor se devuelve a su controlador GrabzIt Ruby. Por ejemplo, este identificador personalizado podría ser un identificador de base de datos, permitiendo que un documento DOCX se asocie con un registro de base de datos particular.

grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.customId = "123456"

grabzItClient.url_to_docx("https://www.tesla.com", options)
# Then call the save method
grabzItClient.save("http://www.example.com/handler/index")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.customId = "123456"

grabzItClient.html_to_docx("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the save method
grabzItClient.save("http://www.example.com/handler/index")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.customId = "123456"

grabzItClient.file_to_docx("example.html", options)
# Then call the save method
grabzItClient.save("http://www.example.com/handler/index")

Encabezados y pies de página

Para agregar un encabezado o pie de página a un documento de Word, puede solicitar que desee aplicar un determinado plantilla al DOCX que se genera. Esta plantilla debe ser saved de antemano y especificará el contenido del encabezado y pie de página junto con cualquier variable especial. En el código de ejemplo a continuación, el usuario está usando una plantilla que creó llamada "mi plantilla".

grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.templateId = "my template"

grabzItClient.url_to_docx("https://www.tesla.com", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.templateId = "my template"

grabzItClient.html_to_docx("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.templateId = "my template"

grabzItClient.file_to_docx("example.html", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")

Convertir elemento HTML a DOCX

Si solo desea convertir un elemento HTML como un div o span directamente into un documento de Word que puedas con GrabzIt's Ruby Gem. Debes pasar el Selector de CSS del elemento HTML que desea convertir a targetElement método de DOCXOptions clase.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

En este ejemplo, deseamos capturar todo el contenido en el lapso que tiene la identificación de Article, por lo tanto, pasamos esto a GrabzIt API como se muestra a continuación.

grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.targetElement = "#Article"

grabzItClient.url_to_docx("http://www.bbc.co.uk/news", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")