Herramientas para capturar y convertir la web

Convierta páginas web y HTML a PDFAPI de Python

Al convertir páginas web y HTML a PDF API de Python de GrabzIt proporciona las siguientes características que ayudan integrate GrabzIt into su sistema tan fácilmente como sea posible. Sin embargo, antes de comenzar, recuerde que después de llamar al URLToPDF, HTMLToPDF or FileToPDF métodos de Save or SaveTo Se debe llamar al método para tomar la captura de pantalla en PDF.

Opciones basicas

A menudo al convertir una página web intEn un documento PDF se producirán muchas páginas para representar la página web completa. Solo se requiere un parámetro para convertir una página web into un documento PDF o para convertir HTML a PDF como se muestra en los ejemplos a continuación.

grabzIt.URLToPDF("https://www.tesla.com")
# Then call the Save or SaveTo method
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>")
# Then call the Save or SaveTo method
grabzIt.FileToPDF("example.html")
# Then call the Save or SaveTo method

Identificador personalizado

Puede pasar un identificador personalizado a PDF métodos como se muestra a continuación, este valor se devuelve a su controlador GrabzIt Python. Por ejemplo, este identificador personalizado podría ser un identificador de base de datos, lo que permite asociar una captura de pantalla con un registro de base de datos particular.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.URLToPDF("https://www.tesla.com", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.FileToPDF("example.html", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")

Encabezados y pies de página

Cuando crea una captura de pantalla en PDF, puede solicitar que desee aplicar un determinado plantilla al PDF generado. Esta plantilla debe ser saved de antemano y especificará el contenido del encabezado y pie de página junto con cualquier variable especial. En el siguiente código de ejemplo, el usuario está usando su plantilla llamada "mi plantilla".

Si no hay un margen superior o inferior lo suficientemente grande para el encabezado o pie de página respectivamente, no aparecerá en el PDF. En el siguiente ejemplo, hemos establecido los márgenes superior e inferior en 20 para proporcionar mucho espacio.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.marginTop = 20
options.marginBottom = 20
options.templateId = "my template"

grabzIt.FileToPDF("example.html", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

Convertir elemento HTML a PDF

Si solo desea convertir un elemento HTML como un div o span directamente into un documento PDF que puede con la biblioteca Python de GrabzIt. Debes pasar el Selector de CSS del elemento HTML que desea convertir a targetElement parámetro.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

En este ejemplo, deseamos capturar todo el contenido en el lapso que tiene la identificación de Article, por lo tanto, pasamos esto a GrabzIt como se muestra a continuación.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.targetElement = "#Article"

grabzIt.URLToPDF("http://www.bbc.co.uk/news", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")