Herramientas para capturar y convertir la web

Convierta URL y HTML a DOCX

API PHP

Agregar la capacidad de convertir HTML o páginas web into Los documentos de Word para su aplicación nunca han sido tan fáciles con La API PHP de GrabzIt. Sin embargo, antes de comenzar, recuerde que después de llamar al URLToDOCX, HTMLToDOCX or FileToDOCX métodos. los Save or SaveTo Se debe llamar al método para crear realmente el DOCX.

Opciones basicas

La captura de páginas web como DOCX convierte la página web completa into un documento de Word que puede constar de muchas páginas. En los ejemplos a continuación PHP convierte HTML a DOCX y una página web into un documento de Word, con un solo parámetro requerido.

$grabzIt->URLToDOCX("https://www.tesla.com");
//Then call the Save or SaveTo method
$grabzIt->HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>");
//Then call the Save or SaveTo method
$grabzIt->FileToDOCX("example.html");
//Then call the Save or SaveTo method

Identificador personalizado

Puede pasar un identificador personalizado a DOCX métodos como se muestra a continuación, este valor se devuelve a su controlador GrabzIt PHP. Por ejemplo, este identificador personalizado podría ser un identificador de base de datos, permitiendo que un documento DOCX se asocie con un registro de base de datos particular.

$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setCustomId(123456);

$grabzIt->URLToDOCX("https://www.tesla.com", $options);
//Then call the Save method
$grabzIt->Save("http://www.example.com/handler.php");
$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setCustomId(123456);

$grabzIt->HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", $options);
//Then call the Save method
$grabzIt->Save("http://www.example.com/handler.php");
$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setCustomId(123456);

$grabzIt->FileToDOCX("example.html", $options);
//Then call the Save method
$grabzIt->Save("http://www.example.com/handler.php");

Encabezados y pies de página

Si bien GrabzIt no es compatible con la plantilla de Word tradicional. Al agregar encabezados o pies de página a un documento de Word, puede solicitar que desee aplicar un plantilla al DOCX que se genera. Esta plantilla debe ser saved de antemano y especificará el contenido del encabezado y pie de página junto con cualquier variable especial. En el código de ejemplo a continuación, el usuario está usando una plantilla que creó llamada "mi plantilla".

$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setTemplateId("my template");

$grabzIt->URLToDOCX("https://www.tesla.com", $options);
//Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");
$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setTemplateId("my template");

$grabzIt->HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", $options);
//Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");
$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setTemplateId("my template");

$grabzIt->FileToDOCX("example.html", $options);
//Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");

Convertir elemento HTML a DOCX

Si solo desea convertir un elemento HTML como un div o span directamente into un documento de Word que pueda con la biblioteca PHP de GrabzIt. Debes pasar el Selector de CSS del elemento HTML que desea convertir a setTargetElement método de GrabzItDOCXOptions clase.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

En este ejemplo, deseamos capturar todo el contenido en el lapso que tiene la identificación de Article. Al pasar esto a GrabzIt como se muestra a continuación.

$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setTargetElement("#Article");

$grabzIt->URLToDOCX("http://www.bbc.co.uk/news", $options);
//Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");

No importa si está convirtiendo una URL a Word como se muestra en el ejemplo o HTML a Word. Ambos apuntan a elementos HTML exactamente de la misma manera.