Herramientas para capturar y convertir la web

¿Cómo GrabzIt convierte HTML a DOCX?

HTML puede representar muchas estructuras complicadas como DIV en línea o SPAN lado a lado. Elementos HTML superpuestos y bordes aplicados a diferentes elementos HTML. En su mayor parte, este no sería un enfoque sensato en DOCX, mientras que sería posible crear floatSi usa elementos HTML con cuadros de texto, casi todo el contenido estará contenido dentro de cuadros de texto, lo que dará como resultado un documento de Word muy feo y desordenado.

Es por este problema que ignoramos el floating de elementos HTML y bordes de la mayoría de los elementos HTML. Sin embargo, respetamos los bordes de algunos elementos HTML, como las celdas de la tabla y la alineación de los elementos de imagen, por ejemplo.

¿Significa esto que no puede colocar contenido uno al lado del otro? No. Esto todavía es posible usando atributos CSS de columna, Tablas HTML y tabulaciones como se describe a continuación.

Si desea que un documento HTML se capture exactamente como se muestra en la pantalla, sería mejor convertir el HTML a PDF ya que el formato de archivo PDF utiliza posicionamiento absoluto.

Tabulaciones

Tabulaciones son una función DOCX especial que se activa si floatLos elementos HTML, con alineación de texto, están contenidos dentro de un elemento HTML de 100% de ancho que no tiene una alineación de texto específica. Esto es importante ya que significa que la alineación normal no debe aplicarse a los elementos secundarios. Esto se hace usando text-align:start. Tenga en cuenta que Tab Stops no funcionará dentro de una tabla o lista.

A continuación se muestra un ejemplo de esto.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>