LuraPDF verwendet mammoth.js, um Ihre .docx- oder .doc-Datei im Browser zu parsen. Mammoth liest die Open-XML-Struktur, extrahiert Absätze mit ihren Formatierungsattributen (fett, kursiv, Schriftart, -größe, -farbe), Überschriften mit ihren Stilebenen, Tabellenzelleninhalte und -überschneidungen sowie eingebettete Bilder, die als Base64-Streams kodiert sind. Dieser strukturierte Inhalt wird anschließend an eine Layout-Engine übergeben, die die Elemente mithilfe von pdf-lib auf einer PDF-Seite positioniert. Jeder Absatz wird einem PDF-Textobjekt mit der korrekten Schriftart und -größe zugeordnet; jede Tabellenzeile wird einem positionierten Textobjekt innerhalb der Zellengrenzen zugeordnet.
Schriftarten werden durch Subsetting verarbeitet: Nur die Glyphenkonturen der tatsächlich im Dokument vorhandenen Zeichen werden in die PDF-Ausgabe eingebettet. Dadurch bleibt die Dateigröße überschaubar, während gleichzeitig eine exakte Darstellung gewährleistet wird. Bilder aus der .docx-Datei werden aus ihrer Base64-Darstellung dekodiert und als PDF-Bildströme eingebettet. Das fertige PDF wird im Browserspeicher erstellt und auf Ihrem Gerät gespeichert. Es verlassen keine Daten den Browser – das Parsen mit mammoth.js, die Layoutberechnung und die Kodierung mit pdf-lib laufen alle in einem einzigen Browsertab ab.