合同和法律文件
法律文件必须保持可搜索、可引用且不可更改。无损优化可在不改变任何字符的情况下减小文件大小,以便提交到文件提交平台和电子邮件中——而且不会像重新渲染页面那样引发完整性问题。
大多数在线PDF文件压缩方法都是图像压缩:将页面重新渲染成低质量的图片。这种方法确实有效——我们的PDF压缩工具正是如此,对于扫描文档,它可以压缩60%到80%——但它也会带来一些实际的代价。文本将无法选择和搜索,超链接失效,表单字段也会被压缩变形。对于需要搜索的合同、需要填写的表单或需要引用的报告来说,这种妥协是不可接受的。针对这类文件,存在着优化方案。
LuraPDF 的优化器使用 pdf-lib 无损重建 PDF:文档的内部对象结构会使用压缩对象流重写——这是许多旧版 PDF 生成器从未采用过的标准 PDF 功能——并且可以在同一步骤中去除文档元数据。内容层则逐字节地保留。节省的空间真实可靠且适中:对于结构低效的文件,通常可节省 5% 到 20% 的空间;对于已经压缩良好的文件,有时甚至没有节省——而且该工具会明确告知您何时出现这种情况,而不是假装没有节省空间。
优化解决的问题与压缩解决的问题不同:优化是在不改变文件内容的前提下减小文件大小。在这些情况下,这种区别就显得尤为重要。
法律文件必须保持可搜索、可引用且不可更改。无损优化可在不改变任何字符的情况下减小文件大小,以便提交到文件提交平台和电子邮件中——而且不会像重新渲染页面那样引发完整性问题。
基于图像的压缩会永久性地扁平化表单字段。只有优化才能在保持可填写 PDF 文件可填写性的同时减小文件大小——请在分发申请表、信息收集表或调查问卷之前进行优化。
季度报告、研究论文和文档会被读者搜索、选择和复制文本。优化可以确保所有这些功能正常运行,同时减轻附件的大小。
元数据开关会清除文件中的作者姓名、创建日期和制作软件信息——在向组织外部发送文档而不泄露内部细节时非常有用。
屏幕阅读器依赖于 PDF 的文本层。压缩会破坏文本层;而优化则可以完整保留文本层。对于必须保持可访问性的文档,优化是稳妥的选择。
长期存档需要文件保持原样。优化可以在不改变内容的前提下降低存储成本,因此存档副本能够忠实地还原原始文件,而不是有损的衍生版本。
一款完全在浏览器中运行的无损优化器,并附有对其功能和局限性的真实说明。
PDF 文件是由一系列编号对象(页面、字体、图像、注释)以及一个交叉引用表组成的集合,该表记录了每个对象的字节位置,以便读者能够快速跳转到所需内容。旧版 PDF 生成器会将每个对象及其相关数据以未压缩的形式写入,这会浪费空间;反复编辑的文件还会进一步积累结构冗余。LuraPDF 的优化器使用 pdf-lib 加载文档,并利用对象流(PDF 1.5 的一项功能,可将非流对象组合在一起并作为一个整体进行压缩)写入一个全新的文件。每个对象的内容(包括实际文本、图像数据和矢量绘图命令)都保持不变。
启用元数据剥离后,优化器还会清除文档信息字典:标题、作者、主题、关键词、创建者、制作者以及创建和修改日期。这既节省了一些空间,又移除了您可能不想共享的来源信息。所有操作都在浏览器标签页内的客户端 JavaScript 中运行——无需上传、服务器或队列。由于没有任何内容被栅格化,即使在移动设备上,优化速度也很快,内存占用也很低,最终生成的 PDF 文件符合规范,在所有阅读器中都能完美呈现。
| 财产 | 优化 PDF(无损) | 压缩PDF(最小尺寸) | 基于服务器的优化器 |
|---|---|---|---|
| 文本保持可选中和可搜索状态 | 是的——总是如此 | 不——页面会变成图像 | 因工具而异 |
| 典型尺寸缩减 | 5–20%(仅结构) | 扫描结果显示60-80% | 因情况而异——通常基于图像 |
| 表单字段和链接已保留 | 是的 | 不——压扁了 | 因工具而异 |
| 文件将保留在您的设备上。 | 是的——仅限浏览器 | 是的——仅限浏览器 | 否——需要上传 |
优化效果最佳的方法是选择合适的工具来处理正确的文件。请遵循以下准则,选择合适的工具来完成任务。
对那些文本必须保持可选中、可搜索或可填写的文档(例如合同、表格、报告以及任何对可访问性要求极高的文档)进行优化。
对于扫描文档,请使用“压缩 PDF”的“最小尺寸”模式——扫描件本身就是图像,因此栅格化无需任何成本,并且可以节省 60-80% 的空间。
向外部发送文件时,请移除元数据——作者姓名、创建日期和制作软件等信息对任何查看文档属性的人都是可见的。
不要指望它能对现代文件产生奇迹般的效果——最新版本的 Word、Chrome 或 InDesign 导出的 PDF 文件通常结构已经非常精简,该工具会在无法进一步压缩时发出提示。
旧文件压缩幅度最大——由旧版生成器生成或在多个会话中编辑的文档存在结构上的冗余,而优化可以消除这些冗余。
如果文档属性很重要,请保留原始文件——输出文件中的元数据删除是不可逆的,但未经修改的源文件始终保留在您的设备上。
将您的 PDF 文件拖放到上方,即可在浏览器中无损重建:更高效的内部结构、可选的元数据移除,以及所有文字、链接和表单字段都与您上次编辑时完全一致。无需上传、无需注册、无水印。如果您的文件是扫描件,需要大幅缩小文件大小,只需单击一下即可使用“压缩 PDF”功能。