扫描清理
去除批量扫描仪在归档或共享文档之前插入到文档各部分之间的空白分隔页。
半空的PDF文件浪费纸张、增大电子邮件附件大小,还会让收件人淹没在无关内容中。扫描报告里夹杂着空白分隔页、教科书PDF里带有水印的示例页、合并文档的接缝处出现重复页面——这些都是日常生活中常见的烦恼。解决方案是一款页面删除工具,它能让你直观地查看每一页,快速标记不需要的页面,并生成一个只包含重要内容的简洁输出文件。
LuraPDF 使用 pdf-lib 重写页面树,并省略选定的页面。剩余页面与原始页面字节完全相同——不会进行重新编码。自动空白页检测器通过 PDF.js 将每个页面渲染到一个小画布上,并检查像素直方图,寻找接近白色的区域,从而标记出可能的空白页供您审核。删除前您需要确认。所有操作都在浏览器中完成——无需上传、无水印,也无需注册账号。
任何人在分发前对扫描文档进行降噪、删除敏感页面或清理合并的 PDF 文件。
去除批量扫描仪在归档或共享文档之前插入到文档各部分之间的空白分隔页。
发送前,请删除与特定收件人无关的封面页、后记和附录。
从免费分发的教科书预览 PDF 中剪切带有水印的示例页面和购买提示页面。
删除合并来自不同来源且共享介绍性材料的 PDF 文件时出现的重复页面。
在与同事或客户共享较大文档之前,请删除包含个人信息的页面。
合并多个 PDF 文件后,去除合并痕迹——空白标题页、重复页眉和格式中断页。
在浏览器中本地删除页面比使用桌面 PDF 编辑器更快、更安全、更直观。
PDF 的页面树是一个链接结构——每个页面都是一个独立的对象,通过树中的索引进行引用。删除页面意味着从树中移除这些引用,并写入新的页数。其余页面对象则完全保持不变。LuraPDF 使用 pdf-lib 来识别您选择的页面的索引,重建不包含这些索引的页面树,并将新文档序列化为浏览器内存中的 Uint8Array。
自动空白页检测器独立运行:PDF.js 将每一页渲染成一个 100×141 像素的画布,LuraPDF 则对画布上的像素值进行采样,查找超过 95% 的像素接近白色(RGB > 240)的页面。高于此阈值的页面将被标记为可能为空白页,并在网格中高亮显示,供您审核。您需要在删除操作执行前确认选择——未经您的批准,系统绝不会自动删除页面。
| 特征 | LuraPDF | smallpdf | Adobe Acrobat |
|---|---|---|---|
| 自动空白页扫描 | 是的 | 不 | 不 |
| 范围语法输入 | 是的 | 部分的 | 是的 |
| 仅限浏览器访问/无需上传 | 是的 | 不 | 不 |
| 免费无限 | 是的 | 有限的 | 有薪酬的 |
一些良好的做法可以防止意外数据丢失,并加快大规模删除操作的速度。
使用范围语法(2-5、8、11-13)进行大范围的连续删除——比点击单个缩略图快得多。
如果自动检测漏掉了一些接近空白的页面,请调整自动检测阈值——默认值比较保守,以避免误报。
删除大量数据后压缩 PDF 文件,以恢复文件大小的全部优势。
如果页面顺序混乱,请先重新排序——将删除和重新排序合并到一个工作流程中。
请保留原始文件的副本——删除操作会破坏文件,被删除的页面无法从输出文件中恢复。
如果要将“已删除”的页面保存到单独的文件中,请改用“提取 PDF 页面”功能。
从任何 PDF 文件中删除空白页、机密部分并合并文件。仅限浏览器使用,无损编辑,免费。通过缩略图或范围标记页面,确认,下载——完成。