100% 私密即时处理永久免费

移除 PDF 元数据 — 去除作者、日期和跟踪信息,免费

您的 PDF 文件包含隐藏信息:您的姓名、使用的软件、创建时间以及修改次数。分享前,请清除 Info 字典和 XMP 元数据包。仅限浏览器访问——无需上传任何内容。

你的PDF文件透露的信息超出了你的预期。

当你分享PDF文件时,你可能分享的远不止是可见的内容。文件中嵌入了一些你从未主动填写过的字段:你的姓名(来自你的操作系统用户帐户)、你使用的应用程序及其版本号、文档的创建和修改的确切日期和时间,以及在某些情况下,文档经历了多少次修订。如果是与朋友分享的个人文档,这无伤大雅。但如果是投标书、匿名举报、法庭文件或受GDPR保护的敏感文档,对外分享时,这些信息的泄露就成了真正的问题。

容易被忽视的复杂之处在于,PDF 文件包含两层元数据:所有阅读器都能访问的传统 Info 字典,以及现代工具嵌入的更详细的 XMP 数据包。大多数在线元数据清除工具只会清除 Info 字典(可在“文件”>“属性”中查看),而完全保留 XMP 数据包。任何运行 exiftool 或打开 Acrobat 的“高级元数据”面板查看“已清理”PDF 文件的人都会看到完整的元数据。LuraPDF 可以直接在浏览器中清除这两层元数据,无需将文件发送到任何服务器。

如何在线删除PDF文件中的元数据

1

上传您的PDF文件

拖放要检查和清理元数据的 PDF 文件。该工具会在本地读取文件,并列出找到的每个元数据字段——包括传统的 Info 字典和现代的 XMP 数据包。

2

审查当前元数据

查看您的 PDF 文件究竟披露了哪些信息:作者、标题、主题、关键词、创建者应用程序、制作者、创建日期、修改日期以及您的软件添加的任何自定义 XMP 字段。

3

选择要删除的字段

您可以选择一键移除所有元数据,也可以选择特定字段。移除作者姓名,但保留文档标题。移除软件指纹,但保留创建日期。完全精细化控制。

4

设置替换值(可选)

与其将字段留空(这可能会引起一些审阅者的怀疑),不如选择设置替换值。您可以将真实姓名替换为“匿名”,将“创建者”设置为“未知”,或者完全清除“制作人”字段。

5

下载已清理的 PDF

下载已清理的 PDF 文件。预告片信息字典和嵌入的 XMP 数据包均已清除。可见内容、格式和所有文档特征均保持不变。

完全私密——无需上传

所有元数据操作均在您的浏览器内部使用客户端 JavaScript 完成。您的 PDF 文件绝不会经过服务器。律师、记者和注重隐私的人士可以安全地清理敏感文档,而无需将其泄露给任何第三方。

双重擦洗:信息字典 + XMP 数据包

大多数元数据清除工具只能清除一层元数据。实际上,PDF 文件在两个地方都包含元数据:文件末尾的 Info 字典(旧版字段)和嵌入式 XMP 数据包(扩展的现代元数据)。LuraPDF 可以同时清除这两层元数据。而那些只清除 Info 字典的工具则会保留 XMP 数据包,任何使用 exiftool 或 Acrobat 高级属性面板的人都可以发现它。

颗粒场控制

您可以一次性删除所有内容,也可以选择性地删除字段。例如,删除作者和创建者信息,保留标题和主题;删除时间戳,保留关键词。这种控制级别与专业工作流程相匹配,在专业工作流程中,某些元数据是有意添加的,而某些则是无意添加的。

设置替换值

在敏感情况下,完全空白的元数据本身就是一个信号。请将实际值替换为中性占位符:例如,将“作者”设置为“匿名”,将“创建者”设置为“文档编辑者”,或将“创建日期”设置为通用值——这样就能生成一个干净的 PDF 文件,看起来不像是经过刻意清理过的。

移除每页元数据和 XMP 扩展元数据

现代 PDF 应用程序会在文档级别甚至页面级别嵌入元数据。LuraPDF 会遍历所有 XMP 命名空间——包括 Dublin Core、PDF、XMPRights 和自定义扩展——移除嵌入在文件结构深处的元数据,而不仅仅是表面字段。

免费,无需注册,无水印

免费移除任意数量 PDF 文件的元数据。无需注册账号,输出文件不添加水印,使用次数不限。只需上传、检查并清理即可。

哪些人需要移除 PDF 元数据?以及原因

元数据移除并非安全研究人员的专属职责。以下列举六个真实的专业场景,在这些场景中,意外泄露的元数据会造成切实的风险。

注重隐私的人士——公开分享前请删除姓名

公开上传PDF文件(例如简历、社区文档或论坛附件)时,您的全名和计算机用户名会被嵌入到文件属性中。如果您不希望文件上显示您的个人信息,请在上传前删除文件属性中的Info和XMP信息。

律师——提交文件前仔细审查律所元数据

提交给法院的PDF文件,如果包含律师事务所元数据、律师姓名和内部文档管理系统标签,则可能被公开。提交前务必清理元数据层,以控制对方当事人及公共记录中关于您工作流程和人员的信息。

记者——保护消息来源和作者身份

泄露或敏感的PDF文档会携带所有经手者的元数据。记者在发表前清理文档,或者消息来源在泄露信息前清理信息,都需要同时清除Info和XMP元数据。XMP数据包通常包含Info工具完全无法识别的字段。

企业——面向合作伙伴和客户的品牌中立PDF文件

发送给客户、合作伙伴或用于公开招标的PDF文件通常会泄露文件的创建软件、内部创建者姓名和修改历史。为了确保文件呈现专业且符合品牌规范的形象,请在对外发布前清除内部元数据。

人力资源团队——匿名候选人及评估文件

盲选流程要求评估人员只能看到文档内容,而不能看到文档的创建者或编辑者。在将评分表和评估表分发给评审小组成员之前,请移除其中的作者、创建者和修改时间戳。

政府机构——在《信息自由法》发布前清理元数据

根据信息自由法案公开的文件可能包含嵌入式元数据,揭示内部作者身份、系统名称和编辑历史等信息,而这些信息超出了传统编辑工具的处理范围。完整的元数据清理(包括 Info 和 XMP 格式)是发布前完善的清理工作流程的一部分。

双层擦洗为何如此重要

大多数工具只能完成一半的工作。以下是为什么要真正有效地删除元数据,需要清除两层数据的原因。

  • Info字典和XMP数据包都被清除——不像大多数工具那样只清除一层。
  • 完全隐私保护——您的PDF文件在本地处理,绝不会发送到任何服务器。
  • 精细化字段控制——可以移除特定字段,而不是强制全部或全部移除。
  • 可选值替换——在专业场合,请将空白处设置为“匿名”。
  • 免费无水印——清理后的PDF文件输出中不包含任何LuraPDF的痕迹。
  • 没有可见的变化——文档内容、格式和功能完全不受影响。

LuraPDF 如何移除 PDF 元数据

Info 字典是一个字典对象,存储在 PDF 文件的尾部(PDF 阅读器首先解析的文件末尾部分)。它包含以下标准字段:标题 (Title)、作者 (Author)、主题 (Subject)、关键词 (Keywords)、创建者 (Creator)、制作者 (Producer)、创建日期 (CreationDate) 和修改日期 (ModDate)。LuraPDF 使用 pdf-lib 直接访问此尾部字典,清除选定的键,并写入一个更新或删除了该字典的新 PDF 文件。这相当于标准 PDF 阅读器中“文件”>“属性”选项卡所显示的层。

XMP 数据包更为复杂:它是一个嵌入在 PDF 中的流对象,其中包含一个遵循可扩展元数据平台 (EMP) 规范的 XML 文档。LuraPDF 会遍历 PDF 的对象树以找到元数据流,解析 XMP XML,并移除或替换所有相关命名空间中的字段,包括 Dublin Core 命名空间(dc:creator、dc:title、dc:description)、PDF 命名空间(pdf:Author、pdf:Keywords)以及 XMPRights。由 InDesign 或 Acrobat 等工具添加的自定义应用程序命名空间也会被清除。最终生成的 PDF 文档的两个元数据层都已清理干净。

LuraPDF 删除元数据与其他工具的比较

特征LuraPDFSejda / ilovepdfAdobe Acrobat
清除信息字典字段是的——所有字段是的是的
清除 XMP 元数据包是的——所有命名空间部分——通常仅供参考是的
在浏览器中处理文件(无需上传)是的——完全本地化否——需要服务器上传是的——已安装软件
免费无水印是的——永远免费有限功能——付费即可享受全部功能付费订阅

彻底删除 PDF 元数据的技巧

删除元数据很简单——但养成一些习惯可以确保不会遗漏任何信息,尤其是在专业或敏感环境中。

  1. Tip 1:

    分享前请移除元数据,不要在分享后移除——一旦接收者获得了带有元数据的文件,你就无法撤销他们已经查看或缓存的内容。

  2. Tip 2:

    结合使用 Redact PDF 进行完整的文档清理——元数据移除功能可清除文件属性;编辑功能可从可见页面中移除敏感内容。

  3. Tip 3:

    在专业语境中设置替换值——“匿名”作者和“文档编辑”创建者看起来是刻意为之;空白字段在经验丰富的审阅者看来可能是人为修改过的。

  4. Tip 4:

    之后使用 exiftool 或 Acrobat 进行验证——打开清理后的 PDF 文件,运行 exiftool,并确认 Info 和 XMP 部分都只显示您想要保留的内容。

  5. Tip 5:

    每次编辑后都要重新清理——像 Acrobat、Word(另存为 PDF)和 LibreOffice 这样的 PDF 编辑器每次保存都会重新添加元数据;每次修订周期结束后都要再次运行删除操作。

  6. Tip 6:

    配合 Flatten PDF 工具使用,可以移除注释作者元数据——扁平化操作会将注释转换为静态内容,从而移除文档级元数据移除功能无法触及的注释作者字段。

关于删除 PDF 元数据的常见问题

PDF文件中隐藏了哪些元数据?
标准的 PDF 文件可以包含两层元数据。信息字典(传统版)存储:作者、标题、主题、关键词、创建者(创建原始文档的应用程序)、生成者(PDF转换器)、创建日期和修改日期。XMP 数据包(现代版)在此基础上扩展了信息,包含都柏林核心元数据字段、专有软件字段、编辑历史记录、版本跟踪信息,以及在某些情况下,移动扫描应用程序嵌入的 GPS 坐标。这两层元数据在文档的可读内容中都不可见,但任何拥有 PDF 查看器的人都可以访问它们。
为什么分享PDF前需要移除元数据?
元数据会泄露您可能无意分享的信息:如果您创建文档并希望匿名提交,则会泄露您的真实姓名;您的组织名称;您使用的软件版本和操作系统(安全指纹);文档的修改次数和时间;以及哪些特定人员编辑过文件。对于新闻业、法律实践、采购投标和隐私合规而言,这种意外泄露构成切实存在的风险。
Info 字典和 XMP 元数据有什么区别?为什么这很重要?
Info 字典是 PDF 的一种传统结构,它是文件尾部的一个简单键值存储。XMP(可扩展元数据平台)是一种更现代的、基于 XML 的元数据格式,以数据流的形式嵌入到 PDF 文件中。许多工具只会清除 Info 字典,而保留 XMP 数据包。任何使用 Acrobat 的“文档属性”>“附加元数据”或运行 exiftool 工具的用户仍然会看到完整的 XMP 数据。LuraPDF 会同时清除 Info 字典和 XMP 数据包,这是彻底移除元数据的唯一方法。
删除元数据会改变PDF中显示的任何内容吗?
不。元数据字段与文档页面内容分开存储。删除或更改作者、创建者、时间戳或任何其他元数据字段,对读者打开 PDF 时看到的文本、图像、布局或任何其他宽高比均无任何影响。
在线删除PDF元数据安全吗?
是的。LuraPDF 使用客户端 JavaScript 在您的浏览器内完全处理 PDF 文件。文件绝不会发送到任何服务器——包括我们的服务器。对于敏感文档(法律文件、机密报告、个人记录),这种本地处理模式是去除元数据的唯一可接受的方法。
我可以只删除特定的元数据字段,而不是全部删除吗?
是的。LuraPDF 会显示 PDF 文件中的所有元数据字段,并允许您选择要删除的字段。例如,您可能希望保留文档标题以便于搜索,同时删除作者和创建者信息。或者,您可以删除所有时间戳,但保留主题关键词。LuraPDF 提供完整的字段级粒度控制。
我可以替换元数据值而不是直接删除它们吗?
是的。对于每个字段,您可以选择将其清空(留空)或替换为自定义值。将“作者”设置为“匿名”或将“创建者”设置为“未知”通常比将字段留空更好,因为在法庭文件或公共记录等敏感情况下,留空字段可能会显得刻意删除。
如何验证元数据是否已成功删除?
下载清理后的 PDF 文件后,请使用 Adob​​e Acrobat 或 Reader 打开,然后依次点击“文件”>“属性”。在 macOS 系统中,请使用“预览”软件,然后依次点击“文件”>“PDF 属性”。为了进行更全面的检查,您可以从命令行运行 exiftool 命令——它会读取 Info 字典和 XMP 数据包,并报告找到的每个字段。
删除元数据是否也会删除注释作者或跟踪更改历史记录?
不——注释作者和跟踪更改的存储方式与文档级元数据不同。它们嵌入在注释和修订对象中,而不是在信息字典或 XMP 数据包中。要移除注释作者姓名,请使用“展平 PDF”功能,该功能会将注释转换为静态内容并移除所有注释属性,包括作者字段。
删除元数据后,PDF 文件还能正常使用吗?
是的。元数据字段仅供参考,并非PDF渲染、打印或正常运行所必需。删除或替换元数据不会影响文档的可用性、与PDF阅读器的兼容性,也不会影响其任何功能特性,例如表单、链接或书签。

立即移除 PDF 元数据 — 免费移除信息和 XMP 元数据

上传您的 PDF 文件,检查其中嵌入的内容,并删除不应共享的字段。信息字典和 XMP 数据包——均已在您的浏览器中清除,无需上传任何内容。无需帐户,也无水印。