Hoàn toàn riêng tưXử lý tức thìMiễn phí mãi mãi

Xóa siêu dữ liệu PDF — Loại bỏ tác giả, ngày tháng và thông tin theo dõi, miễn phí.

Tệp PDF của bạn chứa thông tin ẩn: tên của bạn, phần mềm bạn đã sử dụng, thời gian bạn tạo ra nó và số lần bạn đã chỉnh sửa. Hãy xóa cả từ điển Thông tin và gói siêu dữ liệu XMP trước khi chia sẻ. Chỉ hiển thị trên trình duyệt — không có gì được tải lên.

Tệp PDF của bạn đang tiết lộ nhiều thông tin hơn bạn dự định.

Khi bạn chia sẻ một tệp PDF, bạn có thể đang chia sẻ nhiều hơn nội dung hiển thị. Bên trong tệp tin có chứa các trường thông tin mà bạn chưa bao giờ chủ động điền vào: tên của bạn (từ tài khoản người dùng của hệ điều hành), ứng dụng bạn đã sử dụng và số phiên bản của nó, ngày giờ chính xác tài liệu được tạo lần đầu và sửa đổi lần cuối, và trong một số trường hợp là số lần chỉnh sửa mà tài liệu đã trải qua. Đối với một tài liệu cá nhân được chia sẻ với bạn bè, điều này không gây hại. Nhưng đối với một hồ sơ dự thầu, một lời mách nước ẩn danh, một hồ sơ tòa án hoặc một tài liệu nhạy cảm theo GDPR được chia sẻ ra bên ngoài, những tiết lộ này là một vấn đề thực sự nghiêm trọng.

Một vấn đề phức tạp thường bị đánh giá thấp là các tệp PDF chứa siêu dữ liệu ở hai lớp riêng biệt: từ điển Thông tin (Info dictionary) cũ mà tất cả các trình đọc đều có thể truy cập, và gói XMP chi tiết hơn mà các công cụ hiện đại nhúng vào. Hầu hết các công cụ xóa siêu dữ liệu trực tuyến chỉ xóa từ điển Thông tin — hiển thị trong Tệp > Thuộc tính — và giữ nguyên gói XMP. Bất kỳ ai chạy exiftool hoặc mở bảng Siêu dữ liệu Nâng cao của Acrobat trên tệp PDF đã được 'làm sạch' của bạn đều sẽ thấy toàn bộ thông tin. LuraPDF xóa cả hai lớp, ngay trong trình duyệt của bạn, mà không cần gửi tệp của bạn đến bất kỳ máy chủ nào.

Cách xóa siêu dữ liệu khỏi tệp PDF trực tuyến

1

Tải lên tệp PDF của bạn

Kéo thả tệp PDF chứa siêu dữ liệu mà bạn muốn kiểm tra và làm sạch. Công cụ sẽ đọc tệp cục bộ và liệt kê mọi trường siêu dữ liệu tìm thấy — cả từ điển Info cũ và gói XMP hiện đại.

2

Xem lại siêu dữ liệu hiện tại

Xem chính xác những thông tin mà tệp PDF của bạn tiết lộ: Tác giả, Tiêu đề, Chủ đề, Từ khóa, Ứng dụng tạo, Nhà sản xuất, Ngày tạo, Ngày chỉnh sửa và bất kỳ trường XMP tùy chỉnh nào được phần mềm của bạn thêm vào.

3

Chọn các trường cần xóa

Chọn xóa toàn bộ siêu dữ liệu chỉ bằng một cú nhấp chuột, hoặc chọn các trường cụ thể. Xóa tên tác giả nhưng giữ lại tiêu đề tài liệu. Xóa dấu vân tay phần mềm nhưng giữ lại ngày tạo. Kiểm soát chi tiết hoàn toàn.

4

Thiết lập giá trị thay thế (Tùy chọn)

Thay vì để trống các trường — điều này có thể gây nghi ngờ cho một số người đánh giá — bạn có thể tùy chọn thiết lập các giá trị thay thế. Thay thế tên thật của bạn bằng 'Ẩn danh', đặt Người tạo thành 'Không xác định' hoặc xóa hoàn toàn trường Nhà sản xuất.

5

Tải xuống tệp PDF đã được chỉnh sửa của bạn

Tải xuống tệp PDF đã được làm sạch. Cả từ điển thông tin đoạn giới thiệu và gói XMP nhúng đều đã được loại bỏ. Nội dung hiển thị, định dạng và tất cả các tính năng của tài liệu vẫn hoàn toàn không thay đổi.

Hoàn toàn riêng tư — Không cần tải lên

Mọi thao tác xử lý siêu dữ liệu đều diễn ra bên trong trình duyệt của bạn bằng JavaScript phía máy khách. Tệp PDF của bạn không bao giờ được lưu trữ trên máy chủ. Luật sư, nhà báo và những người quan tâm đến quyền riêng tư có thể chỉnh sửa các tài liệu nhạy cảm mà không để lộ chúng cho bất kỳ bên thứ ba nào.

Dual Scrub: Từ điển thông tin + Gói XMP

Hầu hết các công cụ xóa siêu dữ liệu chỉ xóa một lớp. Trên thực tế, PDF chứa siêu dữ liệu ở hai nơi: từ điển Thông tin phần cuối (các trường cũ) và gói XMP được nhúng (siêu dữ liệu hiện đại mở rộng). LuraPDF xóa cả hai. Một công cụ chỉ xóa Thông tin sẽ giữ nguyên XMP — có thể được phát hiện bởi bất kỳ ai có exiftool hoặc bảng thuộc tính Nâng cao của Acrobat.

Kiểm soát trường hạt

Xóa tất cả cùng một lúc hoặc chọn lọc các trường cần xóa. Loại bỏ Tác giả và Người tạo trong khi giữ lại Tiêu đề và Chủ đề. Loại bỏ dấu thời gian trong khi vẫn giữ lại từ khóa. Mức độ kiểm soát này phù hợp với quy trình làm việc chuyên nghiệp, nơi một số siêu dữ liệu được tạo ra có chủ đích và một số là do vô tình.

Đặt giá trị thay thế

Một bộ siêu dữ liệu hoàn toàn trống rỗng tự nó đã là một tín hiệu trong các ngữ cảnh nhạy cảm. Thay thế các giá trị thực bằng các giá trị giữ chỗ trung lập: đặt Tác giả thành 'Ẩn danh', Người tạo thành 'Người biên tập tài liệu' hoặc Ngày tạo thành một giá trị chung chung — điều này sẽ giúp bạn có một tệp PDF sạch sẽ mà không trông giống như đã bị loại bỏ một cách rõ ràng.

Xóa siêu dữ liệu trên mỗi trang và phần mở rộng XMP.

Các ứng dụng PDF hiện đại nhúng siêu dữ liệu ở cấp độ tài liệu và đôi khi ở cấp độ trang. LuraPDF duyệt qua tất cả các không gian tên XMP — Dublin Core, PDF, XMPRights và các phần mở rộng tùy chỉnh — loại bỏ siêu dữ liệu được nhúng sâu trong cấu trúc tệp, chứ không chỉ các trường bề mặt.

Miễn phí, không cần tài khoản, không có hình mờ

Xóa siêu dữ liệu khỏi bao nhiêu tệp PDF tùy thích hoàn toàn miễn phí. Không cần tài khoản, không thêm hình mờ vào tệp đầu ra, không giới hạn số lần sử dụng. Chỉ cần tải lên, kiểm tra và làm sạch.

Ai cần xóa siêu dữ liệu PDF — và tại sao

Việc xóa siêu dữ liệu không chỉ dành cho các nhà nghiên cứu bảo mật. Dưới đây là sáu tình huống thực tế trong môi trường chuyên nghiệp, nơi việc vô tình tiết lộ siêu dữ liệu tạo ra rủi ro hữu hình.

Những người coi trọng quyền riêng tư — Vui lòng xóa tên trước khi chia sẻ công khai.

Việc đăng tải công khai một tệp PDF — ví dụ như sơ yếu lý lịch, tài liệu cộng đồng, tệp đính kèm diễn đàn — sẽ nhúng tên đầy đủ và tên người dùng máy tính của bạn vào thuộc tính tệp. Hãy loại bỏ cả thông tin cá nhân và XMP trước khi tải lên bất kỳ thứ gì bạn không muốn bị gán cho cá nhân mình.

Luật sư — Hãy kiểm tra kỹ siêu dữ liệu của công ty trước khi nộp hồ sơ.

Các tệp PDF được nộp lên tòa án có chứa siêu dữ liệu của công ty luật, tên luật sư và thẻ hệ thống quản lý tài liệu nội bộ đều có thể bị phát hiện. Hãy làm sạch cả hai lớp siêu dữ liệu trước khi nộp để kiểm soát những gì bên đối lập và hồ sơ công khai tiết lộ về quy trình làm việc và nhân sự của bạn.

Các nhà báo — Hãy bảo vệ danh tính nguồn tin và tác giả.

Các tài liệu bị rò rỉ hoặc nhạy cảm được chuyển tiếp dưới dạng PDF mang theo siêu dữ liệu của tất cả những người đã xử lý chúng. Một nhà báo chỉnh sửa tài liệu trước khi xuất bản — hoặc một nguồn tin trước khi rò rỉ — cần phải được xác thực cả Info và XMP. Gói XMP thường chứa các trường mà các công cụ chỉ xác thực Info hoàn toàn bỏ sót.

Doanh nghiệp — Tài liệu PDF trung lập về thương hiệu dành cho đối tác và khách hàng

Các tệp PDF gửi cho khách hàng, đối tác hoặc trong các quy trình đấu thầu công khai thường tiết lộ phần mềm soạn thảo, tên người tạo nội bộ và lịch sử chỉnh sửa. Để tạo ấn tượng chuyên nghiệp và được kiểm soát thương hiệu, hãy loại bỏ siêu dữ liệu nội bộ trước khi phân phối ra bên ngoài.

Nhóm Nhân sự — Hồ sơ ứng viên ẩn danh và tài liệu đánh giá

Quy trình tuyển dụng ẩn danh yêu cầu người đánh giá chỉ xem nội dung tài liệu, chứ không biết ai đã tạo hoặc chỉnh sửa nó. Hãy xóa thông tin Tác giả, Người tạo và thời gian chỉnh sửa khỏi bảng điểm và biểu mẫu đánh giá trước khi gửi cho các thành viên hội đồng.

Các cơ quan chính phủ — Hãy làm sạch siêu dữ liệu trước khi công bố theo Đạo luật Tự do Thông tin (FOIA).

Các tài liệu được công bố theo yêu cầu về quyền tự do thông tin có thể chứa siêu dữ liệu nhúng tiết lộ danh tính tác giả nội bộ, tên hệ thống và lịch sử chỉnh sửa vượt quá khả năng xử lý của các công cụ biên tập. Việc loại bỏ hoàn toàn siêu dữ liệu — cả Info và XMP — là một phần của quy trình làm sạch trước khi phát hành đúng cách.

Tại sao lọc khí hai lớp lại quan trọng

Hầu hết các công cụ chỉ làm được một nửa công việc. Dưới đây là lý do tại sao cả hai lớp dữ liệu cần được xóa để việc loại bỏ siêu dữ liệu thực sự có ý nghĩa.

  • Cả từ điển thông tin và gói XMP đều được xóa sạch — không chỉ một lớp như hầu hết các công cụ khác.
  • Bảo mật tuyệt đối — tệp PDF của bạn được xử lý cục bộ, không bao giờ được gửi đến bất kỳ máy chủ nào.
  • Kiểm soát chi tiết từng trường — loại bỏ các trường cụ thể thay vì buộc phải chọn tất cả hoặc không chọn gì cả.
  • Tùy chọn thay thế giá trị — đặt 'Anonymous' thay vì để trống trong các ngữ cảnh chuyên nghiệp.
  • Miễn phí và không có hình mờ — các tệp PDF đã được làm sạch không còn dấu vết của LuraPDF trong kết quả đầu ra.
  • Không có thay đổi nào có thể nhìn thấy — nội dung tài liệu, định dạng và chức năng hoàn toàn không bị ảnh hưởng.

LuraPDF loại bỏ siêu dữ liệu PDF như thế nào?

Từ điển Thông tin là một đối tượng từ điển được lưu trữ trong phần cuối của tệp PDF — phần cuối cùng của tệp mà các trình đọc PDF phân tích đầu tiên. Nó chứa các trường tiêu chuẩn: Tiêu đề, Tác giả, Chủ đề, Từ khóa, Người tạo, Nhà sản xuất, Ngày tạo và Ngày sửa đổi. LuraPDF sử dụng pdf-lib để truy cập trực tiếp vào từ điển cuối này, xóa các khóa đã chọn và ghi một tệp PDF mới với từ điển được cập nhật hoặc xóa. Điều này xử lý lớp mà Tệp > Thuộc tính hiển thị trong các trình đọc PDF tiêu chuẩn.

Gói XMP phức tạp hơn: đó là một đối tượng luồng được nhúng trong tệp PDF chứa một tài liệu XML tuân theo đặc tả Nền tảng Siêu dữ liệu Mở rộng (Extensible Metadata Platform). LuraPDF duyệt qua cây đối tượng của PDF để định vị luồng siêu dữ liệu, phân tích cú pháp XML XMP và loại bỏ hoặc thay thế các trường trên tất cả các không gian tên liên quan — Dublin Core (dc:creator, dc:title, dc:description), không gian tên PDF (pdf:Author, pdf:Keywords) và XMPRights. Các không gian tên ứng dụng tùy chỉnh được thêm bởi các công cụ như InDesign hoặc Acrobat cũng được xóa. Kết quả là một tệp PDF trong đó cả hai lớp siêu dữ liệu đều sạch.

So sánh LuraPDF loại bỏ siêu dữ liệu với các công cụ khác

Tính năngLuraPDFSejda / ilovepdfAdobe Acrobat
Xóa các trường từ điển thông tinVâng — tất cả các lĩnh vựcĐúngĐúng
Xóa gói siêu dữ liệu XMPĐúng vậy — tất cả các không gian tênThông tin không đầy đủ — thường chỉ mang tính chất tham khảo.Đúng
Xử lý tập tin trong trình duyệt (không cần tải lên)Vâng — hoàn toàn là hàng địa phươngKhông — cần tải lên máy chủCó — phần mềm đã được cài đặt
Miễn phí, không có hình mờVâng — luôn miễn phíPhiên bản giới hạn — trả phí để có đầy đủ tính năng.Đăng ký trả phí

Mẹo để loại bỏ siêu dữ liệu PDF triệt để

Việc xóa siêu dữ liệu khá đơn giản — nhưng một vài thói quen cần tuân thủ sẽ đảm bảo không có gì bị bỏ sót, đặc biệt là trong các bối cảnh chuyên nghiệp hoặc nhạy cảm.

  1. Tip 1:

    Hãy xóa siêu dữ liệu trước khi chia sẻ, chứ không phải sau đó — một khi người nhận đã có tệp tin kèm siêu dữ liệu, bạn không thể thu hồi lại những gì họ đã xem hoặc lưu trong bộ nhớ cache.

  2. Tip 2:

    Kết hợp với Redact PDF để làm sạch toàn bộ tài liệu — việc loại bỏ siêu dữ liệu sẽ làm sạch các thuộc tính của tệp; việc che giấu sẽ loại bỏ nội dung nhạy cảm khỏi trang hiển thị.

  3. Tip 3:

    Hãy đặt các giá trị thay thế trong bối cảnh chuyên nghiệp — việc sử dụng "Tác giả ẩn danh" và "Người tạo tài liệu" trông có vẻ có chủ ý; các trường trống có thể bị người đánh giá có kinh nghiệm nhận ra là do thao tác chỉnh sửa cẩu thả.

  4. Tip 4:

    Sau khi làm sạch, hãy kiểm tra lại bằng exiftool hoặc Acrobat — mở tệp PDF đã được làm sạch, chạy exiftool và xác nhận cả phần Thông tin và XMP chỉ hiển thị những gì bạn muốn giữ lại.

  5. Tip 5:

    Hãy làm sạch lại sau mỗi lần chỉnh sửa — các trình chỉnh sửa PDF như Acrobat, Word (Lưu dưới dạng PDF) và LibreOffice sẽ đóng dấu lại siêu dữ liệu mỗi khi lưu; hãy chạy lại quá trình xóa sau mỗi chu kỳ sửa đổi.

  6. Tip 6:

    Kết hợp với Flatten PDF để loại bỏ siêu dữ liệu tác giả chú thích — quá trình làm phẳng chuyển đổi các chú thích thành nội dung tĩnh, loại bỏ các trường Tác giả cho mỗi chú thích mà việc loại bỏ siêu dữ liệu cấp tài liệu không động đến.

Các công cụ PDF liên quan

Câu hỏi thường gặp về việc xóa siêu dữ liệu PDF

Những siêu dữ liệu nào được ẩn bên trong một tệp PDF?
Một tệp PDF tiêu chuẩn có thể chứa hai lớp siêu dữ liệu. Từ điển Thông tin (cũ) lưu trữ: Tác giả, Tiêu đề, Chủ đề, Từ khóa, Người tạo (ứng dụng đã tạo ra tài liệu gốc), Nhà sản xuất ( mềm chuyển đổi PDF), Ngày tạo và Ngày sửa đổi. Gói XMP (hiện đại) mở rộng điều này với các trường Dublin Core, các trường phần mềm độc quyền, lịch sử chỉnh sửa, theo dõi phiên bản và trong một số trường hợp là tọa độ GPS được nhúng bởi các ứng dụng quét trên thiết bị di động. Cả hai lớp đều không hiển thị trong nội dung có thể đọc được của tài liệu nhưng có thể truy cập được bởi bất kỳ ai có trình kiểm tra PDF.
Tại sao tôi cần xóa siêu dữ liệu PDF trước khi chia sẻ?
Siêu dữ liệu tiết lộ thông tin mà bạn có thể không muốn chia sẻ: tên thật của bạn nếu bạn tạo tài liệu muốn gửi ẩn danh, tên tổ chức của bạn, phiên bản phần mềm và hệ điều hành bạn đã sử dụng (dấu vân tay bảo mật), số lần và thời điểm tài liệu được sửa đổi, và những cá nhân cụ thể nào đã chỉnh sửa tệp. Đối với báo chí, luật sư, đấu thầu và tuân thủ quy định về quyền riêng tư, việc tiết lộ thông tin ngoài ý muốn này là một rủi ro thực sự.
Từ điển Info và siêu dữ liệu XMP khác nhau ở điểm nào — và tại sao điều đó lại quan trọng?
Từ điển Info là một cấu trúc PDF cũ — một kho lưu trữ khóa-giá trị đơn giản trong phần cuối của tệp. XMP (Extensible Metadata Platform) là một định dạng siêu dữ liệu hiện đại hơn, dựa trên XML, được nhúng dưới dạng luồng bên trong PDF. Nhiều công cụ chỉ xóa từ điển Info, giữ nguyên gói XMP. Bất kỳ ai sử dụng Thuộc tính Tài liệu > Siêu dữ liệu bổ sung của Acrobat hoặc chạy exiftool trên tệp vẫn sẽ thấy toàn bộ dữ liệu XMP. LuraPDF xóa cả hai, đây là cách duy nhất để thực sự loại bỏ hoàn toàn siêu dữ liệu.
Việc xóa siêu dữ liệu có làm thay đổi bất cứ điều gì hiển thị trong tệp PDF không?
Không. Các trường siêu dữ liệu được lưu trữ riêng biệt với nội dung trang của tài liệu. Việc xóa hoặc thay đổi Tác giả, Người tạo, dấu thời gian hoặc bất kỳ trường siêu dữ liệu nào khác không ảnh hưởng gì đến văn bản, hình ảnh, bố cục hoặc bất kỳ khung hình nào khác mà người đọc nhìn thấy khi mở tệp PDF.
Việc xóa siêu dữ liệu PDF trực tuyến có an toàn không?
Đúng vậy. LuraPDF xử lý toàn bộ tệp PDF của bạn ngay trong trình duyệt bằng JavaScript phía máy khách. Tệp không bao giờ được gửi đến bất kỳ máy chủ nào — kể cả máy chủ của chúng tôi. Đối với các tài liệu nhạy cảm (hồ sơ pháp lý, báo cáo mật, hồ sơ cá nhân), mô hình xử lý cục bộ này là phương pháp duy nhất được chấp nhận để loại bỏ siêu dữ liệu.
Tôi có thể chỉ xóa các trường siêu dữ liệu cụ thể thay vì tất cả không?
Đúng vậy. LuraPDF hiển thị cho bạn mọi trường siêu dữ liệu có trong tệp PDF và cho phép bạn chọn trường nào muốn xóa. Bạn có thể muốn giữ lại Tiêu đề tài liệu để phục vụ mục đích tìm kiếm trong khi xóa Tác giả và Người tạo. Hoặc xóa tất cả dấu thời gian trong khi vẫn giữ lại các từ khóa chủ đề. Khả năng tùy chỉnh chi tiết đến từng trường là hoàn toàn có sẵn.
Tôi có thể thay thế các giá trị siêu dữ liệu thay vì chỉ xóa chúng không?
Đúng vậy. Với mỗi trường, bạn có thể chọn xóa trắng (để trống) hoặc thay thế bằng một giá trị tùy chỉnh. Việc đặt Tác giả là 'Ẩn danh' hoặc Người tạo là 'Không xác định' thường được ưu tiên hơn so với việc để trống các trường, vì điều này có thể trông giống như bị cố tình xóa bỏ trong các ngữ cảnh nhạy cảm như hồ sơ tòa án hoặc hồ sơ công khai.
Làm thế nào để tôi xác minh rằng siêu dữ liệu đã được xóa thành công?
Sau khi tải xuống tệp PDF đã được làm sạch, hãy mở nó bằng Adobe Acrobat hoặc Reader và kiểm tra Tệp > Thuộc tính. Trên macOS, hãy sử dụng Preview và kiểm tra Tệp > Thuộc tính PDF. Để kiểm tra kỹ lưỡng hơn, hãy chạy exiftool trên tệp từ dòng lệnh — nó đọc cả từ điển Thông tin và gói XMP và báo cáo mọi trường mà nó tìm thấy.
Việc xóa siêu dữ liệu có xóa luôn tác giả chú thích hoặc lịch sử theo dõi thay đổi không?
Không — tác giả chú thích và các thay đổi được theo dõi được lưu trữ khác với siêu dữ liệu cấp tài liệu. Chúng được nhúng trong các đối tượng chú thích và sửa đổi, chứ không phải trong từ điển Thông tin hoặc gói XMP. Để xóa tên tác giả chú thích, hãy sử dụng Flatten PDF, công cụ này chuyển đổi các chú thích thành nội dung tĩnh và xóa tất cả các thuộc tính chú thích, bao gồm cả trường tác giả.
Liệu file PDF vẫn hoạt động bình thường sau khi xóa siêu dữ liệu?
Đúng vậy. Các trường siêu dữ liệu chỉ mang tính chất thông tin và không bắt buộc để PDF hiển thị, in ấn hoặc hoạt động. Việc xóa hoặc thay thế siêu dữ liệu không ảnh hưởng đến khả năng sử dụng tài liệu, khả năng tương thích với các trình đọc PDF hoặc bất kỳ tính năng chức năng nào của nó như biểu mẫu, liên kết hoặc dấu trang.

Xóa siêu dữ liệu PDF của bạn ngay bây giờ — Cả Info & XMP, miễn phí

Hãy kéo thả tệp PDF vào, xem lại nội dung được nhúng và xóa các trường không nên chia sẻ. Từ điển thông tin và gói XMP — cả hai đều được xóa sạch trong trình duyệt của bạn, không có gì được tải lên. Không cần tài khoản, không có hình mờ.