プライバシーを重視する方へ ― 公開する前に名前を削除してください
履歴書、コミュニティ文書、フォーラムの添付ファイルなど、PDFファイルを公開すると、ファイルプロパティにあなたの氏名とコンピューターのユーザー名が埋め込まれます。個人情報として特定されたくないファイルをアップロードする前に、InfoとXMPの両方を削除してください。
PDFファイルを共有する際、表示されている内容以外にも多くの情報が共有されている可能性があります。ファイル内には、あなたが意識的に入力した覚えのない情報が埋め込まれています。例えば、あなたの名前(オペレーティングシステムのユーザーアカウントから取得)、使用したアプリケーションとそのバージョン番号、文書が最初に作成され、最後に変更された正確な日時、そして場合によっては改訂回数などです。友人と共有する個人的な文書であれば問題ありませんが、入札書類、匿名情報、裁判所への提出書類、あるいはGDPR(一般データ保護規則)に抵触する可能性のある文書を外部に共有する場合、これらの情報開示は深刻な問題となります。
見過ごされがちな複雑な点は、PDF にはメタデータが 2 つの別々のレイヤーで格納されていることです。1 つはすべての閲覧者がアクセスできる従来の Info ディクショナリ、もう 1 つは最新のツールが埋め込むより詳細な XMP パケットです。ほとんどのオンライン メタデータ削除ツールは、ファイル > プロパティで確認できる Info ディクショナリのみを削除し、XMP パケットはそのまま残します。削除された PDF に対して exiftool を実行したり、Acrobat の高度なメタデータ パネルを開いたりすると、すべての情報が明らかになります。LuraPDF は、ファイルをサーバーに送信することなく、ブラウザ上で両方のレイヤーを削除します。
メタデータの削除は、セキュリティ研究者だけのものではありません。ここでは、意図せずメタデータが漏洩することで具体的なリスクが生じる、実際の6つの業務場面を紹介します。
履歴書、コミュニティ文書、フォーラムの添付ファイルなど、PDFファイルを公開すると、ファイルプロパティにあなたの氏名とコンピューターのユーザー名が埋め込まれます。個人情報として特定されたくないファイルをアップロードする前に、InfoとXMPの両方を削除してください。
法律事務所のメタデータ、弁護士名、内部文書管理システムのタグを含む裁判所提出用PDFファイルは、開示対象となります。提出前にメタデータレイヤーを両方ともクリーンアップすることで、相手方や公開記録に、貴社のワークフローや人事に関する情報がどの程度開示されるかを制御できます。
漏洩した文書や機密文書がPDF形式で転送されると、それらを扱ったすべての人のメタデータが記録されます。記事を公開する前に文書をクリーンアップするジャーナリスト、あるいは情報提供者が漏洩前にクリーンアップを行う場合、InfoとXMPの両方のクリアが必要です。XMPパケットには、Infoのみのツールでは全く検出されないフィールドが含まれていることがよくあります。
顧客、パートナー、または公共入札プロセスに送信されるPDFファイルには、作成ソフトウェア、社内作成者名、および変更履歴がしばしば含まれてしまいます。プロフェッショナルでブランドイメージを損なわないためには、外部に配布する前に社内メタデータを削除してください。
匿名採用プロセスでは、評価者は文書の内容のみを閲覧でき、作成者や編集者の情報は閲覧できません。評価シートや評価フォームを審査員に配布する前に、作成者、作成者情報、および更新日時を削除してください。
情報公開請求に基づいて公開された文書には、編集ツールでは対処できない内部作成者情報、システム名、編集履歴などを明らかにするメタデータが埋め込まれている場合があります。情報(Info)とXMPの両方を含むメタデータの完全な除去は、適切な公開前サニタイズワークフローの一部です。
ほとんどのツールは半分しか機能しません。メタデータ削除を意味のあるものにするには、両方のレイヤーをクリアする必要がある理由を以下に説明します。
Info辞書は、PDFのトレーラーセクション(PDFリーダーが最初に解析するファイルの末尾)に格納される辞書オブジェクトです。タイトル、作成者、件名、キーワード、作成者、プロデューサー、作成日、更新日といった標準フィールドが含まれています。LuraPDFはpdf-libを使用してこのトレーラー辞書に直接アクセスし、選択したキーをクリアして、辞書を更新または削除した新しいPDFを作成します。これにより、標準のPDFリーダーで「ファイル」>「プロパティ」からアクセスできるレイヤーが処理されます。
XMPパケットはより複雑です。これはPDF内に埋め込まれたストリームオブジェクトであり、拡張メタデータプラットフォーム仕様に準拠したXMLドキュメントを含んでいます。LuraPDFはPDFのオブジェクトツリーを走査してメタデータストリームを特定し、XMP XMLを解析して、関連するすべての名前空間(Dublin Core(dc:creator、dc:title、dc:description)、PDF名前空間(pdf:Author、pdf:Keywords)、およびXMPRights)のフィールドを削除または置換します。InDesignやAcrobatなどのツールによって追加されたカスタムアプリケーション名前空間もクリアされます。結果として、両方のメタデータレイヤーがクリーンなPDFが生成されます。
| 特徴 | LuraPDF | セジダ / ilovepdf | Adobe Acrobat |
|---|---|---|---|
| 情報辞書フィールドをクリアします | はい、すべての分野 | はい | はい |
| XMPメタデータパケットをクリアします | はい、すべての名前空間 | 部分的 — 多くの場合、情報のみ | はい |
| ブラウザ上でファイルを処理します(アップロードは行いません)。 | はい、完全に地元産です | いいえ - サーバーへのアップロードが必要です | はい、インストール済みのソフトウェアです。 |
| 透かしなしで無料 | はい、いつでも無料です | 限定機能 — 全機能を利用するには料金がかかります | 有料購読 |
メタデータの削除は簡単ですが、特に業務上または機密性の高い状況においては、見落としを防ぐためにいくつかの習慣を身につけておくことが重要です。
共有する前にメタデータを削除してください。共有後に削除しても意味がありません。受信者がメタデータ付きのファイルを入手してしまうと、既に閲覧またはキャッシュされた内容の共有を解除することはできません。
Redact PDFと組み合わせることで、文書を完全に消去できます。メタデータ削除はファイルプロパティをクリーンアップし、墨消しは表示ページから機密コンテンツを削除します。
専門的な場面では置換値を設定しましょう。「匿名」作成者や「文書編集者」作成者は意図的な印象を与えます。空白フィールドは、経験豊富なレビュー担当者から見ると、単なる修正作業のように見えることがあります。
クリーンアップ後のPDFを開き、exiftoolを実行して、InfoセクションとXMPセクションの両方に意図した内容のみが表示されていることを確認するなど、exiftoolまたはAcrobatで検証してください。
編集後は必ず再度削除を実行してください。Acrobat、Word(PDFとして保存)、LibreOfficeなどのPDFエディターは、保存するたびにメタデータを再付与します。改訂サイクルが終わるたびに、再度削除を実行してください。
PDF のフラット化と組み合わせて、注釈作成者のメタデータを削除します。フラット化によって注釈が静的コンテンツに変換され、文書レベルのメタデータ削除では影響を受けない注釈ごとの作成者フィールドが削除されます。
PDFファイルをドロップし、埋め込まれた内容を確認して、共有すべきでないフィールドを削除します。情報辞書とXMPパケットは両方ともブラウザ上でクリアされ、何もアップロードされません。アカウントもウォーターマークもありません。