法務チームが裁判所に書類を提出
提出前に、裁判所への提出書類から依頼人の社会保障番号、自宅住所、未成年者の氏名を削除してください。連邦規則では、実際に内容を削除することが義務付けられており、視覚的な隠蔽は違反行為となり、制裁や再提出の義務付けにつながる可能性があります。
毎年、法律事務所、政府機関、病院は、編集済みだと信じて文書を公開しますが、PDFリーダーとちょっとした好奇心さえあれば誰でも元のテキストを抽出できてしまいます。NSAの監視の詳細を明らかにした2009年のACLUの訴訟、黒い枠の下に名前が残っていた国防総省の文書、黒い塗りつぶしの四角の下に弁護士と依頼人のやり取りが残っていた裁判記録など、これらはすべて同じミスが原因でした。テキストを削除する適切な編集ツールではなく、描画ツールを使ってテキストを覆ってしまったのです。Adobe Readerの描画ツール、Photoshop、またはほとんどのオンラインPDFエディターでテキストの上に黒い四角を描画すると、テキストはPDFのコンテンツストリームに残ります。どのユーザーでも、テキストエディターでファイルを開いたり、コピー&ペーストを使って隠された情報を復元できます。これは特殊なケースでも技術的な脆弱性でもなく、実際のデータを変更することのない視覚的な隠蔽工作の想定される動作なのです。
LuraPDFは真の墨消し処理を実行します。ユーザーが指定した領域は処理され、基となるテキスト文字、画像ピクセルデータ、コンテンツストリーム命令がPDF構造から削除されてからディスクに書き込まれます。それらに代わって、塗りつぶされた四角形が生成されます。これは復元可能なデータの上に重ねられた四角形ではなく、もはや存在しないデータの代わりに生成された四角形です。作成者名、作成ソフトウェア、埋め込まれたドキュメントプロパティ、ドキュメントの作成者を特定する可能性のある改訂履歴などのメタデータも、墨消し処理中に削除されます。出力PDFは標準的な墨消し検証チェックに合格します。これらすべてはブラウザ上でローカルに実行され、アップロードは不要です。ドキュメントがデバイスから外部に持ち出されることはありません。これは、そもそも適切な墨消し処理が必要となるような機密情報が含まれている場合に特に重要です。
適切な編集は単なる良き慣習ではなく、多くの分野で法的要件となっています。隠蔽ツールは法的責任を生じさせますが、真のコンテンツ削除はそうではありません。
提出前に、裁判所への提出書類から依頼人の社会保障番号、自宅住所、未成年者の氏名を削除してください。連邦規則では、実際に内容を削除することが義務付けられており、視覚的な隠蔽は違反行為となり、制裁や再提出の義務付けにつながる可能性があります。
監査人、弁護士、または第三者と共有する前に、人事文書から社会保障番号、給与額、懲戒記録、および医療情報を削除し、明示的に承認された内容のみがアクセスできるようにしてください。
研究、請求内容の確認、または部門間の転送のために医療記録のPDFファイルを共有する前に、患者の名前、生年月日、保険番号、診断コードを削除してください。これにより、個人健康情報(PHI)がファイルから完全に削除されていることを確信できます。
パートナー、規制当局、または集計データや概要データのみを閲覧させるべき顧客と財務諸表を共有する前に、口座番号、ルーティング番号、および取引の詳細を削除してください。
FOIA(情報公開法)の適用除外となる文書には、内容を完全に削除した上で、該当する文書に墨塗り処理を施し、公開された文書がフォレンジック検証に合格し、単純なコピー&ペーストによって適用除外情報が漏洩しないようにする。
サービスプロバイダー、家主、またはフォームから一部の情報のみを必要とする相手にメールで送信する前に、スキャンした書類から社会保障番号、生年月日、金融口座番号、署名を削除してください。
隠蔽と真の墨消しとの技術的な違いは目には見えないが、法廷、監査、データ漏洩調査においては決定的な違いとなる。
隠蔽と真の墨消しの決定的な違いは、コンテンツストリームのレベルにあります。標準的なPDFページにはコンテンツストリーム、つまりレンダリング装置に何を描画するかを指示する一連の命令があります。テキスト命令には、文字コード、位置、フォント参照が含まれます。LuraPDFが墨消しを処理する際、各ページのコンテンツストリームを解析し、レンダリング結果が墨消しボックスの座標内に収まるコンテンツ命令を特定し、それらの命令をストリームから削除して、代わりに塗りつぶされた黒い四角形を書き込みます。結果として、機密データ命令が削除され、塗りつぶされた黒い四角形に置き換えられたコンテンツストリームが作成されます。四角形の下には目に見えないテキスト文字はなく、ストリームのその領域には四角形だけがあります。
画像ベースの墨消しの場合、埋め込まれたラスター画像の墨消し領域内のピクセルデータは、画像ストリームが PDF に再エンコードされる前に、黒ピクセルで上書きされます。メタデータの場合、pdf-lib はドキュメント情報辞書フィールド (タイトル、著者、件名、作成者、プロデューサー) をクリアし、最新の PDF 作成ツールが埋め込む XMP メタデータ ストリームを削除します。パターン墨消しでは、テキスト抽出を使用してページ全体で一致するすべての文字列を検索し、テキスト位置データからバウンディング ボックスを計算し、処理前にそれらのバウンディング ボックスを自動的に墨消しキューに追加します。すべてはブラウザの JavaScript エンジンで実行されます。ファイル API は入力 PDF をメモリに配信し、墨消しロジックはコンテンツ ストリームをその場で変更し、Blob ダウンロード API はサニタイズされた出力をデバイスに配信します。ネットワーク リクエストによってドキュメントの一部が転送されることはありません。
| 特徴 | LuraPDF | セジダ | Adobe Acrobat |
|---|---|---|---|
| ブラウザ上で実行可能(アップロード不要) | はい | いいえ | いいえ |
| 真のコンテンツ削除(隠蔽ではない) | はい | はい | はい |
| メタデータの自動削除 | はい | 部分的 | はい |
| パターン修正付きで無料 | はい | 限定 | 有料のみ |
出力ファイルへの墨消し処理は元に戻せません。ダウンロード前にいくつかの確認手順を行うことで、機密情報の漏洩を防ぐことができます。
墨消しを適用する前に、必ず元のファイルの墨消しされていないバックアップを作成してください。墨消し操作はエクスポートされた文書に対して永続的に行われ、元に戻すことはできません。
社会保障番号、メールアドレス、口座番号などの繰り返しデータにはパターンマスキングを使用してください。手動で枠線を引くと、個別に確認していないページでは該当箇所を見落とす可能性があります。
墨消し済みのPDFをダウンロードしたら、別のPDFリーダーで開き、墨消しされた領域からテキストをコピー&ペーストしてみてください。ペーストが空白で返ってきた場合は、墨消しは本物です。
メタデータの削除をデフォルトで有効にする — 視覚的にきれいに墨消しされた文書でも、文書のプロパティから作成者、作成日、ソフトウェアのバージョンが明らかになることがある
機密性の高いテキストを塗りつぶすために、描画ツール、ハイライトツール、または塗りつぶし注釈を使用してはいけません。塗りつぶしはファイルに残っており、簡単な作業で抽出できてしまいます。
裁判所や規制当局に提出する文書については、管轄区域の特定の墨消し基準を確認してください。LuraPDFは真のコンテンツ削除を実行しますが、管轄区域のコンプライアンス要件は異なります。
ドキュメントはブラウザから一切出ません。基となるテキストは削除され、メタデータは消去され、存在しないデータは黒いボックスで埋められます。真の墨消し処理を、無料、即時、そしてプライベートに。