개인 정보 보호를 중요하게 생각하는 분들은 공개적으로 공유하기 전에 이름을 삭제하세요.
이력서, 커뮤니티 문서, 포럼 첨부 파일 등 PDF 파일을 공개적으로 게시하면 파일 속성에 사용자의 전체 이름과 컴퓨터 사용자 이름이 포함됩니다. 개인 정보가 노출되지 않도록 하려면 업로드하기 전에 정보 태그와 XMP 태그를 모두 제거하세요.
PDF 파일을 공유할 때, 보이는 콘텐츠뿐만 아니라 훨씬 더 많은 정보가 함께 공유될 수 있습니다. 파일 안에는 사용자가 의식적으로 입력하지 않은 정보들이 포함되어 있습니다. 예를 들어 운영체제 사용자 계정의 이름, 사용한 애플리케이션과 버전, 문서가 처음 생성되고 마지막으로 수정된 정확한 날짜와 시간, 그리고 경우에 따라서는 수정 횟수까지 기록될 수 있습니다. 친구와 공유하는 개인적인 문서라면 문제가 되지 않지만, 입찰 제안서, 익명 제보, 법원 제출 서류, 또는 개인정보보호법(GDPR)의 적용을 받는 문서를 외부와 공유할 때는 이러한 정보 공개가 심각한 문제가 될 수 있습니다.
간과하기 쉬운 복잡한 문제는 PDF 파일에 메타데이터가 두 개의 별도 레이어로 저장된다는 점입니다. 하나는 모든 뷰어에서 접근할 수 있는 기존의 정보 사전이고, 다른 하나는 최신 도구에서 삽입하는 보다 상세한 XMP 패킷입니다. 대부분의 온라인 메타데이터 제거 도구는 파일 > 속성에서 확인할 수 있는 정보 사전만 삭제하고 XMP 패킷은 그대로 남겨둡니다. exiftool을 실행하거나 Acrobat의 고급 메타데이터 패널을 열어 '정리된' PDF 파일을 보면 전체 내용을 확인할 수 있습니다. LuraPDF는 파일을 서버로 전송하지 않고 브라우저에서 두 레이어 모두를 제거합니다.
메타데이터 제거는 보안 연구원만을 위한 것이 아닙니다. 의도치 않은 메타데이터 유출이 실질적인 위험을 초래하는 실제 업무 환경 6가지를 소개합니다.
이력서, 커뮤니티 문서, 포럼 첨부 파일 등 PDF 파일을 공개적으로 게시하면 파일 속성에 사용자의 전체 이름과 컴퓨터 사용자 이름이 포함됩니다. 개인 정보가 노출되지 않도록 하려면 업로드하기 전에 정보 태그와 XMP 태그를 모두 제거하세요.
법률 회사 메타데이터, 변호사 이름, 내부 문서 관리 시스템 태그가 포함된 법원 제출용 PDF 파일은 공개 대상이 될 수 있습니다. 상대방과 공개 기록에 귀사의 업무 흐름 및 인력에 대해 드러나는 정보를 제어하려면 제출 전에 메타데이터를 모두 정리하십시오.
PDF 형식으로 유출되거나 민감한 문서가 전달될 경우, 해당 문서를 다룬 모든 사람의 메타데이터가 포함됩니다. 언론인이 출판 전 문서를 정리하거나 정보 유출 전 정보원을 검증할 때는 Info와 XMP 모두를 제거해야 합니다. XMP 패킷에는 Info 전용 도구로는 전혀 파악할 수 없는 필드가 포함되어 있는 경우가 많기 때문입니다.
고객, 파트너 또는 공개 입찰 과정에 전송되는 PDF 파일에는 종종 작성 소프트웨어, 내부 작성자 이름 및 수정 이력이 노출됩니다. 전문적이고 브랜드 이미지를 유지하려면 외부 배포 전에 내부 메타데이터를 제거해야 합니다.
블라인드 평가 과정에서는 평가자가 문서의 내용만 볼 수 있고, 누가 작성하거나 편집했는지는 알 수 없습니다. 채점표와 평가 양식을 패널 위원들에게 배포하기 전에 작성자, 생성자 및 수정 시간 정보를 삭제하십시오.
정보공개 청구에 따라 공개된 문서에는 내부 작성자 신원, 시스템 이름, 편집 이력 등 문서 검열 도구로는 처리할 수 없는 세부 정보를 드러내는 메타데이터가 포함될 수 있습니다. 정보 메타데이터와 XMP 메타데이터를 모두 완전히 제거하는 것은 공개 전 적절한 검증 절차의 일부입니다.
대부분의 도구는 작업의 절반만 수행합니다. 메타데이터 제거가 의미를 가지려면 두 가지 계층 모두를 정리해야 하는 이유는 다음과 같습니다.
정보 사전은 PDF 파일의 맨 끝 부분, 즉 PDF 리더가 가장 먼저 파싱하는 부분에 저장된 사전 객체입니다. 여기에는 제목, 저자, 주제, 키워드, 생성자, 제작자, 생성 날짜, 수정 날짜와 같은 표준 필드가 포함됩니다. LuraPDF는 pdf-lib 라이브러리를 사용하여 이 트레일러 사전에 직접 접근하고, 선택한 키를 지운 후, 사전을 업데이트하거나 삭제한 새로운 PDF 파일을 생성합니다. 이는 표준 PDF 리더에서 파일 > 속성 메뉴를 통해 확인할 수 있는 정보 사전 레이어를 처리하는 방식입니다.
XMP 패킷은 좀 더 복잡합니다. PDF 내에 내장된 스트림 객체로, 확장 가능한 메타데이터 플랫폼(XMP) 사양을 따르는 XML 문서를 포함합니다. LuraPDF는 PDF의 객체 트리를 탐색하여 메타데이터 스트림을 찾고, XMP XML을 구문 분석한 후, 모든 관련 네임스페이스(Dublin Core(dc:creator, dc:title, dc:description), PDF 네임스페이스(pdf:Author, pdf:Keywords), XMPRights)에서 필드를 제거하거나 바꿉니다. InDesign이나 Acrobat과 같은 도구에서 추가한 사용자 지정 애플리케이션 네임스페이스도 삭제됩니다. 결과적으로 두 메타데이터 레이어가 모두 깨끗한 PDF가 생성됩니다.
| 특징 | 루라PDF | 세이다 / ilovepdf | 어도비 아크로뱃 |
|---|---|---|---|
| 정보 사전 필드를 지웁니다. | 예 - 모든 필드 | 예 | 예 |
| XMP 메타데이터 패킷을 지웁니다. | 예, 모든 네임스페이스 | 부분적 — 정보만 제공하는 경우가 많습니다. | 예 |
| 브라우저에서 파일을 처리합니다(업로드 없음). | 네, 완전히 현지에서 생산된 제품입니다. | 아니요 - 서버 업로드 필요 | 예, 설치된 소프트웨어입니다. |
| 워터마크 없이 무료 | 네, 언제나 무료입니다. | 제한된 기능 - 모든 기능을 사용하려면 비용을 지불해야 합니다. | 유료 구독 |
메타데이터 삭제는 간단하지만, 특히 업무상이나 민감한 상황에서는 어떤 정보도 누락되지 않도록 몇 가지 습관을 들이는 것이 중요합니다.
공유하기 전에 메타데이터를 제거하세요. 공유 후에 제거하면 안 됩니다. 수신자가 메타데이터가 포함된 파일을 이미 받았거나 캐시한 경우, 공유를 취소할 수 없습니다.
Redact PDF와 함께 사용하면 문서 전체를 완벽하게 정리할 수 있습니다. 메타데이터 제거는 파일 속성을 정리하고, 수정 기능은 보이는 페이지에서 민감한 콘텐츠를 제거합니다.
전문적인 맥락에서 '익명 작성자'와 '문서 편집자'와 같은 대체 값을 설정하세요. 이는 의도적인 것처럼 보이지만, 빈 칸은 숙련된 검토자에게는 부실한 작업으로 비춰질 수 있습니다.
수정 후 exiftool 또는 Acrobat을 사용하여 확인하세요. 수정된 PDF 파일을 열고 exiftool을 실행하여 정보(Info) 및 XMP 섹션에 의도한 내용만 남아 있는지 확인합니다.
편집 후에는 다시 한번 메타데이터를 제거해야 합니다. Acrobat, Word(PDF로 저장), LibreOffice와 같은 PDF 편집기는 저장할 때마다 메타데이터를 다시 추가하므로, 수정 주기가 끝날 때마다 제거 작업을 다시 실행해야 합니다.
PDF 평면화 기능과 함께 사용하면 주석 작성자 메타데이터를 제거할 수 있습니다. 평면화 기능은 주석을 정적 콘텐츠로 변환하여 문서 수준 메타데이터 제거에서 건드리지 않는 주석별 작성자 필드를 제거합니다.
PDF 파일을 드래그 앤 드롭하고, 포함된 내용을 검토한 후 공유하지 않을 필드를 제거하세요. 정보 사전과 XMP 패킷은 모두 브라우저에서 삭제되며, 아무것도 업로드할 필요가 없습니다. 계정도 필요 없고 워터마크도 없습니다.