Dọn dẹp bản quét
Hãy loại bỏ các trang ngăn cách trống mà máy quét hàng loạt đã chèn vào giữa các phần của tài liệu trước khi lưu trữ hoặc chia sẻ.
Các file PDF thiếu nội dung gây lãng phí giấy, làm phình to dung lượng tệp đính kèm email và khiến người nhận bị ngập trong nội dung không liên quan. Một báo cáo được quét có các trang phân cách trống, một file PDF sách giáo khoa có các trang mẫu được đóng dấu bản quyền, một tài liệu được hợp nhất có các trang trùng lặp tại điểm nối — đây là những phiền toái thường gặp. Giải pháp là một công cụ loại bỏ trang giúp bạn xem tổng quan trực quan về từng trang, cho phép bạn nhanh chóng đánh dấu các trang không mong muốn và tạo ra một file đầu ra sạch sẽ chỉ chứa những nội dung quan trọng.
LuraPDF sử dụng pdf-lib để viết lại cây trang, bỏ qua các trang đã chọn. Các trang còn lại giữ nguyên định dạng byte so với bản gốc — không cần mã hóa lại. Trình phát hiện trang trống tự động sẽ hiển thị từng trang lên một khung vẽ nhỏ thông qua PDF.js và kiểm tra biểu đồ pixel để tìm sự chiếm ưu thế của màu trắng gần như tuyệt đối, đánh dấu các trang có khả năng trống để bạn xem xét. Bạn cần xác nhận trước khi xóa bất kỳ trang nào. Mọi thứ đều chạy trên trình duyệt của bạn — không cần tải lên, không có hình mờ và không cần tài khoản.
Bất cứ ai có thể loại bỏ nhiễu khỏi tài liệu đã quét, xóa các trang nhạy cảm hoặc làm sạch các tệp PDF đã hợp nhất trước khi phân phối.
Hãy loại bỏ các trang ngăn cách trống mà máy quét hàng loạt đã chèn vào giữa các phần của tài liệu trước khi lưu trữ hoặc chia sẻ.
Trước khi gửi, hãy loại bỏ trang bìa, phần cuối và phụ lục không liên quan đến người nhận cụ thể.
Cắt các trang mẫu có hình mờ và các trang nhắc mua hàng từ các file PDF xem trước sách giáo khoa được phân phối miễn phí.
Xóa các trang trùng lặp xuất hiện khi hợp nhất các tệp PDF từ các nguồn khác nhau có chung phần giới thiệu.
Hãy xóa bỏ những trang chứa thông tin cá nhân trước khi chia sẻ tài liệu lớn với đồng nghiệp hoặc khách hàng.
Loại bỏ các lỗi phát sinh khi hợp nhất — trang tiêu đề trống, tiêu đề trùng lặp và trang bị ngắt định dạng — sau khi kết hợp nhiều tệp PDF.
Xóa trang cục bộ trên trình duyệt nhanh hơn, an toàn hơn và trực quan hơn so với các trình chỉnh sửa PDF trên máy tính để bàn.
Cây trang của một tệp PDF là một cấu trúc liên kết — mỗi trang là một đối tượng độc lập được tham chiếu bằng chỉ mục trong cây. Xóa trang có nghĩa là loại bỏ các tham chiếu đó khỏi cây và ghi lại số trang mới. Các đối tượng trang còn lại hoàn toàn không bị ảnh hưởng. LuraPDF sử dụng pdf-lib để xác định chỉ mục của các trang bạn đã chọn, xây dựng lại cây trang mà không có các chỉ mục đó và tuần tự hóa tài liệu mới thành một Uint8Array trong bộ nhớ trình duyệt.
Chức năng tự động phát hiện trang trống hoạt động riêng biệt: PDF.js hiển thị mỗi trang trên một khung vẽ 100×141 pixel, và LuraPDF lấy mẫu giá trị pixel trên khung vẽ để tìm các trang có hơn 95% pixel gần màu trắng (RGB > 240). Các trang vượt quá ngưỡng đó sẽ được đánh dấu là có khả năng trống và được tô sáng trong lưới để bạn xem xét. Bạn xác nhận lựa chọn trước khi bất kỳ thao tác xóa nào diễn ra — nó sẽ không bao giờ tự động xóa mà không có sự chấp thuận của bạn.
| Tính năng | LuraPDF | tệp pdf nhỏ | Adobe Acrobat |
|---|---|---|---|
| Quét trang trắng tự động | Đúng | KHÔNG | KHÔNG |
| Nhập cú pháp phạm vi | Đúng | Một phần | Đúng |
| Chỉ trình duyệt / không tải lên | Đúng | KHÔNG | KHÔNG |
| Miễn phí không giới hạn | Đúng | Giới hạn | Trả |
Một vài thao tác tốt giúp ngăn ngừa mất dữ liệu ngoài ý muốn và tăng tốc các thao tác xóa dữ liệu lớn.
Sử dụng cú pháp phạm vi (2-5, 8, 11-13) để xóa tuần tự số lượng lớn — nhanh hơn nhiều so với việc nhấp vào từng hình thu nhỏ riêng lẻ.
Hãy điều chỉnh ngưỡng tự động phát hiện nếu nó bỏ sót một số trang gần như trống — mặc định là khá thận trọng để tránh kết quả sai.
Hãy nén tệp PDF sau khi xóa các tệp lớn để tận dụng tối đa kích thước tệp.
Trước tiên hãy sắp xếp lại các trang nếu chúng cũng không theo thứ tự — kết hợp việc xóa và sắp xếp lại trong cùng một quy trình làm việc.
Hãy giữ lại một bản sao của bản gốc — việc xóa là mất dữ liệu và các trang đã xóa không thể khôi phục từ bản sao lưu.
Nếu muốn lưu các trang đã 'xóa' vào một tệp riêng biệt, hãy sử dụng chức năng Trích xuất trang PDF.
Xóa các trang trống, phần bí mật và các phần ghép nối khỏi bất kỳ tệp PDF nào. Chỉ sử dụng trên trình duyệt, không làm giảm chất lượng, miễn phí. Đánh dấu các trang theo hình thu nhỏ hoặc phạm vi, xác nhận, tải xuống — xong.