Cách Xóa các Trang PDF: Trống, Trùng lặp hoặc Không mong muốn
Hướng dẫn thực tế để loại bỏ các trang trống, trùng lặp hoặc không mong muốn khỏi bất kỳ bản PDF nào, với hướng dẫn từng bước cho tài liệu quét, xóa trang bảo mật và kiểm tra sau khi xóa.

Không phải trang nào trong tệp PDF cũng thuộc về đó. Đôi khi bạn nhận được một tài liệu quét 40 trang trong khi chỉ có 35 trang thực sự chứa nội dung. Những lúc khác, bạn cần chia sẻ một báo cáo nhưng muốn loại bỏ trang có thông tin giá nội bộ trước khi nó đến tay khách hàng. Và thỉnh thoảng, bạn lại có các trang hóa đơn trùng lặp hoặc các phần bản nháp còn sót lại lẽ ra phải được xóa từ nhiều tuần trước.
Trong tất cả các trường hợp này, giải pháp không phải là chỉnh sửa văn bản hoặc xây dựng lại tài liệu từ đầu. Giải pháp chỉ đơn giản là xóa các trang bạn không cần, xuất một tệp sạch và tiếp tục công việc.
Hướng dẫn này đề cập chính xác cách thực hiện việc đó. Nó đi qua sự khác biệt giữa việc xóa trang và các thao tác PDF khác, giải thích khi nào xóa trang là cách tiếp cận đúng và hướng dẫn bạn từng bước cách loại bỏ các trang trống, trùng lặp hoặc không mong muốn khỏi bất kỳ bản PDF nào. Ở những nơi liên quan, nó cũng đề cập đến các cân nhắc về quyền riêng tư và cách xử lý các tài liệu quét.
Mục lục
- Việc xóa các trang khỏi PDF thực sự có nghĩa là gì
- Khi nào xóa trang là giải pháp đúng đắn
- Cách xóa các trang khỏi PDF từng bước
- Cách xóa các trang trống khỏi bản PDF
- Cách loại bỏ nhiều trang cùng một lúc
- Cách xóa các trang khỏi các bản PDF đã quét
- Loại bỏ các trang bảo mật hoặc nhạy cảm một cách an toàn
- Xóa trang so với cắt PDF so với biên tập PDF
- Những gì cần kiểm tra sau khi xóa trang
- Các ví dụ phổ biến
Việc xóa các trang khỏi PDF thực sự có nghĩa là gì
Trước khi đi sâu vào quy trình, việc hiểu chính xác thuật ngữ "xóa trang" có nghĩa là gì sẽ rất hữu ích, vì có một số thao tác PDF nghe có vẻ giống nhau nhưng lại thực hiện những việc rất khác nhau.
Xóa một trang và chỉnh sửa văn bản. Khi bạn xóa một trang, bạn loại bỏ toàn bộ trang đó khỏi tài liệu. Trang đó, bao gồm mọi thành phần trên đó (văn bản, hình ảnh, tiêu đề đầu trang, tiêu đề chân trang), sẽ biến mất khỏi tệp đầu ra. Mặt khác, chỉnh sửa văn bản sẽ sửa đổi những gì được viết trên một trang mà không xóa chính trang đó. Nếu bạn cần sửa một lỗi đánh máy hoặc cập nhật một ngày tháng, đó là chỉnh sửa. Nếu bạn cần loại bỏ toàn bộ một trang chứa các điều khoản lỗi thời, đó là xóa.
Xóa trang và biên tập (redacting) thông tin. Biên tập sẽ loại bỏ vĩnh viễn nội dung cụ thể trong một trang, chẳng hạn như tên, số tài khoản hoặc đoạn văn bảo mật, trong khi vẫn giữ nguyên bản thân trang đó. Sự khác biệt chính là phạm vi: xóa bỏ trang đó hoàn toàn; biên tập loại bỏ nội dung đã chọn khỏi một trang. Một điều đáng lưu ý nữa là việc biên tập, khi được thực hiện đúng cách, sẽ phá hủy dữ liệu cơ sở để không thể khôi phục được. Chỉ đơn giản là vẽ một khung đen đè lên văn bản trong trình chỉnh sửa PDF thì không phải là biên tập. Khung đen đó thường có thể bị loại bỏ bởi bất kỳ ai có một công cụ PDF cơ bản.
Xóa trang và trích xuất trang. Trích xuất là nghịch đảo của xóa. Khi bạn trích xuất, bạn chọn các trang bạn muốn giữ lại, và những trang đó được rút vào một tệp mới. Khi bạn xóa, bạn chọn các trang bạn muốn loại bỏ, và chúng sẽ bị bỏ khỏi bản gốc. Kết quả cuối cùng có thể giống hệt nhau, nhưng mô hình tư duy bị đảo ngược: một bên bắt đầu từ "giữ lại mọi thứ và trừ đi", trong khi bên kia bắt đầu từ "không có gì và thêm vào". Nếu bạn cần rút các trang cụ thể vào một tài liệu riêng biệt, bạn có thể thấy hướng dẫn của chúng tôi về cắt PDF theo phạm vi, các trang cụ thể hoặc kích thước tệp hữu ích hơn.
Khi nào xóa trang là giải pháp đúng đắn
Xóa trang không phải lúc nào cũng là cách tiếp cận tốt nhất, nhưng đối với một tập hợp các tình huống cụ thể, nó rõ ràng là giải pháp đúng đắn. Dưới đây là các kịch bản phổ biến nhất.
Các trang quét trống. Đây là một trong những lý do thường xuyên nhất khiến mọi người cần xóa các trang khỏi tệp PDF. Khi bạn quét một xấp tài liệu bằng máy quét duplex (hai mặt), máy sẽ chụp cả hai mặt của mỗi tờ giấy, ngay cả khi một mặt trống. Kết quả thường là một bản PDF rải rác những trang trống giữa những trang quan trọng. Điều này xảy ra vì hầu hết các máy quét hai mặt không phân biệt được mặt sau thực sự trống và một trang có nội dung thực tế. Các vết đục lỗ, các vết mờ mờ hoặc các hạt bụi đôi khi có thể đánh lừa tính năng phát hiện trang trống của chính máy quét, khiến nó vẫn bao gồm cả những trang trống đó.
Các trang trùng lặp. Các bản trùng lặp len lỏi vào khi cùng một tài liệu được quét hai lần, khi nhiều bản nháp được gộp lại, hoặc khi ai đó ghép các tệp mà không kiểm tra xem có bị chồng chéo hay không. Chẳng hạn, một bộ hóa đơn hàng tháng có thể kết thúc bằng hai bản sao kê tháng Giêng nếu việc ghép tệp được thực hiện một cách cẩu thả.
Phụ lục hoặc tài liệu đính kèm sai. Bạn nhận được một gói hợp đồng 60 trang nhưng nhận ra rằng bảng giá sai đã được đưa vào làm phụ lục. Thay vì tạo lại toàn bộ tài liệu, bạn xóa các trang sai và nếu cần, ghép các trang đúng trở lại.
Giá cả lỗi thời, các điều khoản cũ hoặc các trang nháp. Các tài liệu nội bộ thường tích tụ các phiên bản rác theo thời gian. Một đề xuất có thể vẫn bao gồm bảng giá của quý trước, hoặc một tài liệu chính sách có thể mang theo các phần bản nháp còn sót lại chưa bao giờ được hoàn thiện. Việc xóa những trang đó sẽ tạo ra một tệp sạch và hiện hành.
Các trang cá nhân hoặc bảo mật trước khi chia sẻ. Trước khi gửi một tài liệu ra bên ngoài, bạn có thể cần loại bỏ các trang chứa ghi chú nội bộ, chi tiết nhận dạng cá nhân, số liệu tiền lương hoặc thông tin nhạy cảm khác. Trong những tình huống này, việc xóa hoàn toàn trang đó là một cách tiếp cận đáng tin cậy hơn là cố gắng che đậy hoặc ẩn nội dung cụ thể trong trang.
Cách xóa các trang khỏi PDF từng bước
Quy trình thực tế rất đơn giản với một công cụ dựa trên trình duyệt. Dưới đây là quy trình thực tế trông như thế nào:
1. Tải lên PDF của bạn. Kéo và thả tệp hoặc duyệt để chọn tệp từ thiết bị của bạn. Các công cụ dựa trên trình duyệt như ToolsApex xử lý tệp trực tiếp trong trình duyệt của bạn, vì vậy tài liệu không được tải lên máy chủ từ xa.
2. Xem trước ảnh thu nhỏ của trang. Sau khi tệp tải xong, bạn sẽ thấy một lưới trực quan của mọi trang trong tài liệu. Đây là nơi bạn xác định xem trang nào cần phải loại bỏ. Hãy dành một chút thời gian để cuộn qua và xác nhận những gì bạn thấy.
3. Chọn các trang bạn muốn xóa. Nhấp vào từng ảnh thu nhỏ của trang để đánh dấu chúng để xóa. Hầu hết các công cụ cũng hỗ trợ chọn nhiều trang: giữ phím Shift để chọn một phạm vi các trang liên tiếp, hoặc sử dụng trường nhập phạm vi để nhập nội dung như "3-7, 12, 15" để chọn các trang và phạm vi cụ thể cùng một lúc.
4. Sử dụng "Tìm trang trống" nếu có. Một số công cụ, bao gồm cả công cụ Xóa trang PDF của ToolsApex, cung cấp tính năng tự động phát hiện trang trống. Tính năng này quét tài liệu và làm nổi bật các trang có vẻ trống, giúp bạn không phải cuộn thủ công qua một tệp dài để tìm từng trang một.
5. Xem xét và xuất. Trước khi hoàn tất, hãy kiểm tra lại lựa chọn của bạn. Nhìn vào bộ đếm hiển thị số lượng trang sẽ còn lại sau khi xóa. Khi bạn đã hài lòng, nhấp vào nút xóa. Công cụ sẽ tạo ra một bản PDF mới mà không có các trang đã chọn, sẵn sàng để tải xuống.
Cách xóa các trang trống khỏi bản PDF
Các trang trống là phiền toái phổ biến nhất trong các tài liệu quét, và chúng xứng đáng được chú ý cụ thể.
Tại sao máy quét tạo ra các trang trống. Như đã đề cập ở trên, máy quét hai mặt chụp cả hai mặt của mỗi tờ giấy. Nếu mặt sau trống, máy quét vẫn bao gồm cả nó. Tính năng phát hiện trang trống tích hợp của máy quét dựa trên các ngưỡng: nó đo tỷ lệ phần trăm pixel tối trên một trang hoặc kiểm tra kích thước tệp của trang. Nếu ngưỡng đó được thiết lập không chính xác, hoặc nếu trang có các vết nhỏ (vết đục lỗ, vết mực rơi, hạt bụi), máy quét sẽ coi đó là một trang không trống và bao gồm nó trong đầu ra.
Cách phát hiện các trang trống nhanh chóng. Trong một công cụ có tính năng xem trước ảnh thu nhỏ, các trang trống thường dễ dàng nhận dạng bằng mắt thường. Chúng xuất hiện dưới dạng các hình chữ nhật trắng hoặc gần trắng trong lưới. Đối với các tài liệu dài hơn (hơn 50 trang), việc sử dụng tính năng tự động "Tìm trang trống" hiệu quả hơn nhiều so với việc cuộn qua từng ảnh thu nhỏ.
Logic dọn dẹp hàng loạt. Nếu bạn thường xuyên quét tài liệu và kết thúc với các trang trống, hãy cân nhắc thiết lập một quy trình làm việc: quét, mở tệp trong công cụ xóa trang, chạy phát hiện trang trống, xem xét kết quả và xuất. Việc này mất chưa đầy một phút cho hầu hết các tài liệu và tạo ra đầu ra sạch sẽ nhất quán.
Xem xét cuối cùng trước khi xuất. Luôn cuộn qua tệp đã được làm sạch sau khi xóa các trang trống. Thỉnh thoảng, một trang trông có vẻ trống ở kích thước ảnh thu nhỏ có thể chứa một tiêu đề chân trang nhỏ nhưng quan trọng, số trang hoặc ghi chú mà bạn muốn giữ lại.
Cách loại bỏ nhiều trang cùng một lúc
Không phải tất cả các công việc xóa trang đều chỉ liên quan đến một trang duy nhất. Trong nhiều kịch bản thực tế, bạn cần loại bỏ vài trang, và làm từng trang một sẽ rất tẻ nhạt.
Xóa một trang duy nhất là trường hợp đơn giản nhất. Nhấp vào ảnh thu nhỏ của trang, xác nhận và xuất.
Xóa nhiều trang đã chọn cho phép bạn nhấp vào nhiều trang không liên tiếp. Ví dụ, bạn có thể chọn các trang 3, 7 và 14 riêng lẻ bằng cách nhấp vào từng trang.
Xóa một phạm vi trang dành cho các khối trang liên tiếp. Thay vì nhấp vào từng trang, bạn nhập một phạm vi như "5-12" vào trường nhập phạm vi, và tất cả tám trang sẽ được chọn cùng một lúc.
Quy trình làm việc Shift-select kết hợp những gì tốt nhất của cả hai. Nhấp vào trang 5, sau đó giữ phím Shift và nhấp vào trang 12 để chọn toàn bộ phạm vi từ 5 đến 12 trong một thao tác. Điều này đặc biệt hữu ích khi làm việc với các tài liệu dài mà việc cuộn qua các trang ở xa nhau là không thực tế.
Cách tiếp cận tốt nhất phụ thuộc vào việc bạn cần loại bỏ bao nhiêu trang và liệu chúng có được nhóm lại với nhau hay không. Đối với các trang xóa nằm rải rác, chọn nhiều trang là lý tưởng. Đối với các khối liên tục lớn, nhập phạm vi hoặc Shift-select sẽ nhanh hơn.
Cách xóa các trang khỏi các bản PDF đã quét
Các bản PDF đã quét mang lại một thách thức riêng biệt vì mỗi trang về cơ bản là một bức ảnh thay vì văn bản kỹ thuật số có cấu trúc. Điều này có một vài ý nghĩa thực tế đối với việc xóa trang.
Tại sao các bản PDF đã quét cần xem trước trực quan. Trong một bản PDF được tạo kỹ thuật số, đôi khi bạn có thể nhận dạng các trang qua nội dung văn bản hoặc tiêu đề của chúng. Trong một bản PDF đã quét, việc đó là không thể vì nội dung là một hình ảnh. Bạn cần nhìn thấy trang thực tế để biết có gì trên đó, điều này làm cho việc xem trước ảnh thu nhỏ trở nên thiết yếu.
Điều gì làm cho việc dọn dẹp trang quét trở nên khác biệt. Các trang quét có xu hướng có định dạng đồng nhất, lề tương tự và trọng lượng trực quan tương tự. Điều này làm cho việc phân biệt giữa hai trang trông gần như giống hệt nhau ở kích thước ảnh thu nhỏ trở nên khó khăn hơn. Hãy phóng to nếu công cụ của bạn hỗ trợ, hoặc dựa vào số trang được in trên tài liệu gốc để xác nhận lựa chọn của bạn.
Tại sao việc xem xét ảnh thu nhỏ ở đây quan trọng hơn. Với các tài liệu đã quét, không có tính năng "hoàn tác" theo nghĩa là bạn không thể khôi phục nội dung của một trang nếu bạn vô tình xóa nhầm trang (trừ khi bạn vẫn còn tệp gốc). Hãy dành thêm một chút thời gian để xác minh lựa chọn của bạn trước khi xuất.
Loại bỏ các trang bảo mật hoặc nhạy cảm một cách an toàn
Một trong những trường hợp sử dụng quan trọng nhất của việc xóa trang là chuẩn bị tài liệu để chia sẻ ra bên ngoài. Trước khi gửi một tệp cho khách hàng, nhà cung cấp, cơ quan quản lý hoặc đồng nghiệp, bạn có thể cần loại bỏ các trang chứa thông tin mà người nhận không nên thấy.
Chỉ chia sẻ những trang mà ai đó nên thấy. Một gói thu mua có thể chứa 40 trang, nhưng nhà thầu phụ chỉ cần phạm vi công việc (trang 14 đến trang 22). Thay vì gửi toàn bộ tệp và hy vọng họ bỏ qua phần còn lại, hãy xóa những trang mà họ không nên có quyền truy cập và gửi một tài liệu tập trung, sạch sẽ.
Tại sao xóa một trang khác với việc ẩn nội dung. Nếu bạn cần loại bỏ toàn bộ một trang chứa thông tin nhạy cảm, xóa trang là cách tiếp cận đúng. Nếu bạn cần loại bỏ các từ, con số hoặc đoạn văn cụ thể trong một trang trong khi vẫn giữ phần còn lại của trang hiển thị, việc đó đòi hỏi biên tập (redaction), không phải xóa bỏ. Đừng nhầm lẫn giữa hai việc này. Vẽ một hình chữ nhật đen đè lên văn bản trong một trình chỉnh sửa PDF cơ bản không được coi là biên tập. Văn bản bên dưới thường có thể bị sao chép, tìm kiếm hoặc trích xuất bởi bất kỳ ai có các công cụ tiêu chuẩn.
Kiểm tra an toàn cuối cùng trước khi gửi bản PDF mới. Sau khi xóa các trang, hãy mở tệp đã xuất và cuộn qua toàn bộ tài liệu. Xác nhận rằng các trang nhạy cảm thực sự đã biến mất và các trang còn lại theo đúng thứ tự. Đặt tên tệp rõ ràng (ví dụ: "hop-dong-chi-pham-vi.pdf" thay vì "ban-cuoi-v3.pdf") để người nhận biết họ đang xem cái gì.
Xóa trang so với cắt PDF so với biên tập PDF
Ba thao tác này có liên quan đến nhau nhưng phục vụ các mục đích khác nhau. Việc hiểu rõ ranh giới giúp bạn chọn đúng công cụ.
Xóa loại bỏ hoàn toàn các trang đã chọn khỏi một bản PDF. Đầu ra là một tệp duy nhất với ít trang hơn bản gốc. Nếu bạn cần xóa các trang 5 và 6 khỏi một tài liệu 20 trang, bạn sẽ có một tệp 18 trang.
Cắt (Split) chia một bản PDF thành nhiều tệp riêng biệt. Nếu bạn cắt một tài liệu 20 trang tại trang 10, bạn sẽ có hai tệp: một tệp từ trang 1 đến trang 10, và một tệp khác từ trang 11 đến trang 20. Việc cắt tệp hữu ích khi bạn muốn chia một tài liệu dài thành các phần để phân phối. Công cụ Cắt PDF của chúng tôi hỗ trợ cắt theo phạm vi, theo trang cụ thể và theo kích thước tệp.
Biên tập (Redact) che khuất hoặc loại bỏ vĩnh viễn nội dung cụ thể trong một trang, chẳng hạn như số An sinh Xã hội, số dư tài khoản hoặc tên một người. Bản thân trang đó vẫn nằm trong tài liệu, nhưng nội dung nhạy cảm đã bị phá hủy. Việc biên tập được điều chỉnh bởi các yêu cầu nghiêm ngặt theo đặc tả ISO 32000 vì nội dung biên tập không đúng cách có thể bị khôi phục.
Nếu mục tiêu của bạn là loại bỏ toàn bộ các trang khỏi một tài liệu, xóa trang là sự lựa chọn đúng đắn. Nếu mục tiêu của bạn là chia nhỏ một tài liệu thành các phần, hãy sử dụng tính năng cắt tệp. Nếu mục tiêu của bạn là ẩn nội dung cụ thể trên một trang trong khi vẫn giữ lại trang đó, hãy sử dụng tính năng biên tập.
Những gì cần kiểm tra sau khi xóa trang
Sau khi xuất bản PDF đã dọn dẹp, hãy chạy qua danh sách kiểm tra nhanh này trước khi chia sẻ hoặc lưu trữ tệp.
Thứ tự trang. Xác nhận rằng các trang còn lại theo đúng trình tự. Thỉnh thoảng, việc xóa các trang ở giữa một tài liệu có thể tạo cảm giác như thiếu một thứ gì đó nếu bạn không cẩn thận.
Thiếu các trang bắt buộc. Hãy chắc chắn rằng bạn không vô tình xóa mất một trang bạn cần. Điều này đặc biệt quan trọng với các tài liệu quét hoặc tệp dài mà các trang trông giống nhau ở kích thước ảnh thu nhỏ.
Tính đầy đủ của tài liệu đính kèm. Nếu bản PDF bao gồm các phụ lục, kèm theo hoặc vật trưng bày, hãy xác minh rằng tất cả các đính kèm bắt buộc vẫn còn đó sau khi dọn dẹp.
Đặt tên tệp. Đổi tên tệp đã xuất để phản ánh trạng thái mới của nó. "Bao-cao-ban-cuoi-da-don-dep.pdf" hữu ích hơn nhiều so với "Bao-cao (1).pdf" khi bạn xem lại tệp sau ba tuần.
Kiểm soát phiên bản. Giữ tệp gốc trong trường hợp bạn cần quay lại. Đừng bao giờ ghi đè lên bản sao duy nhất của tài liệu nguồn. Lưu trữ nó trong một thư mục được dán nhãn rõ ràng để bạn có thể quay lại nếu cần.
Các ví dụ phổ biến
Loại bỏ các trang trống khỏi một bản quét 40 trang. Bạn quét một tài liệu 20 tờ bằng máy quét hai mặt. Đầu ra là 40 trang, nhưng khoảng một nửa là trống. Mở tệp, chạy phát hiện trang trống tự động, xem xét các trang được làm nổi bật và xuất. Kết quả: một tài liệu 20 trang sạch sẽ.
Xóa một trang bảo mật khỏi báo cáo. Báo cáo hàng quý của bạn bao gồm một trang có các thông số lương nội bộ ở trang 9. Trước khi chia sẻ với hội đồng quản trị, bạn xóa trang 9 và xuất một tệp mới chỉ chứa thông tin mà hội đồng nên thấy.
Xóa các trang hóa đơn trùng lặp. Bạn đã ghép mười hai hóa đơn hàng tháng vào một bản PDF, nhưng hóa đơn tháng Ba xuất hiện hai lần vì nó được đưa vào trong hai thư mục nguồn khác nhau. Xóa bản trùng lặp, xác nhận số lượng trang và xuất.
Dọn dẹp hộ chiếu, sao kê ngân hàng hoặc bộ tài liệu KYC. Khi tập hợp một bộ tài liệu nhận dạng và tài chính để xin visa hoặc vay vốn, bạn có thể kết thúc với các trang thừa: sao kê cũ, bản quét ID sai hoặc các trang giữ chỗ. Xóa những trang không thuộc về bộ hồ sơ, xác minh bộ cuối cùng và nộp một gói hồ sơ bóng bẩy.

