ওয়েব প্রকাশক
বিদ্যমান পিডিএফ লাইব্রেরি—যেমন পণ্যের নির্দেশিকা, বার্ষিক প্রতিবেদন, কেস স্টাডি—এমন ওয়েব পেজে স্থানান্তর করুন যা সার্চ ইঞ্জিনগুলো ইন্ডেক্স করতে পারে এবং পাঠকরা লিঙ্ক করতে পারে।
পিডিএফ একটি প্রিন্ট ফরম্যাট; এইচটিএমএল একটি ওয়েব ফরম্যাট। যখন আপনার কন্টেন্ট একটি পিডিএফ-এ থাকে — যেমন একটি হোয়াইটপেপার, একটি প্রোডাক্ট স্পেক, বা একটি রিসার্চ রিপোর্ট — তখন তা সার্চ ইঞ্জিনগুলোর কাছে অদৃশ্য থাকে, পিডিএফ রিডার ছাড়া ফোনে দেখা অসম্ভব হয়, এবং সেকশন লেভেলে লিঙ্ক করা কঠিন হয়ে পড়ে। এটিকে এইচটিএমএল-এ রূপান্তর করলে কন্টেন্টটি গুগল দ্বারা ইনডেক্সযোগ্য, যেকোনো ডিভাইসে পাঠযোগ্য, যেকোনো হেডিং-এ লিঙ্কযোগ্য, এবং টেক্সট এডিটর আছে এমন যেকোনো ব্যক্তি দ্বারা সম্পাদনাযোগ্য হয়ে ওঠে। রূপান্তরের একটি মাত্র ধাপ আপনার পিডিএফ কন্টেন্টকে সমগ্র ওয়েবের জন্য উন্মুক্ত করে দেয়।
LuraPDF-এর PDF-to-HTML কনভার্টার PDF.js ব্যবহার করে সম্পূর্ণভাবে আপনার ব্রাউজারে চলে। এটি পজিশন ডেটা সহ টেক্সট এক্সট্র্যাক্ট করে, সঠিক HTML হেডিং লেভেল নির্ধারণের জন্য হেডিং-ডিটেকশন হিউরিস্টিকস প্রয়োগ করে এবং আপনার পছন্দ অনুযায়ী ছবি ইনলাইন বা এক্সট্র্যাক্ট করে। এর আউটপুট হলো পরিচ্ছন্ন, সিম্যান্টিক HTML5 — সার্ভার-সাইড টুলগুলো সাধারণত যে বিশাল ও CSS-ভারী জগাখিচুড়ি তৈরি করে, এটি তা নয়। আপনি এমন কোড পাবেন যা WordPress, Jekyll, একটি React কম্পোনেন্ট বা একটি সাধারণ .html ফাইলে পেস্ট করা যাবে এবং যেকোনো ব্রাউজার তা সঠিকভাবে রেন্ডার করতে পারবে।
ওয়েব প্রকাশক, ডেভেলপার, কন্টেন্ট টিম এবং শিক্ষাবিদ—সকলেই পিডিএফকে এইচটিএমএল-এ রূপান্তর করতে , যখন তাদের একটি নির্দিষ্ট ফাইল ফরম্যাটের পরিবর্তে ওয়েব-উপযোগী কন্টেন্টের প্রয়োজন হয়।
বিদ্যমান পিডিএফ লাইব্রেরি—যেমন পণ্যের নির্দেশিকা, বার্ষিক প্রতিবেদন, কেস স্টাডি—এমন ওয়েব পেজে স্থানান্তর করুন যা সার্চ ইঞ্জিনগুলো ইন্ডেক্স করতে পারে এবং পাঠকরা লিঙ্ক করতে পারে।
একটি শব্দও পুনরায় টাইপ না করে একটি হোয়াইটপেপার বা থট-লিডারশিপ পিডিএফকে ল্যান্ডিং পেজ, ব্লগ পোস্ট বা ইমেল নিউজলেটারে রূপান্তর করুন।
ডেভেলপার পোর্টাল বা অভ্যন্তরীণ উইকির জন্য পিডিএফ স্পেসিফিকেশন ডকুমেন্টগুলোকে এইচটিএমএল পেজে রূপান্তর করুন, তারপর একটি সামঞ্জস্যপূর্ণ চেহারার জন্য আপনার বিদ্যমান সিএসএস থিম প্রয়োগ করুন।
পিডিএফ হ্যান্ডআউট এবং লেকচার নোট ওয়েব পেজ হিসেবে প্রকাশ করুন, যাতে শিক্ষার্থীরা যেকোনো ডিভাইসে সেগুলো পড়তে, টেক্সটের মধ্যে অনুসন্ধান করতে এবং হাইপারলিংক অনুসরণ করে উৎসে যেতে পারে।
সংবেদনশীল নথি কোনো তৃতীয় পক্ষের সার্ভারে না পাঠিয়েই, সর্বজনীনভাবে দাখিলকৃত আদালতের নথি বা নিয়ন্ত্রক সংস্থার নথিপত্রকে অভ্যন্তরীণ অনুসন্ধান পোর্টালের জন্য HTML-এ রূপান্তর করুন।
দীর্ঘমেয়াদী ওয়েব অ্যাক্সেসযোগ্যতার জন্য একটি পিডিএফ আর্কাইভকে এইচটিএমএল-এ রূপান্তর করুন, যা নিশ্চিত করে যে এর বিষয়বস্তু ভবিষ্যতে পিডিএফ ভিউয়ারের পরিবর্তন সত্ত্বেও অক্ষত থাকবে এবং যেকোনো ব্রাউজারে পাঠযোগ্য থাকবে।
স্থানীয়ভাবে প্রক্রিয়াকরণ আপনাকে গোপনীয়তা, অর্থগত গুণমান এবং গতি প্রদান করে — কোনো সার্ভার কিউ-এর উপর নির্ভর না করেই।
LuraPDF প্রতিটি পৃষ্ঠার কন্টেন্ট স্ট্রিম পার্স করতে PDF.js ব্যবহার করে এবং টেক্সট আইটেমগুলোকে তাদের ইউনিকোড স্ট্রিং, ফন্ট সাইজ ও x/y পজিশনসহ বের করে আনে। একটি হেডিং-শনাক্তকরণ হিউরিস্টিক পুরো ডকুমেন্ট জুড়ে ফন্ট সাইজ তুলনা করে: সবচেয়ে বড় টেক্সটটি h1, তার পরেরটি h2, এবং এভাবে প্যারাগ্রাফ টেক্সট পর্যন্ত নির্ধারিত হয়। তালিকাগুলোকে সাধারণ বুলেট ক্যারেক্টার এবং ইনডেন্টেশন প্যাটার্ন দ্বারা চিহ্নিত করা হয়। PDF-এ এমবেড করা ছবিগুলোকে তাদের বাইনারি স্ট্রিম থেকে ডিকোড করা হয় এবং হয় সরাসরি HTML-এ বেস৬৪-এনকোড করা হয় অথবা HTML আউটপুটের পাশাপাশি আলাদা ইমেজ ফাইল হিসেবে লেখা হয়।
সংকলিত বিষয়বস্তু একটি স্ট্যান্ডার্ড HTML5 ডকুমেন্ট টেমপ্লেটে মোড়ানো থাকে, যার মধ্যে একটি ভিউপোর্ট মেটা ট্যাগ, একটি ন্যূনতম রেসপন্সিভ স্টাইলশীট এবং যথাযথ ক্যারেক্টারসেট ডিক্লারেশন অন্তর্ভুক্ত থাকে। যদি প্রতি-পৃষ্ঠা এক্সপোর্ট নির্বাচন করা হয়, তবে প্রতিটি পৃষ্ঠা তার নিজস্ব নম্বরযুক্ত HTML ফাইল তৈরি করে। আপনি যখন ডাউনলোড ক্লিক করেন, ব্রাউজার আউটপুটটিকে একটি Blob-এ সিরিয়ালাইজ করে এবং ফাইল ডাউনলোড শুরু করে — অথবা একাধিক ফাইল এক্সপোর্টের জন্য একটি ZIP আর্কাইভ তৈরি করে। এই প্রক্রিয়ার কোনো পর্যায়েই ব্রাউজার থেকে কোনো ডেটা বাইরে যায় না।
| বৈশিষ্ট্য | লুরাপিডিএফ | পিডিএফ২এইচটিএমএল | অ্যাডোবি অ্যাক্রোব্যাট |
|---|---|---|---|
| শুধুমাত্র ব্রাউজারে ব্যবহারযোগ্য / আপলোড করা যাবে না | হ্যাঁ | না | না |
| শব্দার্থিক HTML5 আউটপুট | হ্যাঁ | আংশিক | হ্যাঁ |
| ইনলাইন / নিষ্কাশিত ছবি | হ্যাঁ | আংশিক | হ্যাঁ |
| বিনামূল্যে, ফাইলের কোনো সীমা নেই | হ্যাঁ | সীমিত বিনামূল্যের স্তর | প্রদত্ত |
রূপান্তরের আগে ও পরের কয়েকটি বাছাইয়ের ফলে আরও পরিচ্ছন্ন HTML তৈরি হয়, যা রক্ষণাবেক্ষণ ও প্রকাশ করা সহজ।
প্রকাশ করার আগে, এক্সপোর্ট করার পর HTML ফাইলটিকে Prettier-এর মাধ্যমে চালান, যাতে ইন্ডেন্টেশন স্বাভাবিক হয় এবং কোনো বন্ধ না করা ট্যাগ থাকলে তা চিহ্নিত করা যায়।
হেডিংয়ের ক্রমবিন্যাস পর্যালোচনা করুন — হিউরিস্টিকটি ভালো, কিন্তু এটি একটি বড় পুল-কোটকে ভুলবশত হেডিং হিসেবে চিহ্নিত করতে পারে। প্রয়োজনে h ট্যাগগুলো ম্যানুয়ালি সমন্বয় করুন।
সাইট ইন্টিগ্রেশনের জন্য এক্সটার্নাল সিএসএস ব্যবহার করুন এবং শুধুমাত্র সরাসরি শেয়ার করা স্বতন্ত্র এক-পৃষ্ঠার ডকুমেন্টের জন্য ইনলাইন স্টাইল ব্যবহার করুন।
দীর্ঘমেয়াদী হোস্টিংয়ের জন্য যেকোনো ফাইলের ক্ষেত্রে base64-এর পরিবর্তে এক্সট্র্যাক্টেড ইমেজ বেছে নিন — এগুলো আকারে ছোট এবং CDN-ক্যাশেযোগ্য ইমেজ।
প্রকাশ করার আগে মোবাইল ব্রাউজারে আউটপুটটি পরীক্ষা করুন — উইন্ডোর আকার পরিবর্তন করুন অথবা রেসপন্সিভ লেআউটটি যাচাই করতে ডেভটুলস ব্যবহার করুন।
আপনার যদি ছবি বা স্টাইলিং ছাড়া শুধু টেক্সট প্রয়োজন হয়, তাহলে এর পরিবর্তে পিডিএফ টু টেক্সট ব্যবহার করুন — এটি দ্রুততর এবং তুলনামূলকভাবে হালকা আউটপুট দেয়।
কয়েক সেকেন্ডের মধ্যে আপনার PDF কন্টেন্টকে সার্চযোগ্য, লিঙ্কযোগ্য এবং মোবাইল-বান্ধব করে তুলুন। সিম্যান্টিক HTML5 আউটপুট, ইমেজ হ্যান্ডলিং অপশন, প্রতি-পৃষ্ঠা এক্সপোর্ট — এই সবকিছুই আপনার ব্রাউজারে চলে, কোনো সার্ভারে এক বাইটও না পাঠিয়ে। কোনো সাইনআপ নেই, কোনো ওয়াটারমার্ক নেই। আপনার PDF ফাইলটি ড্রপ করুন এবং ক্লিন HTML ডাউনলোড করুন।