১০০% ব্যক্তিগততাৎক্ষণিক প্রক্রিয়াকরণচিরকালের জন্য বিনামূল্যে

ওসিআর পিডিএফ অনলাইন — বিনামূল্যে, শুধুমাত্র ব্রাউজারে ব্যবহারযোগ্য, ১০০টিরও বেশি ভাষা

এক বাইটও আপলোড না করে স্ক্যান করা পিডিএফকে অনুসন্ধানযোগ্য টেক্সট পিডিএফে রূপান্তর করুন। টেসারেক্ট WASM সরাসরি আপনার ব্রাউজারে OCR চালায়। ১০০টিরও বেশি ভাষা, কোনো সার্ভার নেই, কোনো সাইনআপের প্রয়োজন নেই।

স্ক্যান করা পিডিএফ ফাইলগুলো আপলোড না করেই অনুসন্ধানযোগ্য করে তুলুন

স্ক্যান করা পিডিএফ হলো একটি ডকুমেন্টের ছবি। এটি দেখতে টেক্সটের মতো, কিন্তু এর ভেতরে কোনো আসল টেক্সট ডেটা থাকে না — থাকে শুধু পিক্সেলের একটি ম্যাট্রিক্স। এতে সার্চ কাজ করে না। কপি এবং পেস্ট ব্যর্থ হয়। পিডিএফ রিডার এটি ইনডেক্স করতে পারে না। টেক্সট এক্সট্র্যাকশন টুলগুলো খালি ফলাফল দেখায়। এর সমাধান হলো অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR): এটি এমন একটি প্রক্রিয়া যা প্রতিটি পৃষ্ঠার পিক্সেল প্যাটার্ন পড়ে, অক্ষর শনাক্ত করে এবং টেক্সটটি পুনর্গঠন করে। LuraPDF-এ Tesseract—বিশ্বের সবচেয়ে বহুল ব্যবহৃত ওপেন-সোর্স OCR ইঞ্জিন, যা গুগল দ্বারা পরিচালিত—একটি WebAssembly বাইনারি হিসেবে এমবেড করা থাকে, যা সরাসরি আপনার ব্রাউজার ট্যাবের ভেতরে চলে। ইঞ্জিনটি একবার ডাউনলোড হয় এবং তারপর আপনার ডকুমেন্টটি সম্পূর্ণরূপে আপনার ডিভাইসেই প্রসেস করে। কোনো ফাইল আপলোড, সার্ভার এপিআই কল বা রিমোট প্রসেসিংয়ের প্রয়োজন নেই। আপনার স্ক্যান করা ট্যাক্স রিটার্ন, স্বাক্ষরিত চুক্তি, রোগীর রেকর্ড বা ঐতিহাসিক ডকুমেন্ট কখনোই আপনার মেশিন থেকে বাইরে যায় না।

সার্ভার-ভিত্তিক বিকল্পগুলোর চেয়ে ব্রাউজার-ভিত্তিক OCR বেছে নেওয়ার প্রধান কারণ হলো গোপনীয়তা। স্ক্যান করা নথিগুলো তুলনামূলকভাবে বেশি সংবেদনশীল হয়: মানুষ ট্যাক্স রিটার্ন, মেডিকেল রেকর্ড, আইনি নথিপত্র, ব্যাংক স্টেটমেন্ট এবং পরিচয়পত্র স্ক্যান করে থাকে। এগুলোকে কোনো ক্লাউড OCR API-তে আপলোড করার অর্থ হলো—এমনকি যদি সেটির একটি গোপনীয়তা নীতিও থাকে—ফাইলটি ইন্টারনেটের মাধ্যমে পরিবাহিত হয়, একটি সার্ভারে থাকে, প্রসেসিং পাইপলাইনের মধ্যে দিয়ে যায় এবং আপনার নিয়ন্ত্রণের বাইরের বিভিন্ন উপায়ে সাময়িকভাবে সংরক্ষিত হয়। LuraPDF-এর আর্কিটেকচার কাঠামোগতভাবেই এই ঝুঁকি দূর করে। Tesseract WASM বাইনারিটি আপনার ব্রাউজারের ভেতরে একটি স্যান্ডবক্সড ওয়েব ওয়ার্কারে চলে। একমাত্র যে ডেটাটি স্থানান্তরিত হয় তা হলো OCR করা টেক্সট লেয়ার, যা মেমোরিতে একটি PDF-এ পুনরায় লেখা হয়—সম্পূর্ণ স্থানীয়ভাবে। এর আউটপুট হলো একটি সার্চযোগ্য PDF, যেখানে মূল পৃষ্ঠার ছবিটি হুবহু সংরক্ষিত থাকে এবং এর নিচে একটি অদৃশ্য টেক্সট লেয়ার যুক্ত হয়, যা Tesseract দ্বারা চিহ্নিত অক্ষরের অবস্থানগুলোর সাথে নিখুঁতভাবে মিলে যায়।

অনলাইনে একটি PDF-এ কীভাবে OCR চালাবেন

1

আপনার স্ক্যান করা পিডিএফ আপলোড করুন

স্ক্যান করা বা ছবি-ভিত্তিক পিডিএফ ফাইলটি আপলোড করার জায়গায় রাখুন। ফাইলটি ব্রাউজারের মেমরিতে লোড হয়ে যায় — কোনো সার্ভারে কিছু পাঠানো হয় না। একাধিক পৃষ্ঠার স্ক্যান করা ডকুমেন্ট, বই এবং আর্কাইভের রেকর্ড সবই LuraPDF দ্বারা আরোপিত কোনো পৃষ্ঠাসীমা ছাড়াই কাজ করে।

2

ভাষা(গুলি) নির্বাচন করুন

ভাষা নির্বাচক থেকে ডকুমেন্টের প্রধান ভাষাটি বেছে নিন। বহুভাষিক ডকুমেন্টের ক্ষেত্রে—যেমন ইংরেজি ও ফরাসি উভয় অংশসহ কোনো চুক্তি, বা জার্মান উদ্ধৃতিসহ কোনো অ্যাকাডেমিক গবেষণাপত্র—সব প্রাসঙ্গিক ভাষা নির্বাচন করুন। টেসারেক্ট নির্বাচিত সমস্ত স্ক্রিপ্ট জুড়ে অক্ষর শনাক্ত করতে সম্মিলিত ভাষা মডেল ব্যবহার করে।

3

গুণমানের পছন্দ নির্ধারণ করুন

স্পিড মোড (দ্রুততর, কিছুটা কম নির্ভুল, পরিষ্কার আধুনিক ফন্ট স্ক্যানের জন্য ভালো) এবং অ্যাকুরেসি মোড (ধীরগতির, সম্পূর্ণ টেসারেক্ট এলএসটিএম ইঞ্জিন, নিম্নমানের স্ক্যান, ঐতিহাসিক ফন্ট এবং অ-ল্যাটিন স্ক্রিপ্টের জন্য প্রস্তাবিত) এর মধ্যে বেছে নিন। অ্যাকুরেসি মোড প্রতিটি পৃষ্ঠার জন্য সম্পূর্ণ নিউরাল নেটওয়ার্ক মডেলটি চালায়।

4

টেক্সট লেয়ারের প্রিভিউ দেখুন

OCR সম্পন্ন হওয়ার পর, নির্ভুলতা যাচাই করার জন্য মূল পৃষ্ঠার পাশে শনাক্ত করা লেখাটি প্রিভিউ করুন। টেসারেক্ট প্রতিটি শনাক্ত করা শব্দের বাউন্ডিং বক্স হাইলাইট করে — এর ফলে আপনি ডাউনলোড করার আগেই নিম্নমানের স্ক্যান অঞ্চলের ত্রুটিগুলো চিহ্নিত করতে পারেন।

5

অনুসন্ধানযোগ্য পিডিএফ ডাউনলোড করুন

ডাউনলোড-এ ক্লিক করুন। pdf-lib, Tesseract দ্বারা চিহ্নিত প্রতিটি অক্ষরের সঠিক অবস্থানে প্রতিটি পৃষ্ঠার উপর একটি অদৃশ্য টেক্সট লেয়ার লিখে দেয়। এর আউটপুট হলো একটি সাধারণ অনুসন্ধানযোগ্য পিডিএফ — ছবিটি অক্ষত থাকে এবং এতে Ctrl+F, কপি, সিলেক্ট ও ফুল-টেক্সট ইন্ডেক্সিং সবই কাজ করে।

১০০% ব্যক্তিগত — স্থানীয় ওসিআর

টেসারেক্ট WASM আপনার ব্রাউজার ট্যাবের ভেতরে একটি স্যান্ডবক্সড ওয়েব ওয়ার্কারে চলে। আপনার স্ক্যান করা ডকুমেন্ট কখনোই আপনার ডিভাইস থেকে বের হয় না — কোনো আপলোড, কোনো সার্ভার এপিআই, বা কোনো অস্থায়ী ক্লাউড স্টোরেজের প্রয়োজন হয় না। স্ক্যান করা আর্থিক, আইনি এবং চিকিৎসা সংক্রান্ত ডকুমেন্টের জন্য এটিই হলো অপরিহার্য গোপনীয়তার নিশ্চয়তা।

টেসেরাক্ট WASM — ১০০টিরও বেশি ভাষা

লুরাপিডিএফ গুগলের টেসারেক্ট ওসিআর ইঞ্জিনের ওয়েবঅ্যাসেম্বলি পোর্ট টেসারেক্ট.জেএস ব্যবহার করে। এতে ল্যাটিন, সিরিলিক, আরবি, চীনা (সরলীকৃত ও প্রথাগত), জাপানি, কোরিয়ান, হিব্রু, হিন্দি সহ ১০০টিরও বেশি ভাষার মডেল উপলব্ধ রয়েছে। মিশ্র লিপির ডকুমেন্টের জন্য একাধিক ভাষা নির্বাচন করুন।

অনুসন্ধানযোগ্য পিডিএফ আউটপুট

আউটপুটটি মূল স্ক্যান করা পৃষ্ঠার ছবিগুলোকে হুবহু অক্ষুণ্ণ রাখে এবং সঠিক অক্ষরের অবস্থানে একটি অদৃশ্য টেক্সট লেয়ার যোগ করে। এর ফলে একটি অনুসন্ধানযোগ্য পিডিএফ তৈরি হয় — Ctrl+F চাপলে শব্দ খুঁজে পাওয়া যায়, টেক্সট নির্বাচন ও কপি করা যায় এবং ডকুমেন্ট ম্যানেজমেন্ট সিস্টেমগুলো এটিকে ইনডেক্স করতে পারে।

শুধুমাত্র টেক্সট রপ্তানির বিকল্প

অনুসন্ধানযোগ্য পিডিএফ আউটপুটের পাশাপাশি, লুরাপিডিএফ ওসিআর করা মূল টেক্সটকে একটি সাধারণ .txt ফাইল হিসেবেও এক্সপোর্ট করতে পারে। শনাক্তকৃত টেক্সটকে পরবর্তী টুলগুলোতে—যেমন ওয়ার্ড প্রসেসর, এনএলপি পাইপলাইন, অনুবাদ টুল বা স্প্রেডশিট ইম্পোর্টে—ব্যবহারের জন্য এটি বেশ উপযোগী।

মূল বিন্যাস অক্ষুণ্ণ রাখে

মূল পৃষ্ঠার ছবিটি অপরিবর্তিত থাকে। টেসারেক্টের বাউন্ডিং বক্স ডেটা প্রতিটি শনাক্তকৃত অক্ষরকে পৃষ্ঠার উপর তার পিক্সেল অবস্থানে ম্যাপ করে — অদৃশ্য টেক্সট লেয়ারটি ঠিক সেই স্থানাঙ্কেই স্থাপন করা হয়। প্রতিটি পৃষ্ঠার দৃশ্যমান রূপ মূল স্ক্যানের মতোই হুবহু একই থাকে।

বিনামূল্যে, কোনো সাইনআপ নেই, কোনো ওয়াটারমার্ক নেই

কোনো অ্যাকাউন্ট নেই, দৈনিক পৃষ্ঠার কোনো সীমা নেই, অনুসন্ধানযোগ্য পিডিএফ আউটপুটে কোনো ওয়াটারমার্ক নেই। যেকোনো আধুনিক ব্রাউজার থেকে স্ক্যান করা ডকুমেন্টে যতবার প্রয়োজন ততবার ওসিআর (OCR) চালান। বড় ডকুমেন্টের ক্ষেত্রে গতি কম, কিন্তু এর কোনো সীমা নেই।

কারা LuraPDF OCR PDF ব্যবহার করে

প্রতিটি শিল্পেই স্ক্যান করা পিডিএফ ফাইল জমা হতে থাকে। ওসিআর সেগুলোকে ব্যবহারযোগ্য করে তোলে। এখানে এমন কিছু কর্মপ্রবাহের কথা বলা হলো, যেখানে স্থানীয় ও ব্যক্তিগত ওসিআর-ই একমাত্র গ্রহণযোগ্য পদ্ধতি।

আইনি দলসমূহ — স্ক্যান করা চুক্তিগুলো অনুসন্ধানযোগ্য করুন

সম্পাদিত চুক্তি, দলিল এবং আদালতের নথি প্রায়শই স্ক্যান করে ইমেজ পিডিএফ হিসেবে সংরক্ষণ করা হয়। গোপনীয় আইনি নথি কোনো ক্লাউড সার্ভিসে আপলোড না করেই, ডকুমেন্ট ম্যানেজমেন্ট সিস্টেমে প্রতিটি ধারা অনুসন্ধানযোগ্য করতে সেগুলোকে স্থানীয়ভাবে ওসিআর (OCR) করুন।

আর্কাইভিস্টরা — ঐতিহাসিক নথি ডিজিটাইজ করেন

গ্রন্থাগার, আর্কাইভ এবং বংশবৃত্তান্ত গবেষকরা ঐতিহাসিক সংবাদপত্র, চিঠি, খাতা এবং পাণ্ডুলিপি স্ক্যান করেন। টেসারেক্ট ঐতিহাসিক ল্যাটিন ফন্ট এবং অ-প্রমিত অক্ষর সেট সমর্থন করে। ভঙ্গুর ঐতিহাসিক উপাদান কোনো তৃতীয় পক্ষের সার্ভারে প্রেরণ না করেই শতবর্ষ-পুরোনো নথিগুলোকে অনুসন্ধানযোগ্য করতে ওসিআর (OCR) চালান।

গবেষকরা — স্ক্যান করা একাডেমিক গবেষণাপত্র অনুসন্ধান করেন।

প্রাক-ডিজিটাল একাডেমিক পেপার, কনফারেন্স কার্যবিবরণী এবং জার্নাল স্ক্যান ডিফল্টরূপে অনুসন্ধানযোগ্য নয়। Ctrl+F অনুসন্ধান, টীকা সংযোজন, উদ্ধৃতি নিষ্কাশন এবং রেফারেন্স ম্যানেজমেন্ট টুলে তথ্য প্রদানের জন্য এগুলিকে OCR করুন।

হিসাবরক্ষক — স্ক্যান করা রসিদ থেকে সংখ্যা বের করুন

স্ক্যান করা খরচের রসিদ এবং ইনভয়েসগুলিতে টাকার পরিমাণ, তারিখ এবং বিক্রেতার নাম ছবির পিক্সেলের মধ্যে আবদ্ধ থাকে। ওসিআর (OCR) সেগুলোকে অনুসন্ধানযোগ্য ও নির্বাচনযোগ্য টেক্সটে রূপান্তরিত করে — যা অ্যাকাউন্টিং সফটওয়্যারে কপি-পেস্ট করতে বা পরবর্তী পর্যায়ে ডেটা নিষ্কাশন করতে সক্ষম করে।

চিকিৎসা দল — স্ক্যান করা রোগীর রেকর্ড ডিজিটাইজ করুন

পুরোনো রোগীর রেকর্ড, রেফারেল লেটার এবং ক্লিনিক্যাল ফর্ম স্ক্যান হিসেবে আসে। সুরক্ষিত স্বাস্থ্য তথ্য (Protected health information) এতটাই সংবেদনশীল যে তা ক্লাউড ওসিআর এপিআই-তে (cloud OCR API) আপলোড করা যায় না। রেকর্ডগুলোকে অনুসন্ধানযোগ্য করতে এবং পিএইচআই (PHI) প্র্যাকটিসের ডিভাইসেই রাখতে স্থানীয়ভাবে ওসিআর (OCR) চালান।

ডেভেলপারগণ — এনএলপি পাইপলাইনের জন্য টেক্সট লেয়ার যোগ করুন

ডকুমেন্ট ইন্টেলিজেন্স পাইপলাইন, যা এনটিটি নিষ্কাশন করে, বিষয়বস্তু শ্রেণীবদ্ধ করে বা পিডিএফ ডকুমেন্টের সারসংক্ষেপ তৈরি করে, সেগুলোর কাজ করার জন্য একটি টেক্সট লেয়ার প্রয়োজন। বাহ্যিক এপিআই-এর কাছে ডকুমেন্টের ডেটা প্রকাশ না করেই, স্থানীয়ভাবে Tesseract WASM ব্যবহার করে স্ক্যান করা পিডিএফ-এর ওসিআর (OCR) করে অনুসন্ধানযোগ্য পিডিএফ অথবা কাঁচা টেক্সট ফাইল তৈরি করা হয়, যা এনএলপি (NLP) মডেলগুলোতে ফিড করা হয়।

ব্রাউজার-ভিত্তিক OCR কেন ব্যবহার করবেন

ব্রাউজারে থাকা Tesseract WASM গবেষণালব্ধ OCR নির্ভুলতার সাথে স্থানীয় প্রক্রিয়াকরণের গোপনীয়তার নিশ্চয়তাকে একত্রিত করে। এই সমন্বয়ের ফলে যা যা পাওয়া যায়, তা নিচে দেওয়া হলো।

  • ব্যক্তিগত তথ্য—যেমন এসএসএন, অ্যাকাউন্ট নম্বর, ডাক্তারি রোগ নির্ণয়—যুক্ত স্ক্যান করা নথি কখনোই আপলোড করা হয় না এবং তা কখনো কারো হাতে পড়া বা সার্ভার-সাইডে তথ্য ফাঁসের ঝুঁকিতে থাকে না।
  • একটিমাত্র টুলেই ১০০টিরও বেশি ল্যাঙ্গুয়েজ মডেল পাওয়া যায়, যা ল্যাটিন, সিরিলিক, আরবি, সিজেক, দেবনাগরী, হিব্রুসহ বিশ্বের প্রধান প্রধান লিপিগুলোকে অন্তর্ভুক্ত করে এবং এর জন্য আলাদা কোনো ভাষা কেনার প্রয়োজন হয় না।
  • অনুসন্ধানযোগ্য আউটপুটের অর্থ হলো, OCR করার সাথে সাথেই Ctrl+F, টেক্সট সিলেকশন, কপি-পেস্ট এবং ফুল-টেক্সট ইন্ডেক্সিং সবই কাজ করে — স্ক্যান করা ডকুমেন্টটি একটি জন্মগত ডিজিটাল PDF-এর মতোই আচরণ করে।
  • মূল পৃষ্ঠার ছবিটি হুবহু সংরক্ষিত থাকে — OCR একটি টেক্সট লেয়ার যোগ করে, এটি দৃশ্যমান বিষয়বস্তুকে পরিবর্তন বা পুনরায় রেন্ডার করে না। স্ক্যান করার আগে ও পরে পৃষ্ঠাগুলো দেখতে একই রকম হয়।
  • WebAssembly-এর উন্নত পারফরম্যান্সের কারণে আধুনিক ডেস্কটপ ব্রাউজারগুলোতে Tesseract প্রায় নেটিভ গতিতে চলে — সম্পূর্ণ অ্যাকুরেসি মোডে প্রতি পৃষ্ঠার সাধারণ থ্রুপুট হলো ৫–১৫ সেকেন্ড।
  • কোনো দৈনিক কোটা বা পৃষ্ঠাসীমা ছাড়াই বিনামূল্যে — কোনো অতিরিক্ত খরচ ছাড়াই ৫০০ পৃষ্ঠার স্ক্যান করা বই বা একটি রসিদ OCR করুন।

লুরাপিডিএফ কীভাবে পিডিএফ ফাইলগুলিতে ওসিআর চালায়

আপনি যখন একটি স্ক্যান করা পিডিএফ আপলোড করেন, তখন pdf.js প্রতিটি পৃষ্ঠাকে একটি HTML ক্যানভাসে ২০০ ডিপিআই (DPI) টার্গেট রেজোলিউশনে রেন্ডার করে (অ্যাকুরেসি মোডের জন্য ৩০০ ডিপিআই পর্যন্ত কনফিগারযোগ্য)। ক্যানভাসের ইমেজ ডেটা একটি SharedArrayBuffer-এর মাধ্যমে নির্বাচিত LSTM ল্যাঙ্গুয়েজ মডেলগুলো চালিত একটি Tesseract.js ওয়েব ওয়ার্কারে স্থানান্তরিত হয়। Tesseract পৃষ্ঠাটিকে টেক্সট অঞ্চলে বিভক্ত করার জন্য লেআউট বিশ্লেষণ করে, তারপর অক্ষরের ক্রম শনাক্ত করার জন্য প্রতিটি অঞ্চলে LSTM নিউরাল নেটওয়ার্ক প্রয়োগ করে। এর আউটপুট হলো শব্দগুলোর একটি তালিকা, যেখানে তাদের শনাক্তকৃত ইউনিকোড অক্ষরের ক্রম এবং বাউন্ডিং বক্স স্থানাঙ্ক—অর্থাৎ পৃষ্ঠার যে পিক্সেল অবস্থানে প্রতিটি শব্দ দেখা যায়—থাকে।

Tesseract একটি পৃষ্ঠা প্রক্রিয়াকরণ শেষ করার পর, pdf-lib শনাক্ত করা টেক্সট এবং বাউন্ডিং বক্স ব্যবহার করে সংশ্লিষ্ট PDF পৃষ্ঠায় একটি অদৃশ্য টেক্সট লেয়ার অঙ্কন করে। প্রতিটি শব্দকে তার শনাক্ত করা স্থানাঙ্কে `page.drawText()` ব্যবহার করে স্থাপন করা হয়, যেখানে ফন্ট সাইজ বাউন্ডিং বক্সের উচ্চতা থেকে গণনা করা হয় এবং টেক্সট কালার হিসেবে `rgb(0, 0, 0)` ব্যবহার করা হয় যার অপাসিটি শূন্য — যা দৃশ্যত অদৃশ্য, কিন্তু PDF-এর টেক্সট কন্টেন্ট স্ট্রিমে উপস্থিত থাকে। আধুনিক PDF ভিউয়ারগুলো সার্চ, সিলেকশন এবং কপি অপারেশনের জন্য এই টেক্সট স্ট্রিম ব্যবহার করে। এর ফলে যে PDF তৈরি হয় তা দেখতে হুবহু মূল স্ক্যানের মতো, কিন্তু এটি Ctrl+F চাপলে সাড়া দেয়, টেক্সট সিলেকশন সমর্থন করে এবং ডকুমেন্ট ম্যানেজমেন্ট সিস্টেম ও সার্চ ইঞ্জিন দ্বারা ইনডেক্স করা যায়।

OCR PDF: LuraPDF বনাম এর বিকল্পসমূহ

বৈশিষ্ট্যলুরাপিডিএফসার্ভার-ভিত্তিক ওসিআর (ilovepdf, Smallpdf)অ্যাডোবি অ্যাক্রোব্যাট
গোপনীয়তাশুধুমাত্র ব্রাউজারে ব্যবহারযোগ্য — ফাইলটি কখনও আপলোড করা হয়নিস্ক্যান করা নথি রিমোট সার্ভারে আপলোড করা হয়েছেস্থানীয়, কিন্তু $$$ সাবস্ক্রিপশন প্রয়োজন।
ভাষা সহায়তাTesseract WASM এর মাধ্যমে ১০০টিরও বেশি ভাষাবিভিন্ন — সাধারণত ভাষার সংখ্যা কম থাকেঅ্যাক্রোব্যাট: অনেক, কিন্তু সীমিত বহুভাষিক
খরচচিরকাল বিনামূল্যে, কোনো পৃষ্ঠা কোটা নেইফ্রিমিয়াম — পৃষ্ঠার সীমাবদ্ধতা বা পেওয়াল$$$ অ্যাক্রোব্যাট সাবস্ক্রিপশন
নিবন্ধন আবশ্যককিছুই না — পৃষ্ঠাটি খুলুন এবং OCR চালানএকাধিক পৃষ্ঠার ডকুমেন্টের জন্য অ্যাকাউন্ট প্রয়োজন।অ্যাডোবি আইডি এবং সাবস্ক্রিপশন প্রয়োজন

সর্বোত্তম OCR নির্ভুলতার জন্য কিছু পরামর্শ

OCR নির্ভুলতার ক্ষেত্রে স্ক্যানের মানই সবচেয়ে বড় নির্ধারক। এই পরামর্শগুলো আপনাকে Tesseract WASM থেকে সেরা ফলাফল পেতে সাহায্য করবে।

  1. Tip 1:

    সঠিক ভাষা নির্বাচন করুন — ভুল ল্যাঙ্গুয়েজ মডেল প্রয়োগ করা হলে টেসারেক্টের নির্ভুলতা উল্লেখযোগ্যভাবে কমে যায়। আপনি যদি অনিশ্চিত থাকেন, তবে একাধিক সম্ভাব্য ভাষা নির্বাচন করুন এবং টেসারেক্ট সেগুলোর মধ্যে থেকে একটিকে বেছে নেবে।

  2. Tip 2:

    উচ্চতর স্ক্যান রেজোলিউশন উন্নততর ওসিআর প্রদান করে — ৩০০ ডিপিআই স্ক্যান ১৫০ ডিপিআই বা তার কমের তুলনায় উল্লেখযোগ্যভাবে বেশি নির্ভুলতা অর্জন করে, বিশেষ করে ছোট ফন্টের লেখা এবং অ-ল্যাটিন লিপির ক্ষেত্রে।

  3. Tip 3:

    OCR করার আগে পৃষ্ঠাগুলো সোজা করে সাজাতে এবং মার্জিন মুছে ফেলতে LuraPDF-এর Crop PDF ও Rotate PDF টুল ব্যবহার করুন। বাঁকা বা উল্টো পৃষ্ঠা শনাক্তকরণের মান কমিয়ে দেয়।

  4. Tip 4:

    মোবাইলে বড় ও একাধিক পৃষ্ঠার ডকুমেন্টের জন্য ডেস্কটপ ব্রাউজার ব্যবহার করুন — Tesseract WASM প্রসেসরের ওপর বেশি চাপ সৃষ্টি করে এবং মোবাইল ডিভাইসগুলো ধীরগতির হয়। ট্যাবলেট বা ডেস্কটপের Chrome বা Firefox সবচেয়ে ভালো থ্রুপুট দেয়।

  5. Tip 5:

    OCR করার পর, শনাক্ত করা সম্পূর্ণ টেক্সটটিকে একটি প্লেইন ফাইল হিসেবে বের করতে PDF to Text ব্যবহার করুন, যা পরে ওয়ার্ড প্রসেসর, অনুবাদ টুল বা ডেটা পাইপলাইনে পেস্ট করা যাবে।

  6. Tip 6:

    মিশ্র লিপিতে তৈরি বহুভাষিক নথির ক্ষেত্রে—যেমন ইংরেজি ও আরবি অংশযুক্ত কোনো আইনি চুক্তি, বা ইংরেজি লেখা ও চীনা চিত্রযুক্ত কোনো কাগজ—অংশগুলো আলাদাভাবে প্রক্রিয়াকরণ না করে, OCR চালানোর আগে সমস্ত প্রাসঙ্গিক ভাষা নির্বাচন করুন।

সম্পর্কিত সরঞ্জাম

প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী

আমি কি পিডিএফ আপলোড না করেই বিনামূল্যে সেটিতে ওসিআর চালাতে পারি?
হ্যাঁ। LuraPDF, Tesseract WASM ব্যবহার করে — যা হলো গুগলের Tesseract OCR ইঞ্জিনের WebAssembly পোর্ট — এবং এটি সম্পূর্ণভাবে আপনার ব্রাউজারের ভেতরেই চলে। কোনো ফাইল আপলোড, সার্ভার বা অ্যাকাউন্টের প্রয়োজন নেই। আপনার স্ক্যান করা PDF ফাইলটি ড্রপ করুন, ভাষা নির্বাচন করুন এবং বিনামূল্যে একটি সার্চযোগ্য PDF ডাউনলোড করুন।
Tesseract WASM OCR কতটা নির্ভুল?
টেসারেক্টের এলএসটিএম (LSTM) ইঞ্জিনটি গবেষণা-মানের এবং এটি আধুনিক ফন্টের পরিষ্কার, উচ্চ-রেজোলিউশনের (৩০০ ডিপিআই) স্ক্যানে ৯৫–৯৯% ক্যারেক্টার অ্যাকুরেসি অর্জন করে। নিম্ন-রেজোলিউশনের স্ক্যান, হাতে লেখা, অস্বাভাবিক ফন্ট এবং অতিরিক্ত কম্প্রেস করা ছবির ক্ষেত্রে অ্যাকুরেসি কমে যায়। সঠিক ল্যাঙ্গুয়েজ মডেল নির্বাচন করাই হলো অ্যাকুরেসির জন্য সবচেয়ে প্রভাবশালী সেটিং।
OCR কোন কোন ভাষা সমর্থন করে?
ইংরেজি, স্প্যানিশ, ফরাসি, জার্মান, ইতালীয়, পর্তুগিজ, আরবি, সরলীকৃত চীনা, প্রথাগত চীনা, জাপানি, কোরিয়ান, রুশ, হিন্দি, হিব্রু, থাই সহ ১০০টিরও বেশি ভাষা উপলব্ধ রয়েছে। মিশ্র-ভাষার ডকুমেন্টের জন্য একাধিক ভাষা নির্বাচন করুন — টেসারেক্ট নির্বাচিত সমস্ত মডেল একই সাথে ব্যবহার করে।
অনলাইনে গোপনীয় স্ক্যান করা নথি OCR করা কি নিরাপদ?
হ্যাঁ — LuraPDF-এর মাধ্যমে, কারণ ফাইলটি কখনোই আপনার ডিভাইস থেকে বের হয় না। Tesseract WASM আপনার ব্রাউজারে একটি স্যান্ডবক্সড ওয়েব ওয়ার্কারে চলে। কোনো ডেটা সার্ভারে পাঠানো হয় না। এই কারণে, স্ক্যান করা ট্যাক্স রিটার্ন, মেডিকেল রেকর্ড, আইনি নথি এবং আর্থিক নথি, যা কোনো বাহ্যিক পরিষেবাতে আপলোড করা যায় না, সেগুলোর OCR-এর জন্য LuraPDF একটি উপযুক্ত বিকল্প।
ব্রাউজার OCR কি সার্ভার-ভিত্তিক OCR-এর চেয়ে ধীরগতির?
হ্যাঁ, ব্রাউজার WASM OCR সার্ভার-সাইড OCR-এর চেয়ে ধীরগতির, কারণ আধুনিক ক্লাউড OCR API-গুলো মাল্টি-GPU হার্ডওয়্যারে চলে। একটি আধুনিক ডেস্কটপ CPU-তে LuraPDF-এর Tesseract WASM সাধারণত Accuracy মোডে প্রতি পৃষ্ঠা প্রসেস করতে ৫-১৫ সেকেন্ড সময় নেয়। গোপনীয়তার নিশ্চয়তার জন্য এটি একটি গ্রহণযোগ্য আপস। কম মেমোরির ডিভাইসে খুব বড় ডকুমেন্টের জন্য মোবাইলের চেয়ে ডেস্কটপ ব্রাউজার ব্যবহারের জোরালো পরামর্শ দেওয়া হয়।
OCR কি আমার স্ক্যান করা PDF-এর চেহারা পরিবর্তন করে দেয়?
না। মূল পৃষ্ঠার ছবিগুলো হুবহু সংরক্ষিত থাকে। OCR শনাক্তকৃত অক্ষরের অবস্থানগুলোতে একটি অদৃশ্য টেক্সট লেয়ার যোগ করে — প্রতিটি পৃষ্ঠার দৃশ্যমান বিষয়বস্তু ইনপুট স্ক্যানের সাথে বাইট-বাই-বাইট অভিন্ন থাকে। যা পরিবর্তিত হয় তা হলো, টেক্সটটি অনুসন্ধানযোগ্য, নির্বাচনযোগ্য এবং অনুলিপিযোগ্য হয়ে ওঠে।
OCR আউটপুট PDF-টিতে কি ওয়াটারমার্ক থাকবে?
না। LuraPDF কোনো আউটপুট ফাইলে কোনো ওয়াটারমার্ক, স্ট্যাম্প বা প্রচারমূলক ওভারলে যোগ করে না। আপনি যে অনুসন্ধানযোগ্য পিডিএফটি ডাউনলোড করেন, সেটি একটি পরিচ্ছন্ন ডকুমেন্ট, যাতে শুধুমাত্র একটি অদৃশ্য টেক্সট লেয়ার যুক্ত থাকে।
আমি কি আমার ফোনে একটি পিডিএফ ফাইল OCR করতে পারি?
হ্যাঁ, ছোট ডকুমেন্টের জন্য। টেসারেক্ট WASM বেশ জটিল একটি প্রক্রিয়া। একটি আধুনিক স্মার্টফোনে অ্যাকুরেসি মোডে ১০ পৃষ্ঠার একটি স্ক্যান করতে সাধারণত ১-৩ মিনিট সময় লাগে। দীর্ঘ ডকুমেন্টের (যেমন ৫০ বা তার বেশি পৃষ্ঠা) ক্ষেত্রে, যুক্তিসঙ্গত সময়ে প্রসেসিংয়ের জন্য ডেস্কটপ ব্রাউজার ব্যবহারের জোরালো পরামর্শ দেওয়া হয়।
OCR কি পৃষ্ঠার মূল বিন্যাস অক্ষুণ্ণ রাখে?
হ্যাঁ। পেজের ছবিগুলো পুনরায় রেন্ডার বা রিসাইজ করা হয় না। মূল ছবির উপর টেক্সট লেয়ারটিকে অক্ষর-সঠিক স্থানাঙ্কে স্থাপন করার জন্য টেসারেক্টের বাউন্ডিং বক্স আউটপুট ব্যবহার করা হয়। কলাম, টেবিল, হেডার, ফুটনোট এবং একাধিক কলামের লেআউট শনাক্ত করা হয় এবং টেক্সট লেয়ারটি মূল ভিজ্যুয়াল কাঠামো অনুসরণ করে।
আমি কি বিভিন্ন লিপিতে লেখা একটি বহুভাষিক পিডিএফ-কে OCR করতে পারি?
হ্যাঁ। OCR চালানোর আগে ডকুমেন্টে উপস্থিত সমস্ত ভাষা নির্বাচন করুন। উদাহরণস্বরূপ, ইংরেজি এবং আরবি অংশসহ একটি চুক্তির ক্ষেত্রে: ইংরেজি এবং আরবি উভয়ই নির্বাচন করুন। Tesseract নির্বাচিত সমস্ত ল্যাঙ্গুয়েজ মডেল একযোগে প্রয়োগ করে এবং প্রতিটি অঞ্চলের জন্য সেরা ক্যারেক্টার ম্যাচ নির্ধারণ করতে ভোটিং পদ্ধতি ব্যবহার করে। এটি আলাদাভাবে অংশগুলো প্রসেস করার চেয়ে বেশি নির্ভুল।

স্থানীয়ভাবে পিডিএফ ওসিআর করুন — ১০০টিরও বেশি ভাষা, অনুসন্ধানযোগ্য আউটপুট, বিনামূল্যে

আপনার স্ক্যান করা PDF ফাইলটি উপরের আপলোড এরিয়াতে রাখুন, ডকুমেন্টের ভাষা নির্বাচন করুন, এবং Tesseract WASM-কে প্রতিটি পৃষ্ঠা অনুসন্ধানযোগ্য করে তুলতে দিন — সম্পূর্ণভাবে আপনার ব্রাউজারেই। কোনো আপলোড নেই, কোনো সার্ভার নেই, কোনো অ্যাকাউন্ট নেই, কোনো ওয়াটারমার্ক নেই, কোনো পেজ কোটা নেই। আপনার স্ক্যান করা ট্যাক্স ডকুমেন্ট, আইনি ফাইলিং, মেডিকেল রেকর্ড এবং আর্কাইভাল সামগ্রীগুলো আপনার ডিভাইসেই থাকে, ঠিক সেই মুহূর্ত থেকে যখন অনুসন্ধানযোগ্য PDF ফাইলটি আপনার ডাউনলোড ফোল্ডারে চলে আসে। OCR করার পর, PDF to Text ব্যবহার করে সম্পূর্ণ টেক্সট বের করুন, Crop PDF এবং Rotate PDF টুল ব্যবহার করে স্ক্যান কাটতে ও রোটেট করুন, অথবা Annotate PDF টুল ব্যবহার করে নতুন অনুসন্ধানযোগ্য পৃষ্ঠাগুলোতে টীকা যোগ করুন।