OCR (Optical Character Recognition) یک تغییر دهنده بازی برای هر کسی است که با اسناد PDF کار می کند. فایلهای PDF به دلیل سخت بودن ویرایش و جستجو در میان آنها بدنام هستند. هنگامی که یک PDF را OCR می کنید، اطمینان حاصل می کند که متن اسکن و استخراج شده است، و آن را به طور کامل قابل جستجو، ویرایش و قابل دسترسی می کند.
در این راهنما، ما روشهای مختلف OCR-ing PDF را با هم مقایسه میکنیم تا به شما کمک کنیم بهترین موردی را که با نیازهای شما مطابقت دارد انتخاب کنید. ما در مورد Adobe Acrobat، ابزارهای منبع باز و راه حل های مبتنی بر هوش مصنوعی صحبت خواهیم کرد. علاوه بر این، ما به سوالات رایجی مانند نحوه OCR یک PDF در Mac، قابل جستجو کردن PDF OCR و نکاتی در مورد بهبود دقت OCR پاسخ خواهیم داد.
برای تغییر گردش کار PDF خود همراه باشید.
1. استفاده از Adobe Acrobat Pro
Adobe Acrobat Pro استاندارد طلایی برای OCR-ing PDF در نظر گرفته می شود. Adobe به عنوان پیشرو در صنعت نرم افزار PDF، Acrobat Pro را با قابلیت های پیشرفته OCR که به راحتی اسناد پیچیده را کنترل می کند، بسته بندی می کند.
می توانید با استفاده از Acrobat Pro یک سند را به دو روش OCR کنید:
روش 1
- فایل PDF را در Adobe Acrobat Pro باز کنید.
- روی "همه ابزارها" در نوار ابزار کلیک کنید.
- یک منو ظاهر می شود که تمام ابزارهای موجود را فهرست می کند. بر روی “Edit PDF” کلیک کنید.
- Acrobat به طور خودکار OCR را اعمال می کند و متن را تبدیل می کند.
- این سند اکنون کاملاً قابل ویرایش و جستجو است. فونت را تغییر دهید یا در صورت نیاز حاشیه نویسی اضافه کنید. همچنین می توانید با استفاده از ابزار Find سند را جستجو کنید.
روش 2
- Adobe Acrobat Pro را باز کنید.
- روی "همه ابزارها" در نوار ابزار کلیک کنید.
- یک منو ظاهر می شود که تمام ابزارهای موجود را فهرست می کند. روی «Scan and OCR» کلیک کنید.
- در ابزار Scan and OCR، فایل PDF مورد نظر برای OCR را انتخاب کنید یا یک سند فیزیکی را مستقیماً با استفاده از یک اسکنر متصل اسکن کنید.
- اگر تصویر نیاز به تمیز کردن دارد، روی "Enhance" کلیک کنید. این باعث بهبود دقت OCR می شود.
- برای شروع فرآیند OCR روی "تشخیص متن" کلیک کنید. پس از تکمیل، PDF قابل جستجو و ویرایش خواهد بود. اکنون می توانید متن را ویرایش کنید.
مزیت اصلی استفاده از Acrobat Pro موتور پیشرفته OCR آن است که می تواند طرح بندی های پیچیده، اسناد چند ستونی، اسکن های با وضوح پایین و متن های دست نویس را با دقت بالا مدیریت کند. در دستگاه های ویندوز، مک و اندروید موجود است و می توانید به صورت آنلاین به این ویژگی ها نیز دسترسی داشته باشید. علاوه بر این، به برنامه Adobe Mobile Scan شما متصل است و به شما امکان می دهد اسناد را در حال حرکت اسکن کرده و آنها را با کتابخانه Acrobat خود همگام کنید.
با این حال، برای دسترسی به قابلیت های OCR باید مشترک Acrobat Pro باشید. اشتراک به قیمت است 19.99 دلار آمریکا در ماه. علاوه بر این، در حالی که به شما امکان می دهد چندین فایل را آپلود کنید، باید هر فایل را یکی یکی به صورت دستی OCR کنید. بنابراین، اگر فایل های زیادی برای پردازش دارید، ممکن است خسته کننده شود.
ابزارهای منبع باز OCR مانند Tesseract یک جایگزین رایگان برای تبدیل PDF به فایل های قابل جستجو و قابل ویرایش ارائه می دهند. اگرچه ممکن است به اندازه راه حل های تجاری مانند Adobe Acrobat دارای امکانات کامل نباشند، اما برای اکثر موارد استفاده سطح مناسبی از دقت را ارائه می دهند.
Tesseract برای ویندوز، مک و لینوکس در دسترس است. برای استفاده از آن ابتدا باید آن را روی رایانه خود نصب کنید. پس از نصب، می توانید این مراحل را برای OCR یک PDF دنبال کنید:
- فایل PDF را در یک ابزار نمایشگر یا ویرایشگر مانند PDFelement باز کنید.
- ناحیه یا صفحهای را که میخواهید OCR کنید انتخاب کنید و اسکرین شات بگیرید. در صورت لزوم تصویر را برش دهید.
- برای دسترسی به Tesseract، ترمینال را باز کنید. اگر Tesseract در ترمینال یافت نشد، مسیر متغیر محیطی را ویرایش کنید تا به دایرکتوری نصب Tesseract هدایت شود.
- مسیر فایل تصویری را که می خواهید OCR کنید، کپی کنید. به عنوان مثال: "C:UsersJohnDoePicturesScreenshotsScreenshot 230844.png"
- دستور زیر را در ترمینال وارد کنید: “C:UsersJohnDoePicturesScreenshots>tesseract Screenshot 230844.png”. این OCR را روی تصویر اجرا می کند و هر متنی را که پیدا می کند به فرمت قابل ویرایش تبدیل می کند.
- پس از تکمیل OCR، Tesseract یک فایل حاوی تمام متن استخراج شده ایجاد می کند.
- برای مشاهده و ویرایش محتوای OCR-ed، این فایل را در هر ویرایشگر متنی باز کنید. همچنین میتوانید دستور «–help» را وارد کنید تا در صورت نیاز فهرست کاملی از گزینههای Tesseract را دریافت کنید.
مزیت حیاتی Tesseract این است که کاملاً رایگان و منبع باز است، بنابراین نیازی به پرداخت هیچ گونه هزینه مجوز ندارید. روی اسکن های تمیز و اسناد تایپ شده به خوبی کار می کند.
با این حال، با متن دستنویس، طرحبندیهای پیچیده، پسزمینههای رنگی و اسکنهای با وضوح پایین مشکل دارد. اگر اسناد شما تمیز و تایپ شده باشند، Tesseract راه حلی رایگان برای نیازهای اولیه OCR ارائه می دهد.
میتوانید دقت Tesseract را با پیشپردازش اسکنها قبل از اجرای OCR - تنظیم روشنایی یا کنتراست، اعمال فیلترها، ارتقاء مقیاس تصاویر و موارد دیگر، بهبود بخشید.
3. استفاده از PDF OCR نانوشبکه ها
Nanonets یک راه حل پردازش اسناد مبتنی بر هوش مصنوعی است که قابلیت های OCR پیشرفته ای را ارائه می دهد. برخلاف Acrobat Pro یا Tesseract، Nanonets کاملاً آنلاین است و نیازی به نصب ندارد. شما به سادگی فایلهای PDF خود را در پلتفرم ابری آنها آپلود میکنید و بلافاصله پردازش آنها با استفاده از الگوریتمهای پیشرفته OCR آغاز میشود. حتی می تواند کل پوشه ها و صدها فایل پی دی اف را یکجا پردازش کند.
نانوشبکهها میتوانند همه چیز را از اسناد تایپشده ساده گرفته تا طرحبندیهای پیچیده با حاشیهنویسیهای دستنویس، پسزمینههای رنگی، نمودارها و جداول، با استفاده از مدلهای یادگیری عمیق برای دستیابی به دقت بالا در همه انواع سند، مدیریت کنند.
در اینجا چگونه کار می کند:
- بازدید Nanonets.com و ایجاد یک حساب کاربری رایگان.
- یک مدل OCR را از طیف گسترده مدل های از پیش آموزش دیده Nanonets برای فاکتورها، رسیدها یا سفارشات خرید انتخاب کنید. همچنین می توانید یک مدل سفارشی متناسب با انواع سند خاص خود بسازید.
- اسنادی را بارگذاری کنید که نمایانگر طرحبندیهای مختلف و فیلدهای دادهای است که باید استخراج کنید. نانوشبکه ها این نمونه ها را تجزیه و تحلیل خواهند کرد تا ساختار اسناد شما را درک کنند.
- فیلدهای کلیدی را که می خواهید ضبط کنید، مانند تاریخ، مقدار کل و داده های جدول تعریف کنید. تقریباً میتوانید دادهها را در هر قالبی از جمله جداول، متن، JSON یا XML ضبط کنید. نانوشبکه ها به طور خودکار داده ها را از فایل های PDF شما استخراج کرده و در فرمت مورد نیاز خروجی می گیرند.
- پس از پیکربندی، اسناد PDF خود را که نیاز به ویرایش OCR دارند، آپلود کنید. نانوشبکهها فایلها را با استفاده از OCR پیشرفته و الگوریتمهای استخراج هوشمند دادهها پردازش میکنند تا آنها را به فرمتهای قابل جستجو و قابل ویرایش با خروجی دادههای ساختاریافته تبدیل کند.
- دادههای استخراجشده بهخوبی سازماندهی شده و ساختار یافتهاند تا شما مستقیماً بدون تلاش دستی وارد سیستمهای تجاری دیگر شوید. می توانید آن را به فرمت های JSON، XML، orcustom صادر کنید.
Nanonets یک نسخه رایگان با حداکثر 500 صفحه پردازشی ارائه می دهد تا بتوانید بدون هیچ هزینه ای آن را آزمایش کنید. پس از آن هزینه دارد 0.3 دلار در هر صفحه برای OCR.
بر خلاف راه حل های دیگر، نانو شبکه ها بسیار مقیاس پذیر هستند. این می تواند هزاران صفحه را در ساعت پردازش کند و اطمینان حاصل کند که بدون توجه به حجم، فایل های شما تقریباً بلافاصله پردازش می شوند.
میتوانید برای پخش جریانی دادههای پردازششده به برنامههای دیگر یا استفاده از APIهای توسعهدهنده Nanonets برای ایجاد ادغامهای سفارشی، وب هوکها را راهاندازی کنید.
نحوه بهبود فرآیند PDF OCR
فناوری OCR، زمانی که به طور موثر پیاده سازی شود، می تواند در زمان و منابع شما صرفه جویی کند. تصور کنید بتوانید کاهش دهید زمان ورود داده در هر فیلد 95٪. تیم شما میتواند روی کارهای معنادارتر از ورود دادههای معمولی تمرکز کند.
بیایید نکاتی را برای بهبود دقت و اثربخشی فرآیند PDF OCR خود بررسی کنیم:
1. قبل از OCR اسکن را از قبل انجام دهید
اگر با اسناد اسکن شده سر و کار دارید، می توانید روشنایی، کنتراست و وضوح را تنظیم کنید و از فیلترها یا تکنیک های بهبود تصویر برای کاهش نویز و بهبود وضوح استفاده کنید.
این به طور قابل توجهی دقت OCR را افزایش می دهد. برنامه اسکنر Adobe دارای ویژگی های داخلی بهبود تصویر است. همچنین می توانید از ابزارهایی مانند PaperScan و NAPS2 برای تمیز کردن اسکن ها استفاده کنید. پس از این ویرایش ها، می توانید تصاویر ویرایش شده را قبل از اجرای OCR به صورت PDF ذخیره کنید.
2. گردش کار اعتبار سنجی و سلسله مراتب تایید را تنظیم کنید
با تنظیم قوانین اعتبارسنجی برای داده های استخراج شده، کیفیت داده ها را بهبود بخشید. به عنوان مثال، اگر شماره سفارش در یک سند دارای پنج رقم نباشد، به طور خودکار رد می شود یا برای بررسی دستی علامت گذاری می شود. به این ترتیب، می توانید خطاهای استخراج را پیدا کنید و فقط داده های معتبر را تأیید کنید. شما همچنین می توانید سیستم OCR خود را با پایگاه داده ها برای اعتبارسنجی داده های استخراج شده یکپارچه کنید.
میتوانید سلسلهمراتب تأییدی را تنظیم کنید که در آن کارمندان جوان ابتدا دادهها را بررسی میکنند و سپس کارمندان ارشد را برای امضای نهایی بررسی میکنند. با اعلانهای خودکار و بهروزرسانیهای وضعیت زنده، میتوانید شفافیت را حفظ کنید و از تعقیب تأیید جلوگیری کنید که منجر به پردازش سریعتر اسناد میشود.
3. ایجاد گردش کار خودکار
تصور کنید کرایه اتومبیل را اجرا کنید و بتوانید به طور خودکار داده های گواهینامه رانندگی مشتریان را به Salesforce صادر کنید یا داده های فاکتور را بدون هیچ کار دستی به QuickBooks ارسال کنید. نه تنها PDF OCR شما را بهینه می کند، بلکه فعالیت های پایین دستی را نیز بهینه می کند.
ادغام راه حل OCR خود با برنامه های تجاری از طریق API ها این اتوماسیون را ممکن می کند. به عنوان مثال، با نانوشبکهها، شما به سادگی تریگرها را بر اساس رویدادهایی مانند تکمیل پردازش سند، استخراج داده یا آپلود فایل جدید تنظیم میکنید. این ادغام به طور خودکار داده های ساختاریافته را از نانو نت ها به سیستم های تجاری دلخواه صادر می کند - از جمله QuickBooks، Xero، Microsoft Dynamics، Zendesk و بسیاری دیگر - تلاش های دستی را حذف می کند و جریان یکپارچه داده بین سیستم ها را تضمین می کند.
4. روی OCR پیشرفته با قابلیت های AI/ML سرمایه گذاری کنید
برخلاف OCR مبتنی بر قوانین، مدلهای هوش مصنوعی تطبیقی هستند - به طور مداوم از اصلاحات انسانی یاد میگیرند و در طول زمان بهبود مییابند. به عنوان مثال، Nanonets یک مدل هوش مصنوعی اختصاصی ارائه میدهد که بر روی میلیونها سند آموزش دیده است و به آن اجازه میدهد طرحبندیهای پیچیده و چالشبرانگیز را به طور موثر مدیریت کند.
OCR مجهز به هوش مصنوعی تضمین می کند که می توانید اطلاعات را از اسناد بدون از دست دادن زمینه استخراج کنید. این می تواند زبان های مختلف، واحدهای پولی، حقوقی یا اندازه گیری را مدیریت کند. این سطح از هوش با استخراج مبتنی بر الگو یا قواعد مبتنی بر مکانهای میدانی دقیق امکانپذیر نیست.
5. مدل های AI-OCR را آموزش دهید
در حالی که راهحلهای OCR مجهز به هوش مصنوعی با مدلهای از پیش آموزشدیده ارائه میشوند، آموزش بیشتر آنها در مورد انواع اسناد و طرحبندیهای خاص شما میتواند دقت را حتی بیشتر افزایش دهد. به عنوان مثال، Nanonets به شما اجازه میدهد مجموعهای از اسناد را بارگذاری کنید که نشاندهنده الگوها، قالبها و فیلدهای مختلفی است که میخواهید ثبت کنید.
این نمونه ها به مدل کمک می کند تا ساختار اسناد شما را درک کند و فرآیند PDF OCR را به خوبی تنظیم کند. همچنین می توانید با تصحیح خطاهای استخراج شناسایی شده در حین اعتبارسنجی، بازخورد ارائه دهید. این آموزش انسان در حلقه به طور مداوم عملکرد مدل هوش مصنوعی را افزایش می دهد.
6. در صورت نیاز مدل های OCR سفارشی بسازید
گاهی اوقات، مدل های از پیش آموزش دیده ممکن است تمام پیچیدگی های اسناد شما را پوشش ندهند. به عنوان مثال، ممکن است اسناد خاص صنعت با زمینه ها و قالب های منحصر به فرد داشته باشید. در چنین مواردی، میتوانید با فروشنده OCR خود برای ساخت مدلهای AI سفارشی که به طور خاص بر روی اسناد شما آموزش داده شدهاند، کار کنید.
با نانوشبکه ها، کاربران می توانند مدل های سفارشی مخصوص انواع اسناد و فیلدهای خود را برای استخراج ایجاد کنند. آنها می توانند اسناد نمونه را آپلود کنند و با برچسب هایی که می خواهند استخراج کنند، آنها را حاشیه نویسی کنند. سپس هوش مصنوعی از این مثال ها یاد می گیرد و برای تشخیص و استخراج اطلاعات مشخص شده آموزش می بیند. این سیستم برای دستیابی به دقت مطلوب حداقل به ده نمونه برای هر برچسب نیاز دارد و کاربران می توانند تعداد نمونه ها را برای هر برچسب نظارت کرده و در صورت نیاز موارد بیشتری را اضافه کنند.
چگونه با Nanonets PDF OCR شروع کنیم
نانو شبکه ها شروع به کار با PDF OCR را آسان می کند. به سادگی برای یک حساب کاربری رایگان در وب سایت Nanonets ثبت نام کنید. شما نیازی به ارائه کارت اعتباری ندارید.
در اینجا یک راهنمای برای کمک به شما برای شروع وجود دارد:
- ثبت نام برای یک حساب کاربری رایگان: بازدید کنید Nanonets.com و برای یک حساب رایگان ثبت نام کنید—بدون نیاز به کارت اعتباری.
- یک مدل ایجاد یا انتخاب کنید: می توانید یک مدل OCR سفارشی برای انواع اسناد خاص خود بسازید یا از مدل های از پیش آموزش دیده Nanonets برای فاکتورها، رسیدها و موارد دیگر انتخاب کنید.
- راهاندازی واردات خودکار: ایمیلها را فوروارد کنید یا فضای ذخیرهسازی ابری را متصل کنید تا فایلهای PDF جدید به نانوشبکهها برای پردازش OCR مداوم به صورت خودکار وارد شوند.
- اسناد نمونه را بارگذاری کنید: حداقل 10 سند نمونه را آپلود کنید که نشان دهنده الگوها، قالبها و فیلدهای دادهای است که میخواهید استخراج کنید. این به آموزش مدل هوش مصنوعی کمک می کند.
- فیلدهایی را برای استخراج تعریف کنید: به سادگی نام فیلدهای داده مهمی را که می خواهید از اسناد خود استخراج کنید، مانند تاریخ، مقدار، داده های جدول و غیره مشخص کنید.
- اعتبارسنجی ها را تنظیم کنید: قوانینی را برای اعتبارسنجی داده های استخراج شده پیکربندی کنید و برای اطمینان از صحت، هرگونه خطا را برای اصلاح علامت گذاری کنید.
- فایل های خود را پردازش کنید: اسناد PDF خود را آپلود کنید. نانو شبکهها فوراً آنها را با OCR و استخراج هوشمند دادهها پردازش میکنند.
- بررسی و تایید داده ها: داده های استخراج شده را بررسی کنید و ورودی های معتبر را تأیید کنید. شفافیت را با به روز رسانی وضعیت حفظ کنید.
- صادرات داده ها به سیستم های تجاری: پس از تأیید، داده های ساختار یافته را به طور یکپارچه به ERP، حسابداری، CRM یا سایر سیستم های خود صادر کنید.
- گردش کار را خودکار کنید: راهاندازی را برای پخش جریانی دادهها به برنامهها هنگام پردازش سند یا استخراج دادهها تنظیم کنید. تلاش های دستی را حذف کنید.
به طور کلی، نانوشبکهها افزودن قابلیتهای OCR هوشمند به جریان کار اسناد شما را سریع و آسان میسازد. موتور هوش مصنوعی خودآموز از همان ابتدا دقت بالایی را ارائه می دهد و در عین حال امکان سفارشی سازی برای مدیریت اسناد پیچیده را فراهم می کند. یکپارچهسازی یکپارچه با سیستمهای تجاری، اتوماسیون واقعی سرتاسر را امکانپذیر میسازد.
پسگفتار
OCR هوشمند و استخراج داده می تواند به باز کردن ارزش فوق العاده از جریان کار اسناد کمک کند. نکته کلیدی انتخاب راه حلی مانند نانو نت است که OCR مبتنی بر هوش مصنوعی را از ابتدا ارائه می دهد و امکان سفارشی سازی برای نیازهای خاص را فراهم می کند.
با قابلیتهای سلفسرویس برای ساخت مدلهای سفارشی، دقت و اتوماسیون به طور مداوم حتی با تکامل اسناد شما بهبود مییابد. در نهایت، این تضمین می کند که می توانید داده های بدون ساختار را در مقیاس مدیریت کنید تا بهره وری و رشد را افزایش دهید.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://nanonets.com/blog/how-to-ocr-pdf/