هوش داده افلاطون
جستجوی عمودی و هوش مصنوعی

نحوه OCR یک PDF

تاریخ:

OCR (Optical Character Recognition) یک تغییر دهنده بازی برای هر کسی است که با اسناد PDF کار می کند. فایل‌های PDF به دلیل سخت بودن ویرایش و جستجو در میان آنها بدنام هستند. هنگامی که یک PDF را OCR می کنید، اطمینان حاصل می کند که متن اسکن و استخراج شده است، و آن را به طور کامل قابل جستجو، ویرایش و قابل دسترسی می کند. 

در این راهنما، ما روش‌های مختلف OCR-ing PDF را با هم مقایسه می‌کنیم تا به شما کمک کنیم بهترین موردی را که با نیازهای شما مطابقت دارد انتخاب کنید. ما در مورد Adobe Acrobat، ابزارهای منبع باز و راه حل های مبتنی بر هوش مصنوعی صحبت خواهیم کرد. علاوه بر این، ما به سوالات رایجی مانند نحوه OCR یک PDF در Mac، قابل جستجو کردن PDF OCR و نکاتی در مورد بهبود دقت OCR پاسخ خواهیم داد.

برای تغییر گردش کار PDF خود همراه باشید.

1. استفاده از Adobe Acrobat Pro

Adobe Acrobat Pro استاندارد طلایی برای OCR-ing PDF در نظر گرفته می شود. Adobe به عنوان پیشرو در صنعت نرم افزار PDF، Acrobat Pro را با قابلیت های پیشرفته OCR که به راحتی اسناد پیچیده را کنترل می کند، بسته بندی می کند.

می توانید با استفاده از Acrobat Pro یک سند را به دو روش OCR کنید:

روش 1

  1. فایل PDF را در Adobe Acrobat Pro باز کنید.
  2. روی "همه ابزارها" در نوار ابزار کلیک کنید.
  3. یک منو ظاهر می شود که تمام ابزارهای موجود را فهرست می کند. بر روی “Edit PDF” کلیک کنید.
  4. Acrobat به طور خودکار OCR را اعمال می کند و متن را تبدیل می کند.
  5. این سند اکنون کاملاً قابل ویرایش و جستجو است. فونت را تغییر دهید یا در صورت نیاز حاشیه نویسی اضافه کنید. همچنین می توانید با استفاده از ابزار Find سند را جستجو کنید.

روش 2

  1. Adobe Acrobat Pro را باز کنید. 
  2. روی "همه ابزارها" در نوار ابزار کلیک کنید.
  3. یک منو ظاهر می شود که تمام ابزارهای موجود را فهرست می کند. روی «Scan and OCR» کلیک کنید.
  4. در ابزار Scan and OCR، فایل PDF مورد نظر برای OCR را انتخاب کنید یا یک سند فیزیکی را مستقیماً با استفاده از یک اسکنر متصل اسکن کنید.
  5. اگر تصویر نیاز به تمیز کردن دارد، روی "Enhance" کلیک کنید. این باعث بهبود دقت OCR می شود. 
  6. برای شروع فرآیند OCR روی "تشخیص متن" کلیک کنید. پس از تکمیل، PDF قابل جستجو و ویرایش خواهد بود. اکنون می توانید متن را ویرایش کنید.

مزیت اصلی استفاده از Acrobat Pro موتور پیشرفته OCR آن است که می تواند طرح بندی های پیچیده، اسناد چند ستونی، اسکن های با وضوح پایین و متن های دست نویس را با دقت بالا مدیریت کند. در دستگاه های ویندوز، مک و اندروید موجود است و می توانید به صورت آنلاین به این ویژگی ها نیز دسترسی داشته باشید. علاوه بر این، به برنامه Adobe Mobile Scan شما متصل است و به شما امکان می دهد اسناد را در حال حرکت اسکن کرده و آنها را با کتابخانه Acrobat خود همگام کنید.

با این حال، برای دسترسی به قابلیت های OCR باید مشترک Acrobat Pro باشید. اشتراک به قیمت است 19.99 دلار آمریکا در ماه. علاوه بر این، در حالی که به شما امکان می دهد چندین فایل را آپلود کنید، باید هر فایل را یکی یکی به صورت دستی OCR کنید. بنابراین، اگر فایل های زیادی برای پردازش دارید، ممکن است خسته کننده شود.

ابزارهای منبع باز OCR مانند Tesseract یک جایگزین رایگان برای تبدیل PDF به فایل های قابل جستجو و قابل ویرایش ارائه می دهند. اگرچه ممکن است به اندازه راه حل های تجاری مانند Adobe Acrobat دارای امکانات کامل نباشند، اما برای اکثر موارد استفاده سطح مناسبی از دقت را ارائه می دهند. 

Tesseract برای ویندوز، مک و لینوکس در دسترس است. برای استفاده از آن ابتدا باید آن را روی رایانه خود نصب کنید. پس از نصب، می توانید این مراحل را برای OCR یک PDF دنبال کنید:

  1. فایل PDF را در یک ابزار نمایشگر یا ویرایشگر مانند PDFelement باز کنید. 
  2. ناحیه یا صفحه‌ای را که می‌خواهید OCR کنید انتخاب کنید و اسکرین شات بگیرید. در صورت لزوم تصویر را برش دهید.
  3. برای دسترسی به Tesseract، ترمینال را باز کنید. اگر Tesseract در ترمینال یافت نشد، مسیر متغیر محیطی را ویرایش کنید تا به دایرکتوری نصب Tesseract هدایت شود.
  4. مسیر فایل تصویری را که می خواهید OCR کنید، کپی کنید. به عنوان مثال: "C:UsersJohnDoePicturesScreenshotsScreenshot 230844.png"
  5. دستور زیر را در ترمینال وارد کنید: “C:UsersJohnDoePicturesScreenshots>tesseract Screenshot 230844.png”. این OCR را روی تصویر اجرا می کند و هر متنی را که پیدا می کند به فرمت قابل ویرایش تبدیل می کند. 
  6. پس از تکمیل OCR، Tesseract یک فایل حاوی تمام متن استخراج شده ایجاد می کند.
  7. برای مشاهده و ویرایش محتوای OCR-ed، این فایل را در هر ویرایشگر متنی باز کنید. همچنین می‌توانید دستور «–help» را وارد کنید تا در صورت نیاز فهرست کاملی از گزینه‌های Tesseract را دریافت کنید.

مزیت حیاتی Tesseract این است که کاملاً رایگان و منبع باز است، بنابراین نیازی به پرداخت هیچ گونه هزینه مجوز ندارید. روی اسکن های تمیز و اسناد تایپ شده به خوبی کار می کند. 

با این حال، با متن دست‌نویس، طرح‌بندی‌های پیچیده، پس‌زمینه‌های رنگی و اسکن‌های با وضوح پایین مشکل دارد. اگر اسناد شما تمیز و تایپ شده باشند، Tesseract راه حلی رایگان برای نیازهای اولیه OCR ارائه می دهد. 

می‌توانید دقت Tesseract را با پیش‌پردازش اسکن‌ها قبل از اجرای OCR - تنظیم روشنایی یا کنتراست، اعمال فیلترها، ارتقاء مقیاس تصاویر و موارد دیگر، بهبود بخشید.

3. استفاده از PDF OCR نانوشبکه ها

Nanonets یک راه حل پردازش اسناد مبتنی بر هوش مصنوعی است که قابلیت های OCR پیشرفته ای را ارائه می دهد. برخلاف Acrobat Pro یا Tesseract، Nanonets کاملاً آنلاین است و نیازی به نصب ندارد. شما به سادگی فایل‌های PDF خود را در پلتفرم ابری آن‌ها آپلود می‌کنید و بلافاصله پردازش آن‌ها با استفاده از الگوریتم‌های پیشرفته OCR آغاز می‌شود. حتی می تواند کل پوشه ها و صدها فایل پی دی اف را یکجا پردازش کند.

نانوشبکه‌ها می‌توانند همه چیز را از اسناد تایپ‌شده ساده گرفته تا طرح‌بندی‌های پیچیده با حاشیه‌نویسی‌های دست‌نویس، پس‌زمینه‌های رنگی، نمودارها و جداول، با استفاده از مدل‌های یادگیری عمیق برای دستیابی به دقت بالا در همه انواع سند، مدیریت کنند.

در اینجا چگونه کار می کند:

  1. بازدید Nanonets.com و ایجاد یک حساب کاربری رایگان.
  2. یک مدل OCR را از طیف گسترده مدل های از پیش آموزش دیده Nanonets برای فاکتورها، رسیدها یا سفارشات خرید انتخاب کنید. همچنین می توانید یک مدل سفارشی متناسب با انواع سند خاص خود بسازید.
  3. اسنادی را بارگذاری کنید که نمایانگر طرح‌بندی‌های مختلف و فیلدهای داده‌ای است که باید استخراج کنید. نانوشبکه ها این نمونه ها را تجزیه و تحلیل خواهند کرد تا ساختار اسناد شما را درک کنند.
  4. فیلدهای کلیدی را که می خواهید ضبط کنید، مانند تاریخ، مقدار کل و داده های جدول تعریف کنید. تقریباً می‌توانید داده‌ها را در هر قالبی از جمله جداول، متن، JSON یا XML ضبط کنید. نانوشبکه ها به طور خودکار داده ها را از فایل های PDF شما استخراج کرده و در فرمت مورد نیاز خروجی می گیرند.
  5. پس از پیکربندی، اسناد PDF خود را که نیاز به ویرایش OCR دارند، آپلود کنید. نانوشبکه‌ها فایل‌ها را با استفاده از OCR پیشرفته و الگوریتم‌های استخراج هوشمند داده‌ها پردازش می‌کنند تا آنها را به فرمت‌های قابل جستجو و قابل ویرایش با خروجی داده‌های ساختاریافته تبدیل کند. 
  6. داده‌های استخراج‌شده به‌خوبی سازمان‌دهی شده و ساختار یافته‌اند تا شما مستقیماً بدون تلاش دستی وارد سیستم‌های تجاری دیگر شوید. می توانید آن را به فرمت های JSON، XML، orcustom صادر کنید.

Nanonets یک نسخه رایگان با حداکثر 500 صفحه پردازشی ارائه می دهد تا بتوانید بدون هیچ هزینه ای آن را آزمایش کنید. پس از آن هزینه دارد 0.3 دلار در هر صفحه برای OCR.

بر خلاف راه حل های دیگر، نانو شبکه ها بسیار مقیاس پذیر هستند. این می تواند هزاران صفحه را در ساعت پردازش کند و اطمینان حاصل کند که بدون توجه به حجم، فایل های شما تقریباً بلافاصله پردازش می شوند.

می‌توانید برای پخش جریانی داده‌های پردازش‌شده به برنامه‌های دیگر یا استفاده از APIهای توسعه‌دهنده Nanonets برای ایجاد ادغام‌های سفارشی، وب هوک‌ها را راه‌اندازی کنید.

نحوه بهبود فرآیند PDF OCR

فناوری OCR، زمانی که به طور موثر پیاده سازی شود، می تواند در زمان و منابع شما صرفه جویی کند. تصور کنید بتوانید کاهش دهید زمان ورود داده در هر فیلد 95٪. تیم شما می‌تواند روی کارهای معنادارتر از ورود داده‌های معمولی تمرکز کند.

بیایید نکاتی را برای بهبود دقت و اثربخشی فرآیند PDF OCR خود بررسی کنیم:

1. قبل از OCR اسکن را از قبل انجام دهید

اگر با اسناد اسکن شده سر و کار دارید، می توانید روشنایی، کنتراست و وضوح را تنظیم کنید و از فیلترها یا تکنیک های بهبود تصویر برای کاهش نویز و بهبود وضوح استفاده کنید. 

این به طور قابل توجهی دقت OCR را افزایش می دهد. برنامه اسکنر Adobe دارای ویژگی های داخلی بهبود تصویر است. همچنین می توانید از ابزارهایی مانند PaperScan و NAPS2 برای تمیز کردن اسکن ها استفاده کنید. پس از این ویرایش ها، می توانید تصاویر ویرایش شده را قبل از اجرای OCR به صورت PDF ذخیره کنید.

2. گردش کار اعتبار سنجی و سلسله مراتب تایید را تنظیم کنید

با تنظیم قوانین اعتبارسنجی برای داده های استخراج شده، کیفیت داده ها را بهبود بخشید. به عنوان مثال، اگر شماره سفارش در یک سند دارای پنج رقم نباشد، به طور خودکار رد می شود یا برای بررسی دستی علامت گذاری می شود. به این ترتیب، می توانید خطاهای استخراج را پیدا کنید و فقط داده های معتبر را تأیید کنید. شما همچنین می توانید سیستم OCR خود را با پایگاه داده ها برای اعتبارسنجی داده های استخراج شده یکپارچه کنید.

می‌توانید سلسله‌مراتب تأییدی را تنظیم کنید که در آن کارمندان جوان ابتدا داده‌ها را بررسی می‌کنند و سپس کارمندان ارشد را برای امضای نهایی بررسی می‌کنند. با اعلان‌های خودکار و به‌روزرسانی‌های وضعیت زنده، می‌توانید شفافیت را حفظ کنید و از تعقیب تأیید جلوگیری کنید که منجر به پردازش سریع‌تر اسناد می‌شود.

3. ایجاد گردش کار خودکار

تصور کنید کرایه اتومبیل را اجرا کنید و بتوانید به طور خودکار داده های گواهینامه رانندگی مشتریان را به Salesforce صادر کنید یا داده های فاکتور را بدون هیچ کار دستی به QuickBooks ارسال کنید. نه تنها PDF OCR شما را بهینه می کند، بلکه فعالیت های پایین دستی را نیز بهینه می کند.

ادغام راه حل OCR خود با برنامه های تجاری از طریق API ها این اتوماسیون را ممکن می کند. به عنوان مثال، با نانوشبکه‌ها، شما به سادگی تریگرها را بر اساس رویدادهایی مانند تکمیل پردازش سند، استخراج داده یا آپلود فایل جدید تنظیم می‌کنید. این ادغام به طور خودکار داده های ساختاریافته را از نانو نت ها به سیستم های تجاری دلخواه صادر می کند - از جمله QuickBooks، Xero، Microsoft Dynamics، Zendesk و بسیاری دیگر - تلاش های دستی را حذف می کند و جریان یکپارچه داده بین سیستم ها را تضمین می کند.

4. روی OCR پیشرفته با قابلیت های AI/ML سرمایه گذاری کنید

برخلاف OCR مبتنی بر قوانین، مدل‌های هوش مصنوعی تطبیقی ​​هستند - به طور مداوم از اصلاحات انسانی یاد می‌گیرند و در طول زمان بهبود می‌یابند. به عنوان مثال، Nanonets یک مدل هوش مصنوعی اختصاصی ارائه می‌دهد که بر روی میلیون‌ها سند آموزش دیده است و به آن اجازه می‌دهد طرح‌بندی‌های پیچیده و چالش‌برانگیز را به طور موثر مدیریت کند.

OCR مجهز به هوش مصنوعی تضمین می کند که می توانید اطلاعات را از اسناد بدون از دست دادن زمینه استخراج کنید. این می تواند زبان های مختلف، واحدهای پولی، حقوقی یا اندازه گیری را مدیریت کند. این سطح از هوش با استخراج مبتنی بر الگو یا قواعد مبتنی بر مکان‌های میدانی دقیق امکان‌پذیر نیست.

5. مدل های AI-OCR را آموزش دهید

در حالی که راه‌حل‌های OCR مجهز به هوش مصنوعی با مدل‌های از پیش آموزش‌دیده ارائه می‌شوند، آموزش بیشتر آنها در مورد انواع اسناد و طرح‌بندی‌های خاص شما می‌تواند دقت را حتی بیشتر افزایش دهد. به عنوان مثال، Nanonets به شما اجازه می‌دهد مجموعه‌ای از اسناد را بارگذاری کنید که نشان‌دهنده الگوها، قالب‌ها و فیلدهای مختلفی است که می‌خواهید ثبت کنید.

این نمونه ها به مدل کمک می کند تا ساختار اسناد شما را درک کند و فرآیند PDF OCR را به خوبی تنظیم کند. همچنین می توانید با تصحیح خطاهای استخراج شناسایی شده در حین اعتبارسنجی، بازخورد ارائه دهید. این آموزش انسان در حلقه به طور مداوم عملکرد مدل هوش مصنوعی را افزایش می دهد.

6. در صورت نیاز مدل های OCR سفارشی بسازید

گاهی اوقات، مدل های از پیش آموزش دیده ممکن است تمام پیچیدگی های اسناد شما را پوشش ندهند. به عنوان مثال، ممکن است اسناد خاص صنعت با زمینه ها و قالب های منحصر به فرد داشته باشید. در چنین مواردی، می‌توانید با فروشنده OCR خود برای ساخت مدل‌های AI سفارشی که به طور خاص بر روی اسناد شما آموزش داده شده‌اند، کار کنید. 

با نانوشبکه ها، کاربران می توانند مدل های سفارشی مخصوص انواع اسناد و فیلدهای خود را برای استخراج ایجاد کنند. آنها می توانند اسناد نمونه را آپلود کنند و با برچسب هایی که می خواهند استخراج کنند، آنها را حاشیه نویسی کنند. سپس هوش مصنوعی از این مثال ها یاد می گیرد و برای تشخیص و استخراج اطلاعات مشخص شده آموزش می بیند. این سیستم برای دستیابی به دقت مطلوب حداقل به ده نمونه برای هر برچسب نیاز دارد و کاربران می توانند تعداد نمونه ها را برای هر برچسب نظارت کرده و در صورت نیاز موارد بیشتری را اضافه کنند.

چگونه با Nanonets PDF OCR شروع کنیم

نانو شبکه ها شروع به کار با PDF OCR را آسان می کند. به سادگی برای یک حساب کاربری رایگان در وب سایت Nanonets ثبت نام کنید. شما نیازی به ارائه کارت اعتباری ندارید. 

در اینجا یک راهنمای برای کمک به شما برای شروع وجود دارد:

  1. ثبت نام برای یک حساب کاربری رایگان: بازدید کنید Nanonets.com و برای یک حساب رایگان ثبت نام کنید—بدون نیاز به کارت اعتباری.
  2. یک مدل ایجاد یا انتخاب کنید: می توانید یک مدل OCR سفارشی برای انواع اسناد خاص خود بسازید یا از مدل های از پیش آموزش دیده Nanonets برای فاکتورها، رسیدها و موارد دیگر انتخاب کنید.
  3. راه‌اندازی واردات خودکار: ایمیل‌ها را فوروارد کنید یا فضای ذخیره‌سازی ابری را متصل کنید تا فایل‌های PDF جدید به نانوشبکه‌ها برای پردازش OCR مداوم به صورت خودکار وارد شوند.
  4. اسناد نمونه را بارگذاری کنید: حداقل 10 سند نمونه را آپلود کنید که نشان دهنده الگوها، قالب‌ها و فیلدهای داده‌ای است که می‌خواهید استخراج کنید. این به آموزش مدل هوش مصنوعی کمک می کند.
  5. فیلدهایی را برای استخراج تعریف کنید: به سادگی نام فیلدهای داده مهمی را که می خواهید از اسناد خود استخراج کنید، مانند تاریخ، مقدار، داده های جدول و غیره مشخص کنید.
  6. اعتبارسنجی ها را تنظیم کنید: قوانینی را برای اعتبارسنجی داده های استخراج شده پیکربندی کنید و برای اطمینان از صحت، هرگونه خطا را برای اصلاح علامت گذاری کنید.
  7. فایل های خود را پردازش کنید: اسناد PDF خود را آپلود کنید. نانو شبکه‌ها فوراً آنها را با OCR و استخراج هوشمند داده‌ها پردازش می‌کنند.
  8. بررسی و تایید داده ها: داده های استخراج شده را بررسی کنید و ورودی های معتبر را تأیید کنید. شفافیت را با به روز رسانی وضعیت حفظ کنید.
  9. صادرات داده ها به سیستم های تجاری: پس از تأیید، داده های ساختار یافته را به طور یکپارچه به ERP، حسابداری، CRM یا سایر سیستم های خود صادر کنید.
  10. گردش کار را خودکار کنید: راه‌اندازی را برای پخش جریانی داده‌ها به برنامه‌ها هنگام پردازش سند یا استخراج داده‌ها تنظیم کنید. تلاش های دستی را حذف کنید.

به طور کلی، نانوشبکه‌ها افزودن قابلیت‌های OCR هوشمند به جریان کار اسناد شما را سریع و آسان می‌سازد. موتور هوش مصنوعی خودآموز از همان ابتدا دقت بالایی را ارائه می دهد و در عین حال امکان سفارشی سازی برای مدیریت اسناد پیچیده را فراهم می کند. یکپارچه‌سازی یکپارچه با سیستم‌های تجاری، اتوماسیون واقعی سرتاسر را امکان‌پذیر می‌سازد.

پسگفتار

OCR هوشمند و استخراج داده می تواند به باز کردن ارزش فوق العاده از جریان کار اسناد کمک کند. نکته کلیدی انتخاب راه حلی مانند نانو نت است که OCR مبتنی بر هوش مصنوعی را از ابتدا ارائه می دهد و امکان سفارشی سازی برای نیازهای خاص را فراهم می کند. 

با قابلیت‌های سلف‌سرویس برای ساخت مدل‌های سفارشی، دقت و اتوماسیون به طور مداوم حتی با تکامل اسناد شما بهبود می‌یابد. در نهایت، این تضمین می کند که می توانید داده های بدون ساختار را در مقیاس مدیریت کنید تا بهره وری و رشد را افزایش دهید.

نقطه_img

جدیدترین اطلاعات

نقطه_img

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟