افلاطون ڈیٹا انٹیلی جنس.
عمودی تلاش اور Ai.

Amazon Textract | ایمیزون ویب سروسز

تاریخ:

ایمیزون ٹیکسٹ ایک مشین لرننگ (ML) سروس ہے جو روایتی آپٹیکل کریکٹر ریکگنیشن (OCR) کو پیچھے چھوڑتے ہوئے اسکین شدہ دستاویزات سے ٹیکسٹ، ہینڈ رائٹنگ اور ڈیٹا کو خودکار طریقے سے نکالنے کے قابل بناتی ہے۔ یہ قابل ذکر درستگی کے ساتھ جدولوں اور فارموں سے ڈیٹا کی شناخت، سمجھ اور نکال سکتا ہے۔ فی الحال، کئی کمپنیاں دستی نکالنے کے طریقوں یا بنیادی OCR سافٹ ویئر پر انحصار کرتی ہیں، جو کہ تھکا دینے والا اور وقت طلب ہے، اور اس کے لیے دستی کنفیگریشن کی ضرورت ہوتی ہے جسے فارم تبدیل ہونے پر اپ ڈیٹ کرنے کی ضرورت ہوتی ہے۔ Amazon Textract ان چیلنجوں کو حل کرنے میں مدد کرتا ہے ML کا استعمال کرتے ہوئے مختلف دستاویزات کی اقسام کو خود بخود پروسیس کرنے اور کم سے کم دستی مداخلت کے ساتھ درست طریقے سے معلومات نکالنے کے لیے۔ یہ آپ کو دستاویز کی پروسیسنگ کو خودکار کرنے اور نکالے گئے ڈیٹا کو مختلف مقاصد کے لیے استعمال کرنے کے قابل بناتا ہے، جیسے کہ قرضوں کی پروسیسنگ کو خود کار بنانا یا رسیدوں اور رسیدوں سے معلومات اکٹھا کرنا۔

چونکہ وبائی بیماری کے بعد سفر دوبارہ شروع ہوتا ہے، بہت سے معاملات میں مسافر کی ویکسینیشن کی حیثیت کی تصدیق کی ضرورت پڑ سکتی ہے۔ ہوٹلوں اور ٹریول ایجنسیوں کو اکثر اہم تفصیلات جمع کرنے کے لیے ویکسینیشن کارڈز کا جائزہ لینے کی ضرورت ہوتی ہے جیسے کہ آیا مسافر کو مکمل طور پر ویکسین لگائی گئی ہے، ویکسین کی تاریخیں، اور مسافر کا نام۔ کچھ ایجنسیاں کارڈز کی دستی تصدیق کے ذریعے یہ کام کرتی ہیں، جو عملے کے لیے وقت طلب ہو سکتی ہے اور انسانی غلطی کی گنجائش چھوڑ دیتی ہے۔ دوسروں نے اپنی مرضی کے مطابق حل تیار کیے ہیں، لیکن یہ مہنگے اور پیمانے پر مشکل ہوسکتے ہیں، اور ان پر عمل درآمد میں کافی وقت لگتا ہے۔ آگے بڑھتے ہوئے، مسافروں کی رازداری اور سہولت کا احترام کرتے ہوئے ویکسینیشن کی حیثیت کی تصدیق کے عمل کو اس طرح ہموار کرنے کے مواقع مل سکتے ہیں جو کاروبار کے لیے کارآمد ہو۔

ایمیزون ٹیکسٹریکٹ سوالات ان چیلنجوں سے نمٹنے میں مدد کرتا ہے۔ Amazon Textract Querys آپ کو صرف اس معلومات کے ٹکڑے کی وضاحت اور نکالنے کی اجازت دیتا ہے جس کی آپ کو دستاویز سے ضرورت ہے۔ یہ آپ کو دستاویز سے قطعی اور درست معلومات فراہم کرتا ہے۔

اس پوسٹ میں، ہم آپ کو Amazon Textract Querys کا استعمال کرتے ہوئے ویکسینیشن اسٹیٹس کی تصدیق کا حل تیار کرنے کے لیے مرحلہ وار نفاذ گائیڈ سے آگاہ کرتے ہیں۔ حل یہ دکھاتا ہے کہ ایمیزون ٹیکسٹریکٹ استفسار کا استعمال کرتے ہوئے ویکسینیشن کارڈز پر کارروائی کیسے کی جائے، ویکسینیشن کی حیثیت کی تصدیق کی جائے، اور مستقبل کے استعمال کے لیے معلومات کو محفوظ کیا جائے۔

حل جائزہ

مندرجہ ذیل خاکہ حل کے فن تعمیر کی وضاحت کرتا ہے۔

ورک فلو میں درج ذیل مراحل شامل ہیں:

  1. صارف ویکسینیشن کارڈ کی تصویر لیتا ہے۔
  2. تصویر ایک پر اپ لوڈ کی گئی ہے۔ ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) بالٹی۔
  3. جب تصویر S3 بالٹی میں محفوظ ہو جاتی ہے، تو یہ ایک کو طلب کرتی ہے۔ AWS اسٹیپ فنکشنز ورک فلو:
  4. سوالات - فیصلہ کنندہ او ڈبلیو ایس لامبڈا۔ فنکشن پاس کی گئی دستاویز کی جانچ پڑتال کرتا ہے اور اسٹیپ فنکشنز ورک فلو میں مائم کی قسم، صفحات کی تعداد، اور سوالات کی تعداد کے بارے میں معلومات شامل کرتا ہے (ہماری مثال کے طور پر، ہمارے پاس چار سوالات ہیں)۔
  5. NumberQueriesAndPagesChoice ایک چوائس اسٹیٹ ہے جو ورک فلو میں مشروط منطق کا اضافہ کرتی ہے۔ اگر 15–31 کے درمیان سوالات ہیں اور صفحات کی تعداد 2–3,001 کے درمیان ہے، تو Amazon Textract غیر مطابقت پذیر پروسیسنگ واحد آپشن ہے، کیونکہ ہم وقت ساز APIs صرف 15 سوالات اور ایک صفحے کے دستاویزات کو سپورٹ کرتے ہیں۔ دیگر تمام معاملات کے لیے، ہم ہم وقت ساز یا غیر مطابقت پذیر پروسیسنگ کے بے ترتیب انتخاب کی طرف جاتے ہیں۔
  6. ۔ TextractSync Lambda فنکشن Amazon Textract کو درج ذیل Amazon Textract کے سوالات کی بنیاد پر دستاویز کا تجزیہ کرنے کی درخواست بھیجتا ہے۔
    1. ویکسینیشن کی حیثیت کیا ہے؟
    2. نام کیا ہے؟
    3. تاریخ پیدائش کیا ہے؟
    4. دستاویز نمبر کیا ہے؟
  7. Amazon Textract تصویر کا تجزیہ کرتا ہے اور ان سوالات کے جوابات Lambda فنکشن کو واپس بھیجتا ہے۔
  8. لیمبڈا فنکشن گاہک کی ویکسینیشن کی حیثیت کی تصدیق کرتا ہے اور حتمی نتیجہ کو CSV فارمیٹ میں اسی S3 بالٹی میں اسٹور کرتا ہے (demoqueries-textractxxx) میں csv-output فولڈر.

شرائط

اس حل کو مکمل کرنے کے لیے، آپ کے پاس AWS اکاؤنٹ اور حل کے حصے کے طور پر درکار وسائل بنانے کے لیے مناسب اجازت ہونی چاہیے۔

سے تعیناتی کوڈ اور نمونہ ویکسینیشن کارڈ ڈاؤن لوڈ کریں۔ GitHub کے.

Amazon Textract کنسول پر سوالات کی خصوصیت کا استعمال کریں۔

اس سے پہلے کہ آپ ویکسینیشن کی تصدیق کا حل تیار کریں، آئیے دریافت کریں کہ آپ Amazon Textract کنسول کے ذریعے ویکسینیشن کی حیثیت کو نکالنے کے لیے Amazon Textract Querys کا استعمال کیسے کر سکتے ہیں۔ آپ ویکسی نیشن کارڈ کا وہ نمونہ استعمال کر سکتے ہیں جسے آپ نے GitHub ریپو سے ڈاؤن لوڈ کیا ہے۔

  1. ایمیزون ٹیکسٹریکٹ کنسول پر، منتخب کریں۔ دستاویز کا تجزیہ کریں۔ نیوی گیشن پین میں.
  2. کے تحت دستاویز اپ لوڈ کریںمنتخب کریں دستاویز کا انتخاب کریں۔ اپنی مقامی ڈرائیو سے ویکسینیشن کارڈ اپ لوڈ کرنے کے لیے۔
  3. دستاویز اپ لوڈ کرنے کے بعد، منتخب کریں۔ سوالات میں دستاویز کو ترتیب دیں۔ سیکشن پر ایک اقتصادی کینڈر سکین کر لیں۔
  4. اس کے بعد آپ فطری زبان کے سوالات کی شکل میں سوالات شامل کر سکتے ہیں۔ آئیے درج ذیل شامل کریں:
    • ویکسینیشن کی حیثیت کیا ہے؟
    • نام کیا ہے؟
    • تاریخ پیدائش کیا ہے؟
    • دستاویز نمبر کیا ہے؟
  5. اپنے تمام سوالات شامل کرنے کے بعد، منتخب کریں۔ ترتیب کا اطلاق کریں۔.
  6. سوالات چیک کریں۔ سوالات کے جوابات دیکھنے کے لیے ٹیب پر کلک کریں۔

آپ Amazon Textract کو دستاویز سے آپ کے سوال کا جواب نکالتے ہوئے دیکھ سکتے ہیں۔

ویکسینیشن کی تصدیق کے حل کو تعینات کریں۔

اس پوسٹ میں، ہم ایک استعمال کرتے ہیں AWS کلاؤڈ 9 مثال کے ساتھ مثال کے طور پر ضروری انحصار کو انسٹال کریں اور انسٹال کریں۔ AWS کلاؤڈ ڈویلپمنٹ کٹ (AWS CDK) اور ڈوکر۔ AWS Cloud9 ایک کلاؤڈ پر مبنی مربوط ترقیاتی ماحول (IDE) ہے جو آپ کو صرف ایک براؤزر کے ساتھ اپنے کوڈ کو لکھنے، چلانے اور ڈیبگ کرنے دیتا ہے۔

  1. ٹرمینل میں، منتخب کریں۔ مقامی فائلیں اپ لوڈ کریں۔ پر فائل مینو.
  2. میں سے انتخاب کریں فولڈر منتخب کریں اور منتخب کریں vaccination_verification_solution فولڈر جو آپ نے GitHub سے ڈاؤن لوڈ کیا ہے۔
  3. ٹرمینل میں، اپنے ڈویلپمنٹ ورک فلو کے بعد کے مراحل کے لیے اپنی سرور لیس ایپلیکیشن تیار کریں۔ AWS سرور لیس ایپلیکیشن ماڈل (AWS SAM) درج ذیل کمانڈ کا استعمال کرتے ہوئے:
    $ cd vaccination_verification_solution/
    $ pip install -r requirements.txt
    

  4. کا استعمال کرتے ہوئے ایپلیکیشن کو تعینات کریں۔ cdk deploy کمانڈ:
    cdk deploy DemoQueries --outputs-file demo_queries.json --require-approval never

    AWS CDK کے ماڈل کو تعینات کرنے اور ٹیمپلیٹ میں مذکور وسائل تخلیق کرنے کا انتظار کریں۔

  5. جب تعیناتی مکمل ہو جائے تو، آپ پر تعینات وسائل کو چیک کر سکتے ہیں۔ AWS کلاؤڈ فارمیشن پر کنسول وسائل اسٹیک تفصیلات والے صفحے کا ٹیب۔

حل کی جانچ کریں۔

اب حل کو جانچنے کا وقت آگیا ہے۔ ورک فلو کو متحرک کرنے کے لیے، استعمال کریں۔ aws s3 cp اپ لوڈ کرنے کے لیے vac_card.jpg فائل پر DemoQueries.DocumentUploadLocation دستاویزات کے فولڈر کے اندر:

aws s3 cp docs/vac_card.JPG $(aws cloudformation list-exports --query 'Exports[?Name==`DemoQueries-DocumentUploadLocation`].Value' --output text)


ویکسینیشن سرٹیفکیٹ فائل خود بخود S3 بالٹی پر اپ لوڈ ہو جاتی ہے۔ demoqueries-textractxxx اپ لوڈ فولڈر میں۔

جیسے ہی ویکسینیشن سرٹیفکیٹ فائل S3 بالٹی پر اپ لوڈ ہوتی ہے اسٹیپ فنکشنز ورک فلو کو لیمبڈا فنکشن کے ذریعے متحرک کیا جاتا ہے۔

Queries-Decider Lambda فنکشن دستاویز کی جانچ پڑتال کرتا ہے اور اسٹیپ فنکشنز ورک فلو میں مائم کی قسم، صفحات کی تعداد، اور سوالات کی تعداد کے بارے میں معلومات شامل کرتا ہے (اس مثال کے طور پر، ہم چار سوالات استعمال کرتے ہیں—دستاویز نمبر، صارف کا نام، تاریخ کی پیدائش، اور ویکسینیشن کی حیثیت)۔

۔ TextractSync فنکشن ان پٹ سوالات کو ایمیزون ٹیکسٹریکٹ کو بھیجتا ہے اور جواب کے حصے کے طور پر مطابقت پذیری سے مکمل نتیجہ واپس کرتا ہے۔ یہ 1 صفحات پر مشتمل دستاویزات (TIFF، PDF، JPG، PNG) اور 15 سوالات تک کی حمایت کرتا ہے۔ دی GenerateCsvTask فنکشن Amazon Textract سے JSON آؤٹ پٹ لیتا ہے اور اسے CSV فائل میں تبدیل کرتا ہے۔

فائنل آؤٹ پٹ اسی S3 بالٹی میں CSV-output فولڈر میں CSV فائل کے طور پر محفوظ کیا جاتا ہے۔

آپ درج ذیل کمانڈ کا استعمال کرکے فائل کو اپنی مقامی مشین میں ڈاؤن لوڈ کرسکتے ہیں۔

aws s3 cp <paste the S3 URL from TextractOutputCSVPath>

نتیجہ کی شکل یہ ہے۔ timestamp, classification, filename, page number, key name, key_confidence, value, value_confidence, key_bb_top, key_bb_height, key_bb.width, key_bb_left, value_bb_top, value_bb_height, value_bb_width, value_bb_left.

آپ ایک سے زیادہ صارفین کے لیے ویکسینیشن سرٹیفکیٹ کے سیکڑوں دستاویزات کے حل کو ان کے ویکسینیشن سرٹیفکیٹس کو اپ لوڈ کرکے اس پر حاصل کرسکتے ہیں۔ DemoQueries.DocumentUploadLocation. یہ خود بخود سٹیپ فنکشنز سٹیٹ مشین کے متعدد رن کو متحرک کرتا ہے، اور حتمی نتیجہ csv-output فولڈر میں اسی S3 بالٹی میں محفوظ ہو جاتا ہے۔

سوالات کے ابتدائی سیٹ کو تبدیل کرنے کے لیے جنہیں Amazon Textract میں فیڈ کیا گیا ہے، آپ اپنے AWS Cloud9 مثال پر جا کر start_execution.py فائل کھول سکتے ہیں۔ بائیں پین میں فائل ویو میں، لیمبڈا پر جائیں، start_queries, app, start_execution.py. اس لیمبڈا فنکشن کو اس وقت استعمال کیا جاتا ہے جب کوئی فائل اپ لوڈ کی جاتی ہے۔ DemoQueries.DocumentUploadLocation. ورک فلو کو بھیجے گئے سوالات کی وضاحت اس میں کی گئی ہے۔ start_execution.py; آپ کوڈ کو اپ ڈیٹ کرکے ان کو تبدیل کرسکتے ہیں جیسا کہ درج ذیل اسکرین شاٹ میں دکھایا گیا ہے۔

صاف کرو

جاری چارجز سے بچنے کے لیے، درج ذیل کمانڈ کا استعمال کرتے ہوئے اس پوسٹ میں بنائے گئے وسائل کو حذف کریں:

cdk destroy DemoQueries

سوال کا جواب Are you sure you want to delete: DemoQueries (y/n)? y کے ساتھ

نتیجہ

اس پوسٹ میں، ہم نے آپ کو دکھایا کہ Amazon Textract Querys کو کس طرح استعمال کیا جائے تاکہ ٹریول انڈسٹری کے لیے ویکسینیشن کی تصدیق کا حل بنایا جائے۔ آپ دیگر صنعتوں جیسے فنانس اور ہیلتھ کیئر میں حل تیار کرنے کے لیے Amazon Textract Querys کا استعمال کر سکتے ہیں، اور قدرتی زبان کے سوالات پر مبنی پے اسٹبس، مارگیج نوٹ، اور انشورنس کارڈز جیسی دستاویزات سے معلومات حاصل کر سکتے ہیں۔

مزید معلومات کے لئے، دیکھیں دستاویزات کا تجزیہ، یا Amazon Textract کنسول کو چیک کریں اور اس فیچر کو آزمائیں۔


مصنفین کے بارے میں

دھیرج ٹھاکر ایمیزون ویب سروسز کے ساتھ ایک حل آرکیٹیکٹ ہے۔ وہ AWS صارفین اور شراکت داروں کے ساتھ کام کرتا ہے تاکہ انٹرپرائز کلاؤڈ اپنانے، منتقلی اور حکمت عملی کے بارے میں رہنمائی فراہم کرے۔ وہ ٹیکنالوجی کے بارے میں پرجوش ہے اور تجزیات اور AI/ML اسپیس میں تعمیر اور تجربہ کرنے سے لطف اندوز ہوتا ہے۔

رشبھ یادیو AWS میں DevOps اور سیکیورٹی پیشکشوں میں ایک وسیع پس منظر کے ساتھ AWS میں ایک پارٹنر سلوشنز آرکیٹیکٹ ہے۔ وہ ASEAN کے شراکت داروں کے ساتھ مل کر کام کرتا ہے تاکہ انٹرپرائز کلاؤڈ کو اپنانے اور فن تعمیر کے جائزوں کے ساتھ ساتھ اچھی طرح سے تعمیر شدہ فریم ورک کے نفاذ کے ذریعے AWS طریقوں کی تعمیر کے بارے میں رہنمائی فراہم کرے۔ کام سے باہر، وہ کھیلوں کے میدان اور FPS گیمنگ میں اپنا وقت گزارنا پسند کرتا ہے۔

اسپاٹ_مگ

تازہ ترین انٹیلی جنس

اسپاٹ_مگ

ہمارے ساتھ بات چیت

ہیلو وہاں! میں آپ کی کیسے مدد کر سکتا ہوں؟