افلاطون ڈیٹا انٹیلی جنس.
عمودی تلاش اور Ai.

ایمیزون سیج میکر جمپ اسٹارٹ سے تعینات ایل ایل ایم کے لیے ایمبیڈنگ ڈرفٹ کی نگرانی کریں ایمیزون ویب سروسز

تاریخ:

جنریٹیو AI ورک بوجھ کے لیے سب سے مفید ایپلیکیشن پیٹرن میں سے ایک Retrieval Augmented Generation (RAG) ہے۔ RAG پیٹرن میں، ہم ایمبیڈنگز پر مماثلت کی تلاش کرتے ہوئے ان پٹ پرامپٹ سے متعلق حوالہ جاتی مواد کے ٹکڑے تلاش کرتے ہیں۔ ایمبیڈنگز متن کے باڈیز میں معلوماتی مواد کو پکڑتی ہیں، جس سے قدرتی لینگویج پروسیسنگ (NLP) ماڈلز کو زبان کے ساتھ عددی شکل میں کام کرنے کی اجازت ملتی ہے۔ ایمبیڈنگز فلوٹنگ پوائنٹ نمبرز کے صرف ویکٹر ہیں، اس لیے ہم تین اہم سوالات کے جوابات دینے کے لیے ان کا تجزیہ کر سکتے ہیں: کیا ہمارا حوالہ ڈیٹا وقت کے ساتھ بدل رہا ہے؟ کیا صارفین جو سوالات پوچھ رہے ہیں وہ وقت کے ساتھ بدل رہے ہیں؟ اور آخر میں، پوچھے جانے والے سوالات کا احاطہ کرنے والا ہمارا حوالہ ڈیٹا کتنا اچھا ہے؟

اس پوسٹ میں، آپ ویکٹر کے تجزیہ کو سرایت کرنے اور سرایت بڑھنے کے سگنلز کا پتہ لگانے کے بارے میں کچھ غور و فکر کے بارے میں جانیں گے۔ چونکہ سرایت عام طور پر NLP ماڈلز کے لیے ڈیٹا کا ایک اہم ذریعہ ہیں اور خاص طور پر تخلیقی AI سلوشنز، ہمیں یہ پیمائش کرنے کے لیے ایک طریقہ درکار ہے کہ آیا ہماری ایمبیڈنگز وقت کے ساتھ تبدیل ہو رہی ہیں (بہتی ہوئی)۔ اس پوسٹ میں، آپ کو بڑے لینگویج ماڈلز (LLMS) کے ساتھ کلسٹرنگ تکنیک کا استعمال کرتے ہوئے سرایت کرنے والے ویکٹر پر بڑھے ہوئے پتہ لگانے کی ایک مثال نظر آئے گی۔ ایمیزون سیج میکر جمپ اسٹارٹ. آپ ان تصورات کو دو فراہم کردہ مثالوں کے ذریعے بھی دریافت کر سکیں گے، بشمول ایک اختتام سے آخر تک نمونہ کی درخواست یا اختیاری طور پر، ایپلیکیشن کا سب سیٹ۔

RAG کا جائزہ

۔ RAG پیٹرن آپ کو بیرونی ذرائع، جیسے پی ڈی ایف دستاویزات، ویکی آرٹیکلز، یا کال ٹرانسکرپٹس سے علم کی بازیافت کرنے دیتا ہے، اور پھر اس علم کا استعمال LLM کو بھیجے گئے انسٹرکشن پرامپٹ کو بڑھانے کے لیے کرتا ہے۔ یہ LLM کو جواب پیدا کرتے وقت مزید متعلقہ معلومات کا حوالہ دینے کی اجازت دیتا ہے۔ مثال کے طور پر، اگر آپ کسی LLM سے چاکلیٹ چپ کوکیز بنانے کا طریقہ پوچھتے ہیں، تو اس میں آپ کی اپنی ریسیپی لائبریری سے معلومات شامل ہو سکتی ہیں۔ اس پیٹرن میں، ترکیب کا متن سرایت کرنے والے ماڈل کا استعمال کرتے ہوئے سرایت کرنے والے ویکٹر میں تبدیل کیا جاتا ہے، اور ویکٹر ڈیٹا بیس میں محفوظ کیا جاتا ہے۔ آنے والے سوالات کو سرایت کرنے میں تبدیل کر دیا جاتا ہے، اور پھر ویکٹر ڈیٹا بیس متعلقہ مواد کو تلاش کرنے کے لیے مماثلت کی تلاش چلاتا ہے۔ سوال اور حوالہ کا ڈیٹا پھر LLM کے پرامپٹ میں جاتا ہے۔

آئیے ان ایمبیڈنگ ویکٹرز پر گہری نظر ڈالتے ہیں جو بنتے ہیں اور ان ویکٹرز پر بڑھے ہوئے تجزیہ کو کیسے انجام دیتے ہیں۔

ایمبیڈنگ ویکٹر پر تجزیہ

سرایت کرنے والے ویکٹر ہمارے ڈیٹا کی عددی نمائندگی ہیں لہذا ان ویکٹرز کا تجزیہ ہمارے حوالہ جات کے اعداد و شمار کی بصیرت فراہم کر سکتا ہے جسے بعد میں بڑھے ہوئے ممکنہ سگنلز کا پتہ لگانے کے لیے استعمال کیا جا سکتا ہے۔ سرایت کرنے والے ویکٹر n-جہتی جگہ میں ایک آئٹم کی نمائندگی کرتے ہیں، جہاں n اکثر بڑا ہوتا ہے۔ مثال کے طور پر، اس پوسٹ میں استعمال ہونے والا GPT-J 6B ماڈل 4096 سائز کے ویکٹر بناتا ہے۔ بڑھے ہوئے کی پیمائش کرنے کے لیے، فرض کریں کہ ہماری ایپلیکیشن ریفرنس ڈیٹا اور آنے والے اشارے دونوں کے لیے سرایت کرنے والے ویکٹر کو پکڑتی ہے۔

ہم پرنسپل اجزاء تجزیہ (PCA) کا استعمال کرتے ہوئے طول و عرض میں کمی کو انجام دینے سے شروع کرتے ہیں۔ PCA ڈیٹا میں زیادہ تر تغیرات کو محفوظ رکھتے ہوئے طول و عرض کی تعداد کو کم کرنے کی کوشش کرتا ہے۔ اس صورت میں، ہم ان ڈائمینشنز کی تعداد تلاش کرنے کی کوشش کرتے ہیں جو 95% تغیرات کو محفوظ رکھتی ہے، جو دو معیاری انحراف کے اندر کسی بھی چیز کو حاصل کرے۔

پھر ہم کلسٹر مراکز کے سیٹ کی شناخت کے لیے K-Means استعمال کرتے ہیں۔ K-Means کوشش کرتا ہے کہ پوائنٹس کو ایک ساتھ کلسٹرز میں گروپ کیا جائے کہ ہر کلسٹر نسبتاً کمپیکٹ ہو اور کلسٹرز ایک دوسرے سے جتنا ممکن ہو دور ہوں۔

ہم درج ذیل اعداد و شمار میں دکھائے گئے کلسٹرنگ آؤٹ پٹ کی بنیاد پر درج ذیل معلومات کا حساب لگاتے ہیں۔

  • PCA میں طول و عرض کی تعداد جو 95% تغیرات کی وضاحت کرتی ہے۔
  • ہر کلسٹر سینٹر، یا سینٹرائڈ کا مقام

مزید برآں، ہم ہر کلسٹر میں نمونوں کے تناسب (اعلیٰ یا کم) کو دیکھتے ہیں، جیسا کہ درج ذیل تصویر میں دکھایا گیا ہے۔

آخر میں، ہم اس تجزیہ کو درج ذیل کا حساب لگانے کے لیے استعمال کرتے ہیں:

  • جڑتا - Inertia کلسٹر سینٹروائڈز کے مربع فاصلوں کا مجموعہ ہے، جس سے اندازہ ہوتا ہے کہ K-Means کا استعمال کرتے ہوئے ڈیٹا کو کتنی اچھی طرح سے کلسٹر کیا گیا تھا۔
  • سلہیٹ سکور - سلہیٹ سکور کلسٹرز کے اندر مستقل مزاجی کی توثیق کا ایک پیمانہ ہے، اور اس کی رینج -1 سے 1 تک ہے۔ 1 کے قریب قدر کا مطلب ہے کہ ایک کلسٹر کے پوائنٹس اسی کلسٹر کے دوسرے پوائنٹس کے قریب ہیں اور اس سے بہت دور ہیں۔ دوسرے کلسٹرز کے پوائنٹس۔ سلہیٹ سکور کی بصری نمائندگی مندرجہ ذیل تصویر میں دیکھی جا سکتی ہے۔

ہم وقتاً فوقتاً اس معلومات کو ماخذ حوالہ ڈیٹا اور پرامپٹس دونوں کے لیے سرایت کرنے کے سنیپ شاٹس کے لیے حاصل کر سکتے ہیں۔ اس ڈیٹا کو کیپچر کرنے سے ہمیں ایمبیڈنگ ڈرفٹ کے ممکنہ سگنلز کا تجزیہ کرنے کی اجازت ملتی ہے۔

ایمبیڈنگ ڈرفٹ کا پتہ لگانا

وقتاً فوقتاً، ہم ڈیٹا کے اسنیپ شاٹس کے ذریعے کلسٹرنگ کی معلومات کا موازنہ کر سکتے ہیں، جس میں حوالہ ڈیٹا ایمبیڈنگز اور پرامپٹ ایمبیڈنگز شامل ہیں۔ سب سے پہلے، ہم ایمبیڈنگ ڈیٹا، جڑتا، اور کلسٹرنگ جاب سے سلائیٹ سکور میں 95% تغیرات کی وضاحت کے لیے درکار جہتوں کی تعداد کا موازنہ کر سکتے ہیں۔ جیسا کہ آپ مندرجہ ذیل جدول میں دیکھ سکتے ہیں، ایک بیس لائن کے مقابلے میں، سرایت کرنے کے تازہ ترین اسنیپ شاٹ کو تغیر کی وضاحت کے لیے مزید 39 جہتوں کی ضرورت ہے، جو اس بات کی نشاندہی کرتی ہے کہ ہمارا ڈیٹا زیادہ منتشر ہے۔ جڑتا بڑھ گیا ہے، جس سے ظاہر ہوتا ہے کہ نمونے مجموعی طور پر اپنے کلسٹر مراکز سے بہت دور ہیں۔ مزید برآں، سلائیٹ سکور نیچے چلا گیا ہے، جس سے ظاہر ہوتا ہے کہ کلسٹرز کی اتنی اچھی طرح وضاحت نہیں کی گئی ہے۔ فوری اعداد و شمار کے لیے، یہ اس بات کی نشاندہی کر سکتا ہے کہ سسٹم میں آنے والے سوالات کی اقسام زیادہ موضوعات کا احاطہ کر رہی ہیں۔

اگلا، مندرجہ ذیل تصویر میں، ہم دیکھ سکتے ہیں کہ ہر کلسٹر میں نمونوں کا تناسب وقت کے ساتھ کس طرح تبدیل ہوا ہے۔ یہ ہمیں دکھا سکتا ہے کہ آیا ہمارا نیا حوالہ ڈیٹا بڑے پیمانے پر پچھلے سیٹ سے ملتا جلتا ہے، یا نئے علاقوں کا احاطہ کرتا ہے۔

آخر میں، ہم دیکھ سکتے ہیں کہ آیا کلسٹر سینٹرز حرکت کر رہے ہیں، جو کلسٹرز میں موجود معلومات میں بہاؤ کو ظاہر کرے گا، جیسا کہ درج ذیل جدول میں دکھایا گیا ہے۔

آنے والے سوالات کے لیے ڈیٹا کوریج کا حوالہ دیں۔

ہم اس بات کا بھی اندازہ لگا سکتے ہیں کہ ہمارا حوالہ ڈیٹا آنے والے سوالات سے کتنی اچھی طرح سے مطابقت رکھتا ہے۔ ایسا کرنے کے لیے، ہم ہر ایک پرامپٹ ایمبیڈنگ کو حوالہ ڈیٹا کلسٹر میں تفویض کرتے ہیں۔ ہم ہر پرامپٹ سے اس کے متعلقہ مرکز تک فاصلے کا حساب لگاتے ہیں، اور ان فاصلوں کے وسط، اوسط اور معیاری انحراف کو دیکھتے ہیں۔ ہم اس معلومات کو محفوظ کر سکتے ہیں اور دیکھ سکتے ہیں کہ یہ وقت کے ساتھ کیسے بدلتی ہے۔

مندرجہ ذیل اعداد و شمار وقت کے ساتھ ساتھ پرامپٹ ایمبیڈنگ اور ریفرنس ڈیٹا سینٹرز کے درمیان فاصلے کا تجزیہ کرنے کی ایک مثال دکھاتا ہے۔

جیسا کہ آپ دیکھ سکتے ہیں، ابتدائی بیس لائن اور تازہ ترین سنیپ شاٹ کے درمیان پرامپٹ ایمبیڈنگز اور ریفرنس ڈیٹا سینٹرز کے درمیان اوسط، درمیانی، اور معیاری انحراف کے فاصلے کے اعدادوشمار کم ہو رہے ہیں۔ اگرچہ فاصلے کی مطلق قدر کی تشریح کرنا مشکل ہے، لیکن ہم رجحانات کا استعمال اس بات کا تعین کرنے کے لیے کر سکتے ہیں کہ آیا حوالہ ڈیٹا اور آنے والے سوالات کے درمیان سیمنٹک اوورلیپ وقت کے ساتھ ساتھ بہتر ہوتا جا رہا ہے یا بدتر۔

نمونہ کی درخواست

پچھلے سیکشن میں زیر بحث تجرباتی نتائج کو اکٹھا کرنے کے لیے، ہم نے ایک نمونہ ایپلی کیشن بنایا ہے جو SageMaker JumpStart کے ذریعے تعینات کیے گئے ایمبیڈنگ اور جنریشن ماڈلز کا استعمال کرتے ہوئے RAG پیٹرن کو لاگو کرتا ہے اور اس پر میزبانی کرتا ہے۔ ایمیزون سیج میکر ریئل ٹائم اینڈ پوائنٹس۔

درخواست کے تین بنیادی اجزاء ہیں:

  • ہم ایک متعامل بہاؤ کا استعمال کرتے ہیں، جس میں لینگ چین کا استعمال کرتے ہوئے RAG آرکیسٹریشن پرت کے ساتھ مل کر پرامپٹ کیپچر کرنے کے لیے ایک صارف انٹرفیس شامل ہوتا ہے۔
  • ڈیٹا پروسیسنگ کا بہاؤ پی ڈی ایف دستاویزات سے ڈیٹا نکالتا ہے اور ایمبیڈنگز بناتا ہے جو اس میں محفوظ ہو جاتے ہیں۔ ایمیزون اوپن سرچ سروس. ہم ان کو ایپلیکیشن کے حتمی ایمبیڈنگ ڈرفٹ تجزیہ جزو میں بھی استعمال کرتے ہیں۔
  • ایمبیڈنگز اس میں پکڑی گئی ہیں۔ ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) کے ذریعے ایمیزون کائنیسس ڈیٹا فائر ہوز، اور ہم کا ایک مجموعہ چلاتے ہیں۔ AWS گلو ایمبیڈنگ تجزیہ کرنے کے لیے ایکسٹریکٹ، ٹرانسفارم، اور لوڈ (ETL) جابز اور Jupyter نوٹ بکس۔

درج ذیل خاکہ آخر سے آخر تک کے فن تعمیر کو واضح کرتا ہے۔

مکمل نمونہ کوڈ پر دستیاب ہے۔ GitHub کے. فراہم کردہ کوڈ دو مختلف نمونوں میں دستیاب ہے:

  • ایک Streamlit فرنٹ اینڈ کے ساتھ مکمل اسٹیک ایپلی کیشن کا نمونہ - یہ ایک اینڈ ٹو اینڈ ایپلیکیشن فراہم کرتا ہے، بشمول ایک صارف انٹرفیس جس میں پرامپٹ کیپچر کرنے کے لیے Streamlit کا استعمال کرتے ہوئے، RAG آرکیسٹریشن پرت کے ساتھ مل کر، LangChain پر چل رہا ہے۔ ایمیزون لچکدار کنٹینر سروس (ایمیزون ای سی ایس) کے ساتھ اے ڈبلیو ایس فارگیٹ
  • بیک اینڈ ایپلی کیشن - ان لوگوں کے لیے جو مکمل ایپلیکیشن اسٹیک کو تعینات نہیں کرنا چاہتے ہیں، آپ اختیاری طور پر صرف بیک اینڈ کو تعینات کرنے کا انتخاب کر سکتے ہیں۔ AWS کلاؤڈ ڈویلپمنٹ کٹ (AWS CDK) اسٹیک کریں، اور پھر LangChain کا ​​استعمال کرتے ہوئے RAG آرکیسٹریشن انجام دینے کے لیے فراہم کردہ Jupyter نوٹ بک کا استعمال کریں۔

فراہم کردہ نمونوں کو تخلیق کرنے کے لیے، مندرجہ ذیل حصوں میں تفصیل سے کئی شرائط ہیں، جن کی شروعات جنریٹو اور ٹیکسٹ ایمبیڈنگ ماڈلز کی تعیناتی سے ہوتی ہے اور پھر اضافی شرائط کی طرف بڑھتے ہیں۔

SageMaker JumpStart کے ذریعے ماڈلز تعینات کریں۔

دونوں پیٹرن ایمبیڈنگ ماڈل اور جنریٹیو ماڈل کی تعیناتی کو فرض کرتے ہیں۔ اس کے لیے، آپ SageMaker JumpStart سے دو ماڈلز تعینات کریں گے۔ پہلا ماڈل، GPT-J 6B، ایمبیڈنگ ماڈل کے طور پر استعمال ہوتا ہے اور دوسرا ماڈل، Falcon-40b، ٹیکسٹ جنریشن کے لیے استعمال ہوتا ہے۔

آپ ان میں سے ہر ایک ماڈل کو SageMaker JumpStart کے ذریعے سے تعینات کر سکتے ہیں۔ AWS مینجمنٹ کنسول, ایمیزون سیج میکر اسٹوڈیو، یا پروگرام کے لحاظ سے۔ مزید معلومات کے لیے رجوع کریں۔ جمپ اسٹارٹ فاؤنڈیشن ماڈلز کا استعمال کیسے کریں۔. تعیناتی کو آسان بنانے کے لیے، آپ استعمال کر سکتے ہیں۔ نوٹ بک فراہم کی SageMaker جمپ سٹارٹ کے ذریعہ خود بخود تخلیق کردہ نوٹ بک سے ماخوذ۔ یہ نوٹ بک ماڈلز کو SageMaker JumpStart ML حب سے کھینچتی ہے اور انہیں SageMaker کے دو الگ الگ ریئل ٹائم اینڈ پوائنٹس پر تعینات کرتی ہے۔

نمونے کی نوٹ بک میں صفائی کا سیکشن بھی ہے۔ اس سیکشن کو ابھی تک نہ چلائیں، کیونکہ یہ ابھی تعینات کیے گئے اینڈ پوائنٹس کو حذف کر دے گا۔ آپ واک تھرو کے اختتام پر صفائی مکمل کر لیں گے۔

اختتامی نقطوں کی کامیاب تعیناتی کی تصدیق کے بعد، آپ مکمل نمونہ کی درخواست کو تعینات کرنے کے لیے تیار ہیں۔ تاہم، اگر آپ صرف پسدید اور تجزیہ نوٹ بک کو تلاش کرنے میں زیادہ دلچسپی رکھتے ہیں، تو آپ اختیاری طور پر صرف وہی تعینات کر سکتے ہیں، جس کا اگلے حصے میں احاطہ کیا گیا ہے۔

آپشن 1: صرف بیک اینڈ ایپلیکیشن کو تعینات کریں۔

یہ پیٹرن آپ کو صرف پسدید حل کو تعینات کرنے اور Jupyter نوٹ بک کا استعمال کرتے ہوئے حل کے ساتھ بات چیت کرنے کی اجازت دیتا ہے۔ اگر آپ مکمل فرنٹ اینڈ انٹرفیس نہیں بنانا چاہتے ہیں تو یہ پیٹرن استعمال کریں۔

شرائط

آپ کے پاس درج ذیل شرائط ہونی چاہئیں:

  • ایک سیج میکر جمپ سٹارٹ ماڈل کا اختتامی نقطہ تعینات ہے۔ - SageMaker JumpStart کا استعمال کرتے ہوئے SageMaker کے ریئل ٹائم اینڈ پوائنٹس پر ماڈلز تعینات کریں، جیسا کہ پہلے بتایا گیا ہے۔
  • تعیناتی کے پیرامیٹرز - درج ذیل کو ریکارڈ کریں:
    • ٹیکسٹ ماڈل اینڈ پوائنٹ کا نام - SageMaker JumpStart کے ساتھ تعینات ٹیکسٹ جنریشن ماڈل کا اختتامی نام
    • ایمبیڈنگز ماڈل اینڈ پوائنٹ کا نام - SageMaker JumpStart کے ساتھ تعینات کردہ ایمبیڈنگ ماڈل کا اختتامی نام

AWS CDK کا استعمال کرتے ہوئے وسائل کی تعیناتی کریں۔

AWS CDK اسٹیک کو تعینات کرنے کے لیے پچھلے حصے میں بیان کردہ تعیناتی پیرامیٹرز کا استعمال کریں۔ AWS CDK کی تنصیب کے بارے میں مزید معلومات کے لیے، رجوع کریں۔ AWS CDK کے ساتھ شروع کرنا.

یقینی بنائیں کہ Docker انسٹال ہے اور ورک سٹیشن پر چل رہا ہے جو AWS CDK کی تعیناتی کے لیے استعمال کیا جائے گا۔ کا حوالہ دیتے ہیں ڈوکر حاصل کریں۔ اضافی رہنمائی کے ل.

$ cd pattern1-rag/cdk
$ cdk deploy BackendStack --exclusively -c textModelEndpointName=<Enter the SageMaker Endpoint Name for the Text generation model> -c embeddingsModelEndpointName=<Enter the SageMaker Endpoint Name for the Text embeddings model>

متبادل طور پر، آپ نام کی فائل میں سیاق و سباق کی اقدار درج کر سکتے ہیں۔ cdk.context.json میں pattern1-rag/cdk ڈائریکٹری اور چلائیں cdk deploy BackendStack --exclusively.

تعیناتی آؤٹ پٹس کو پرنٹ کرے گی، جن میں سے کچھ کو نوٹ بک چلانے کے لیے درکار ہوگا۔ اس سے پہلے کہ آپ سوال و جواب شروع کر سکیں، حوالہ جاتی دستاویزات کو سرایت کریں، جیسا کہ اگلے حصے میں دکھایا گیا ہے۔

حوالہ دستاویزات ایمبیڈ کریں۔

اس RAG اپروچ کے لیے، حوالہ جاتی دستاویزات پہلے ٹیکسٹ ایمبیڈنگ ماڈل کے ساتھ سرایت کی جاتی ہیں اور ایک ویکٹر ڈیٹا بیس میں محفوظ کی جاتی ہیں۔ اس حل میں، ایک ادخال پائپ لائن بنائی گئی ہے جو پی ڈی ایف دستاویزات کا استعمال کرتی ہے۔

An ایمیزون لچکدار کمپیوٹ کلاؤڈ (ایمیزون ای سی 2) مثال پی ڈی ایف دستاویز کے ادخال کے لیے بنائی گئی ہے۔ ایمیزون لچکدار فائل سسٹم (ایمیزون ای ایف ایس) فائل سسٹم پی ڈی ایف دستاویزات کو محفوظ کرنے کے لیے EC2 مثال پر نصب کیا گیا ہے۔ ایک AWS ڈیٹا سنک EFS فائل سسٹم پاتھ میں پائے جانے والے پی ڈی ایف دستاویزات کو لانے اور ٹیکسٹ ایمبیڈنگ کے عمل کو شروع کرنے کے لیے انہیں S3 بالٹی میں اپ لوڈ کرنے کے لیے ہر گھنٹے ٹاسک چلایا جاتا ہے۔ یہ عمل حوالہ جاتی دستاویزات کو سرایت کرتا ہے اور OpenSearch سروس میں سرایت کو محفوظ کرتا ہے۔ یہ بعد کے تجزیے کے لیے Kinesis Data Firehose کے ذریعے S3 بالٹی میں سرایت کرنے والے آرکائیو کو بھی محفوظ کرتا ہے۔

حوالہ جاتی دستاویزات کو داخل کرنے کے لیے، درج ذیل مراحل کو مکمل کریں:

  1. نمونہ EC2 مثال کی شناخت حاصل کریں جو بنائی گئی تھی (دیکھیں AWS CDK آؤٹ پٹ JumpHostId) اور استعمال کرتے ہوئے جڑیں۔ اجلاس مینیجرکی صلاحیت AWS سسٹمز مینیجر. ہدایات کے لیے رجوع کریں۔ AWS سسٹمز مینیجر سیشن مینیجر کے ساتھ اپنے لینکس مثال سے جڑیں۔.
  2. ڈائریکٹری پر جائیں۔ /mnt/efs/fs1، وہ جگہ ہے جہاں EFS فائل سسٹم نصب ہوتا ہے، اور ایک فولڈر بناتا ہے۔ ingest:
    $ cd /mnt/efs/fs1
    $ mkdir ingest && cd ingest

  3. اپنے حوالہ پی ڈی ایف دستاویزات میں شامل کریں۔ ingest ڈائریکٹری.

ڈیٹا سنک ٹاسک کو اس ڈائرکٹری میں پائی جانے والی تمام فائلوں کو ایمبیڈنگ کا عمل شروع کرنے کے لیے Amazon S3 پر اپ لوڈ کرنے کے لیے ترتیب دیا گیا ہے۔

DataSync کام ایک گھنٹے کے شیڈول پر چلتا ہے۔ آپ اختیاری طور پر اپنے شامل کردہ پی ڈی ایف دستاویزات کے لیے ایمبیڈنگ کا عمل فوری طور پر شروع کرنے کے لیے دستی طور پر کام شروع کر سکتے ہیں۔

  1. کام شروع کرنے کے لیے، AWS CDK آؤٹ پٹ سے ٹاسک ID کا پتہ لگائیں۔ DataSyncTaskID اور کام شروع کریں پہلے سے طے شدہ کے ساتھ.

ایمبیڈنگز بننے کے بعد، آپ جوپیٹر نوٹ بک کے ذریعے RAG سوال اور جواب دینا شروع کر سکتے ہیں، جیسا کہ اگلے حصے میں دکھایا گیا ہے۔

Jupyter نوٹ بک کا استعمال کرتے ہوئے سوال اور جواب دینا

درج ذیل مراحل کو مکمل کریں:

  1. AWS CDK آؤٹ پٹ سے SageMaker نوٹ بک مثال کے نام کو بازیافت کریں۔ NotebookInstanceName اور SageMaker کنسول سے JupyterLab سے جڑیں۔
  2. ڈائریکٹری پر جائیں۔ fmops/full-stack/pattern1-rag/notebooks/.
  3. نوٹ بک کھولیں اور چلائیں۔ query-llm.ipynb نوٹ بک مثال میں RAG کا استعمال کرتے ہوئے سوال اور جواب دینے کے لیے۔

کا استعمال یقینی بنائیں conda_python3 نوٹ بک کے لئے دانا.

یہ نمونہ پسدید حل کو تلاش کرنے کے لیے مفید ہے بغیر اضافی شرطوں کی فراہمی کے جو مکمل اسٹیک ایپلی کیشن کے لیے درکار ہیں۔ اگلا حصہ آپ کی تخلیقی AI ایپلیکیشن کے ساتھ تعامل کے لیے صارف انٹرفیس فراہم کرنے کے لیے ایک مکمل اسٹیک ایپلی کیشن کے نفاذ کا احاطہ کرتا ہے، جس میں فرنٹ اینڈ اور بیک اینڈ دونوں اجزاء شامل ہیں۔

آپشن 2: مکمل اسٹیک نمونہ ایپلیکیشن کو Streamlit فرنٹ اینڈ کے ساتھ تعینات کریں۔

یہ پیٹرن آپ کو سوال اور جواب کے لیے صارف کے فرنٹ اینڈ انٹرفیس کے ساتھ حل تعینات کرنے کی اجازت دیتا ہے۔

شرائط

نمونہ کی درخواست کو تعینات کرنے کے لیے، آپ کے پاس درج ذیل شرائط ہونی چاہئیں:

  • سیج میکر جمپ سٹارٹ ماڈل اینڈ پوائنٹ کو تعینات کر دیا گیا۔ - SageMaker JumpStart کا استعمال کرتے ہوئے ماڈلز کو اپنے SageMaker کے ریئل ٹائم اینڈ پوائنٹس پر تعینات کریں، جیسا کہ پچھلے حصے میں بتایا گیا ہے، فراہم کردہ نوٹ بک کا استعمال کرتے ہوئے۔
  • ایمیزون روٹ 53 میزبان زون -. بنانا a ایمیزون روٹ 53 عوامی میزبانی کا زون اس حل کے لیے استعمال کریں۔ آپ موجودہ روٹ 53 پبلک ہوسٹڈ زون بھی استعمال کر سکتے ہیں، جیسے example.com.
  • AWS سرٹیفکیٹ مینیجر کا سرٹیفکیٹ - فراہمی ایک AWS سرٹیفکیٹ مینیجر (ACM) TLS سرٹیفکیٹ روٹ 53 کے میزبان زون کے ڈومین نام اور اس کے قابل اطلاق ذیلی ڈومینز، جیسے example.com اور *.example.com تمام ذیلی ڈومینز کے لیے۔ ہدایات کے لیے، رجوع کریں۔ عوامی سرٹیفکیٹ کی درخواست کرنا. یہ سرٹیفکیٹ HTTPS کو ترتیب دینے کے لیے استعمال کیا جاتا ہے۔ ایمیزون CloudFront اور اصل لوڈ بیلنسر۔
  • تعیناتی کے پیرامیٹرز - درج ذیل کو ریکارڈ کریں:
    • فرنٹ اینڈ ایپلیکیشن کسٹم ڈومین نام - ایک حسب ضرورت ڈومین نام جو فرنٹ اینڈ نمونہ ایپلیکیشن تک رسائی کے لیے استعمال ہوتا ہے۔ فراہم کردہ ڈومین نام کا استعمال روٹ 53 DNS ریکارڈ بنانے کے لیے کیا جاتا ہے جو فرنٹ اینڈ کلاؤڈ فرنٹ کی تقسیم کی طرف اشارہ کرتا ہے۔ مثال کے طور پر، app.example.com.
    • لوڈ بیلنس اوریجن کسٹم ڈومین نام - ایک حسب ضرورت ڈومین نام جو CloudFront ڈسٹری بیوشن لوڈ بیلنس کی اصل کے لیے استعمال ہوتا ہے۔ فراہم کردہ ڈومین نام کا استعمال روٹ 53 DNS ریکارڈ بنانے کے لیے کیا جاتا ہے جو اصل لوڈ بیلنسر کی طرف اشارہ کرتا ہے۔ مثال کے طور پر، app-lb.example.com.
    • روٹ 53 ہوسٹڈ زون ID - فراہم کردہ حسب ضرورت ڈومین ناموں کی میزبانی کرنے کے لیے روٹ 53 کی میزبانی شدہ زون ID؛ مثال کے طور پر، ZXXXXXXXXYYYYYYYYY.
    • روٹ 53 ہوسٹڈ زون کا نام - فراہم کردہ حسب ضرورت ڈومین ناموں کی میزبانی کے لیے روٹ 53 ہوسٹڈ زون کا نام؛ مثال کے طور پر، example.com.
    • ACM سرٹیفکیٹ ARN - فراہم کردہ اپنی مرضی کے ڈومین کے ساتھ استعمال کرنے کے لیے ACM سرٹیفکیٹ کا ARN۔
    • ٹیکسٹ ماڈل اینڈ پوائنٹ کا نام - SageMaker JumpStart کے ساتھ تعینات ٹیکسٹ جنریشن ماڈل کا اختتامی نام۔
    • ایمبیڈنگز ماڈل اینڈ پوائنٹ کا نام - SageMaker JumpStart کے ساتھ تعینات کردہ ایمبیڈنگ ماڈل کا اختتامی نام۔

AWS CDK کا استعمال کرتے ہوئے وسائل کی تعیناتی کریں۔

AWS CDK اسٹیک کو تعینات کرنے کے لیے تعیناتی کے پیرامیٹرز کا استعمال کریں جو آپ نے ضروری شرائط میں نوٹ کیے ہیں۔ مزید معلومات کے لیے رجوع کریں۔ AWS CDK کے ساتھ شروع کرنا.

یقینی بنائیں کہ Docker انسٹال ہے اور ورک سٹیشن پر چل رہا ہے جو AWS CDK کی تعیناتی کے لیے استعمال کیا جائے گا۔

$ cd pattern1-rag/cdk
$ cdk deploy --all -c appCustomDomainName=<Enter Custom Domain Name to be used for Frontend App> -c loadBalancerOriginCustomDomainName=<Enter Custom Domain Name to be used for Load Balancer Origin> -c customDomainRoute53HostedZoneID=<Enter Route53 Hosted Zone ID for the Custom Domain being used> -c customDomainRoute53HostedZoneName=<Enter Route53 Hostedzone Name> -c customDomainCertificateArn=<Enter ACM Certificate ARN for Custom Domains provided> -c textModelEndpointName=<Enter the SageMaker Endpoint Name for the Text generation model> -c embeddingsModelEndpointName=<Enter the SageMaker Endpoint Name for the Text embeddings model>

پچھلے کوڈ میں، -c ایک سیاق و سباق کی قدر کی نمائندگی کرتا ہے، مطلوبہ شرائط کی شکل میں، جو ان پٹ پر فراہم کی جاتی ہے۔ متبادل طور پر، آپ نام کی فائل میں سیاق و سباق کی اقدار درج کر سکتے ہیں۔ cdk.context.json میں pattern1-rag/cdk ڈائریکٹری اور چلائیں cdk deploy --all.

نوٹ کریں کہ ہم فائل میں ریجن کی وضاحت کرتے ہیں۔ bin/cdk.ts. ALB رسائی لاگ کو ترتیب دینے کے لیے ایک مخصوص علاقہ درکار ہے۔ آپ تعیناتی سے پہلے اس علاقے کو تبدیل کر سکتے ہیں۔

تعیناتی Streamlit ایپلیکیشن تک رسائی کے لیے URL کو پرنٹ کرے گی۔ اس سے پہلے کہ آپ سوال و جواب شروع کر سکیں، آپ کو حوالہ جاتی دستاویزات کو سرایت کرنے کی ضرورت ہے، جیسا کہ اگلے حصے میں دکھایا گیا ہے۔

حوالہ دستاویزات کو شامل کریں۔

RAG اپروچ کے لیے، حوالہ جاتی دستاویزات پہلے ٹیکسٹ ایمبیڈنگ ماڈل کے ساتھ سرایت کی جاتی ہیں اور ایک ویکٹر ڈیٹا بیس میں محفوظ کی جاتی ہیں۔ اس حل میں، ایک ادخال پائپ لائن بنائی گئی ہے جو پی ڈی ایف دستاویزات کا استعمال کرتی ہے۔

جیسا کہ ہم نے پہلے تعیناتی کے آپشن میں بات کی ہے، پی ڈی ایف دستاویز کے اندراج کے لیے ایک مثال EC2 مثال بنائی گئی ہے اور PDF دستاویزات کو محفوظ کرنے کے لیے EC2 مثال پر EFS فائل سسٹم نصب کیا گیا ہے۔ EFS فائل سسٹم پاتھ میں پائے جانے والے پی ڈی ایف دستاویزات کو لانے اور ٹیکسٹ ایمبیڈنگ کا عمل شروع کرنے کے لیے انہیں S3 بالٹی میں اپ لوڈ کرنے کے لیے ہر گھنٹے میں ڈیٹا سنک ٹاسک چلایا جاتا ہے۔ یہ عمل حوالہ جاتی دستاویزات کو سرایت کرتا ہے اور OpenSearch سروس میں سرایت کو محفوظ کرتا ہے۔ یہ بعد کے تجزیے کے لیے Kinesis Data Firehose کے ذریعے S3 بالٹی میں سرایت کرنے والے آرکائیو کو بھی محفوظ کرتا ہے۔

حوالہ جاتی دستاویزات کو داخل کرنے کے لیے، درج ذیل مراحل کو مکمل کریں:

  1. نمونہ EC2 مثال کی شناخت حاصل کریں جو بنائی گئی تھی (دیکھیں AWS CDK آؤٹ پٹ JumpHostId) اور سیشن مینیجر کا استعمال کرتے ہوئے جڑیں۔
  2. ڈائریکٹری پر جائیں۔ /mnt/efs/fs1، وہ جگہ ہے جہاں EFS فائل سسٹم نصب ہوتا ہے، اور ایک فولڈر بناتا ہے۔ ingest:
    $ cd /mnt/efs/fs1
    $ mkdir ingest && cd ingest

  3. اپنے حوالہ پی ڈی ایف دستاویزات میں شامل کریں۔ ingest ڈائریکٹری.

ڈیٹا سنک ٹاسک کو اس ڈائرکٹری میں پائی جانے والی تمام فائلوں کو ایمبیڈنگ کا عمل شروع کرنے کے لیے Amazon S3 پر اپ لوڈ کرنے کے لیے ترتیب دیا گیا ہے۔

DataSync کام ایک گھنٹے کے شیڈول پر چلتا ہے۔ آپ اختیاری طور پر اپنے شامل کردہ پی ڈی ایف دستاویزات کے لیے ایمبیڈنگ کا عمل فوری طور پر شروع کرنے کے لیے دستی طور پر کام شروع کر سکتے ہیں۔

  1. کام شروع کرنے کے لیے، AWS CDK آؤٹ پٹ سے ٹاسک ID کا پتہ لگائیں۔ DataSyncTaskID اور کام شروع کریں پہلے سے طے شدہ کے ساتھ.

سوال اور جواب

حوالہ جاتی دستاویزات کے ایمبیڈ ہونے کے بعد، آپ اسٹریم لِٹ ایپلیکیشن تک رسائی کے لیے URL پر جا کر RAG سوال اور جواب دینا شروع کر سکتے ہیں۔ ایک ایمیزون کاگنیٹو توثیق کی پرت استعمال کی جاتی ہے، لہذا اس کے لیے درخواست تک پہلی بار رسائی کے لیے AWS CDK (صارف پول کے نام کے لیے AWS CDK آؤٹ پٹ دیکھیں) کے ذریعے تعینات Amazon Cognito یوزر پول میں صارف اکاؤنٹ بنانے کی ضرورت ہوتی ہے۔ ایمیزون کوگنیٹو صارف بنانے سے متعلق ہدایات کے لیے رجوع کریں۔ AWS مینجمنٹ کنسول میں ایک نیا صارف بنانا.

ایمبیڈ ڈرفٹ تجزیہ

اس سیکشن میں، ہم آپ کو دکھاتے ہیں کہ پہلے ریفرنس ڈیٹا ایمبیڈنگز اور پرامپٹ ایمبیڈنگس کی ایک بیس لائن بنا کر، اور پھر وقت کے ساتھ ساتھ ایمبیڈنگز کا سنیپ شاٹ بنا کر بڑھے ہوئے تجزیہ کو کیسے انجام دیا جائے۔ یہ آپ کو اسنیپ شاٹ ایمبیڈنگس سے بیس لائن ایمبیڈنگس کا موازنہ کرنے کی اجازت دیتا ہے۔

حوالہ ڈیٹا اور پرامپٹ کے لیے ایک ایمبیڈنگ بیس لائن بنائیں

ریفرنس ڈیٹا کی ایمبیڈنگ بیس لائن بنانے کے لیے، AWS Glue کنسول کھولیں اور ETL جاب کو منتخب کریں۔ embedding-drift-analysis. ETL جاب کے لیے پیرامیٹرز درج ذیل سیٹ کریں اور جاب چلائیں:

  • سیٹ کریں --job_type کرنے کے لئے BASELINE.
  • سیٹ کریں --out_table کرنے کے لئے ایمیزون ڈائنومو ڈی بی ڈیٹا سرایت کرنے کے لیے ٹیبل۔ (AWS CDK آؤٹ پٹ دیکھیں DriftTableReference ٹیبل کے نام کے لیے۔)
  • سیٹ کریں --centroid_table حوالہ سینٹروڈ ڈیٹا کے لیے DynamoDB ٹیبل پر۔ (AWS CDK آؤٹ پٹ دیکھیں CentroidTableReference ٹیبل کے نام کے لیے۔)
  • سیٹ کریں --data_path سابقہ ​​کے ساتھ S3 بالٹی تک؛ مثال کے طور پر، s3:///embeddingarchive/. (AWS CDK آؤٹ پٹ دیکھیں BucketName بالٹی کے نام کے لیے۔)

اسی طرح، ETL کام کا استعمال کرتے ہوئے embedding-drift-analysis، پرامپٹس کی سرایت کرنے والی بیس لائن بنائیں۔ ETL جاب کے لیے پیرامیٹرز درج ذیل سیٹ کریں اور جاب چلائیں:

  • سیٹ کریں --job_type کرنے کے لئے BASELINE
  • سیٹ کریں --out_table فوری ایمبیڈنگ ڈیٹا کے لیے DynamoDB ٹیبل پر۔ (AWS CDK آؤٹ پٹ دیکھیں DriftTablePromptsName ٹیبل کے نام کے لیے۔)
  • سیٹ کریں --centroid_table فوری سینٹروڈ ڈیٹا کے لیے DynamoDB ٹیبل پر۔ (AWS CDK آؤٹ پٹ دیکھیں CentroidTablePrompts ٹیبل کے نام کے لیے۔)
  • سیٹ کریں --data_path سابقہ ​​کے ساتھ S3 بالٹی تک؛ مثال کے طور پر، s3:///promptarchive/. (AWS CDK آؤٹ پٹ دیکھیں BucketName بالٹی کے نام کے لیے۔)

حوالہ ڈیٹا اور پرامپٹ کے لیے ایمبیڈنگ اسنیپ شاٹ بنائیں

اوپن سرچ سروس میں اضافی معلومات داخل کرنے کے بعد، ای ٹی ایل جاب چلائیں۔ embedding-drift-analysis دوبارہ حوالہ ڈیٹا ایمبیڈنگز کو سنیپ شاٹ کرنے کے لیے۔ پیرامیٹرز ETL جاب کی طرح ہوں گے جو آپ نے حوالہ ڈیٹا کی ایمبیڈنگ بیس لائن بنانے کے لیے دوڑائی تھی جیسا کہ پچھلے حصے میں دکھایا گیا ہے، اس کے علاوہ --job_type کرنے کے لئے پیرامیٹر SNAPSHOT.

اسی طرح، پرامپٹ ایمبیڈنگز کو اسنیپ شاٹ کرنے کے لیے، ETL جاب چلائیں۔ embedding-drift-analysis دوبارہ پیرامیٹرز ETL جاب کی طرح ہی ہوں گے جو آپ نے پرامپٹس کے لیے ایمبیڈنگ بیس لائن بنانے کے لیے دوڑائی تھی جیسا کہ پچھلے سیکشن میں دکھایا گیا ہے، سیٹنگ کے استثنا کے ساتھ --job_type کرنے کے لئے پیرامیٹر SNAPSHOT.

اسنیپ شاٹ سے بیس لائن کا موازنہ کریں۔

حوالہ ڈیٹا اور اشارے کے لیے ایمبیڈنگ بیس لائن اور سنیپ شاٹ کا موازنہ کرنے کے لیے، فراہم کردہ نوٹ بک کا استعمال کریں pattern1-rag/notebooks/drift-analysis.ipynb.

حوالہ ڈیٹا یا اشارے کے لیے سرایت کا موازنہ دیکھنے کے لیے، DynamoDB ٹیبل کے نام کے متغیرات کو تبدیل کریں (tbl اور c_tbl) نوٹ بک کے ہر رن کے لیے مناسب DynamoDB ٹیبل پر نوٹ بک میں۔

نوٹ بک متغیر tbl مناسب ڈرفٹ ٹیبل کے نام میں تبدیل کیا جانا چاہئے۔ نوٹ بک میں متغیر کو کہاں ترتیب دینا ہے اس کی ایک مثال درج ذیل ہے۔

ٹیبل کے نام مندرجہ ذیل کے طور پر بازیافت کیے جاسکتے ہیں۔

  • ریفرنس ایمبیڈنگ ڈیٹا کے لیے، AWS CDK آؤٹ پٹ سے ڈرفٹ ٹیبل کا نام بازیافت کریں۔ DriftTableReference
  • پرامپٹ ایمبیڈنگ ڈیٹا کے لیے، AWS CDK آؤٹ پٹ سے ڈرفٹ ٹیبل کا نام بازیافت کریں۔ DriftTablePromptsName

اس کے علاوہ، نوٹ بک متغیر c_tbl مناسب سینٹروڈ ٹیبل کے نام میں تبدیل کیا جانا چاہئے۔ نوٹ بک میں متغیر کو کہاں ترتیب دینا ہے اس کی ایک مثال درج ذیل ہے۔

ٹیبل کے نام مندرجہ ذیل کے طور پر بازیافت کیے جاسکتے ہیں۔

  • ریفرنس ایمبیڈنگ ڈیٹا کے لیے، AWS CDK آؤٹ پٹ سے سینٹروڈ ٹیبل کا نام بازیافت کریں۔ CentroidTableReference
  • پرامپٹ ایمبیڈنگ ڈیٹا کے لیے، AWS CDK آؤٹ پٹ سے سینٹروڈ ٹیبل کا نام بازیافت کریں۔ CentroidTablePrompts

حوالہ ڈیٹا سے فوری فاصلے کا تجزیہ کریں۔

سب سے پہلے، AWS Glue جاب چلائیں۔ embedding-distance-analysis. یہ کام حوالہ ڈیٹا ایمبیڈنگز کے K-Means کی تشخیص سے یہ معلوم کرے گا کہ ہر پرامپٹ کا تعلق کس کلسٹر سے ہے۔ اس کے بعد یہ ہر پرامپٹ سے متعلقہ کلسٹر کے مرکز تک فاصلے کے اوسط، اوسط اور معیاری انحراف کا حساب لگاتا ہے۔

آپ نوٹ بک چلا سکتے ہیں۔ pattern1-rag/notebooks/distance-analysis.ipynb وقت کے ساتھ فاصلے کے میٹرکس میں رجحانات دیکھنے کے لیے۔ اس سے آپ کو فوری طور پر سرایت کرنے والے فاصلوں کی تقسیم میں مجموعی رجحان کا اندازہ ہو گا۔

نوٹ بک pattern1-rag/notebooks/prompt-distance-outliers.ipynb AWS Glue نوٹ بک ہے جو آؤٹ لیرز کو تلاش کرتی ہے، جو آپ کو یہ شناخت کرنے میں مدد کر سکتی ہے کہ آیا آپ کو مزید اشارے مل رہے ہیں جن کا حوالہ ڈیٹا سے تعلق نہیں ہے۔

مماثلت کے اسکور کی نگرانی کریں۔

OpenSearch سروس سے تمام مماثلت کے اسکور لاگ ان ہیں۔ ایمیزون کلاؤڈ واچ کے تحت rag نام کی جگہ ڈیش بورڈ RAG_Scores اوسط سکور اور داخل کیے گئے سکور کی کل تعداد دکھاتا ہے۔

صاف کرو

مستقبل کے چارجز سے بچنے کے لیے، اپنے بنائے ہوئے تمام وسائل کو حذف کریں۔

تعینات سیج میکر ماڈلز کو حذف کریں۔

کے کلین اپ سیکشن کا حوالہ دیں۔ مثال کے طور پر نوٹ بک فراہم کی تعینات SageMaker JumpStart ماڈلز کو حذف کرنے کے لیے، یا آپ کر سکتے ہیں۔ SageMaker کنسول پر ماڈلز کو حذف کریں۔.

AWS CDK وسائل کو حذف کریں۔

اگر آپ نے اپنے پیرامیٹرز کو a میں درج کیا ہے۔ cdk.context.json فائل، مندرجہ ذیل طور پر صاف کریں:

$ cd pattern1-rag/cdk
$ cdk destroy --all

اگر آپ نے کمانڈ لائن پر اپنے پیرامیٹرز درج کیے ہیں اور صرف بیک اینڈ ایپلیکیشن (بیک اینڈ AWS CDK اسٹیک) کو تعینات کیا ہے، تو اس طرح صاف کریں:

$ cd pattern1-rag/cdk
$ cdk destroy --all -c textModelEndpointName=<Enter the SageMaker Endpoint Name for the Text generation model> -c embeddingsModelEndpointName=<Enter the SageMaker Endpoint Name for the Text embeddings model>

اگر آپ نے کمانڈ لائن پر اپنے پیرامیٹرز درج کیے ہیں اور مکمل حل (فرنٹ اینڈ اور بیک اینڈ AWS CDK سٹیکس) کو تعینات کیا ہے، تو اس طرح صاف کریں:

$ cd pattern1-rag/cdk
$ cdk destroy --all -c appCustomDomainName=<Enter Custom Domain Name to be used for Frontend App> -c loadBalancerOriginCustomDomainName=<Enter Custom Domain Name to be used for Load Balancer Origin> -c customDomainRoute53HostedZoneID=<Enter Route53 Hosted Zone ID for the Custom Domain being used> -c customDomainRoute53HostedZoneName=<Enter Route53 Hostedzone Name> -c customDomainCertificateArn=<Enter ACM Certificate ARN for Custom Domains provided> -c textModelEndpointName=<Enter the SageMaker Endpoint Name for the Text generation model> -c embeddingsModelEndpointName=<Enter the SageMaker Endpoint Name for the Text embeddings model>

نتیجہ

اس پوسٹ میں، ہم نے ایک ایسی ایپلیکیشن کی ایک عملی مثال فراہم کی ہے جو کہ جنریٹو AI کے لیے RAG پیٹرن میں ریفرنس ڈیٹا اور پرامپٹ دونوں کے لیے سرایت کرنے والے ویکٹرز کو حاصل کرتی ہے۔ ہم نے دکھایا کہ کلسٹرنگ تجزیہ کس طرح انجام دیا جائے تاکہ یہ معلوم کیا جا سکے کہ آیا حوالہ یا فوری ڈیٹا وقت کے ساتھ بڑھ رہا ہے، اور حوالہ ڈیٹا صارفین کے پوچھے جانے والے سوالات کی اقسام کو کتنی اچھی طرح سے احاطہ کرتا ہے۔ اگر آپ بڑھے ہوئے کا پتہ لگاتے ہیں، تو یہ ایک سگنل فراہم کر سکتا ہے کہ ماحول بدل گیا ہے اور آپ کے ماڈل کو نئے ان پٹ مل رہے ہیں جن کو سنبھالنے کے لیے اسے بہتر نہیں بنایا جا سکتا ہے۔ یہ بدلتے ہوئے ان پٹ کے خلاف موجودہ ماڈل کی فعال جانچ کی اجازت دیتا ہے۔


مصنفین کے بارے میں

عبداللہ اولاوی ایمیزون ویب سروسز (AWS) میں ایک سینئر سولیوشن آرکیٹیکٹ ہے۔ عبداللہی نے Wichita State University سے کمپیوٹر نیٹ ورکنگ میں MSC کی ڈگری حاصل کی ہے اور وہ ایک شائع شدہ مصنف ہے جس نے مختلف ٹیکنالوجی ڈومینز جیسے DevOps، انفراسٹرکچر ماڈرنائزیشن اور AI میں کردار ادا کیے ہیں۔ وہ فی الحال جنریٹو AI پر توجہ مرکوز کر رہے ہیں اور جنریٹو AI کے ذریعے طاقت سے چلنے والے جدید حلوں کو تعمیر کرنے اور تعمیر کرنے میں کاروباری اداروں کی مدد کرنے میں کلیدی کردار ادا کرتے ہیں۔ ٹکنالوجی کے دائرے سے ہٹ کر اسے ریسرچ کے فن میں خوشی ملتی ہے۔ جب وہ AI حل تیار نہیں کرتا ہے، تو وہ اپنے خاندان کے ساتھ نئی جگہوں کو تلاش کرنے کے لیے سفر کرنے سے لطف اندوز ہوتا ہے۔

رینڈی ڈیفاؤ AWS میں ایک سینئر پرنسپل سولیوشن آرکیٹیکٹ ہیں۔ اس نے مشی گن یونیورسٹی سے MSEE کی ڈگری حاصل کی، جہاں اس نے خود مختار گاڑیوں کے کمپیوٹر وژن پر کام کیا۔ انہوں نے کولوراڈو اسٹیٹ یونیورسٹی سے ایم بی اے بھی کیا ہے۔ رینڈی نے ٹیکنالوجی کے شعبے میں سافٹ ویئر انجینئرنگ سے لے کر پروڈکٹ مینجمنٹ تک مختلف عہدوں پر فائز ہیں۔ 2013 میں بگ ڈیٹا اسپیس میں داخل ہوا اور اس علاقے کو تلاش کرنا جاری رکھا۔ وہ ایم ایل اسپیس میں پراجیکٹس پر سرگرمی سے کام کر رہا ہے اور متعدد کانفرنسوں میں پیش کر چکا ہے جن میں اسٹراٹا اور گلوکون شامل ہیں۔

شیلبی ایگن بروڈ ایمیزون ویب سروسز (AWS) میں ایک پرنسپل AI اور مشین لرننگ اسپیشلسٹ سولیوشن آرکیٹیکٹ ہیں۔ وہ متعدد صنعتوں، ٹیکنالوجیز اور کرداروں پر محیط 24 سالوں سے ٹیکنالوجی میں ہے۔ وہ فی الحال اپنے DevOps اور ML پس منظر کو MLOps کے ڈومین میں یکجا کرنے پر توجہ مرکوز کر رہی ہے تاکہ صارفین کو ML ورک بوجھ کو پیمانے پر ڈیلیور کرنے اور ان کا نظم کرنے میں مدد مل سکے۔ مختلف ٹکنالوجی ڈومینز میں 35 سے زیادہ پیٹنٹس کی منظوری کے ساتھ، وہ مسلسل جدت طرازی اور کاروباری نتائج کو آگے بڑھانے کے لیے ڈیٹا کے استعمال کا جنون رکھتی ہے۔ Shelbee Coursera پر پریکٹیکل ڈیٹا سائنس کی تخصص کی شریک تخلیق کار اور انسٹرکٹر ہے۔ وہ بگ ڈیٹا (WiBD)، ڈینور چیپٹر میں خواتین کی کو-ڈائریکٹر بھی ہیں۔ اپنے فارغ وقت میں، وہ اپنے خاندان، دوستوں اور زیادہ فعال کتوں کے ساتھ وقت گزارنا پسند کرتی ہے۔

اسپاٹ_مگ

تازہ ترین انٹیلی جنس

اسپاٹ_مگ

ہمارے ساتھ بات چیت

ہیلو وہاں! میں آپ کی کیسے مدد کر سکتا ہوں؟