افلاطون ڈیٹا انٹیلی جنس.
عمودی تلاش اور Ai.

کرپٹو سیڈ کے فقرے AI سے تیار کردہ کوئز آرٹ میں تبدیل ہو رہے ہیں۔

تاریخ:

Meta Platforms Inc، فیس بک کی بنیادی کمپنی، نے کہا کہ اس نے ایک AI بنایا ہے جو مقبول حکمت عملی گیم ڈپلومیسی کے آن لائن ورژن میں انسانوں کو پیچھے چھوڑ سکتا ہے، جہاں سات کھلاڑی نقشے پر ٹکڑوں کو ادھر ادھر منتقل کر کے یورپ کے جغرافیائی کنٹرول کے لیے مقابلہ کرتے ہیں۔

Science.com پر شائع ہونے والے ایک کاغذ میں، میٹا نے کہا Cicero، ڈپلومیسی میں انسانی سطح کی کارکردگی کو حاصل کرنے والا پہلا AI ایجنٹ تھا، ایک ایسا کھیل جس میں تعاون اور مقابلہ دونوں شامل ہیں جس میں سات کھلاڑیوں کے درمیان فطری زبان کی گفت و شنید اور حکمت عملی پر زور دیا گیا ہے۔

آن لائن ڈپلومیسی کے کل 40 گمنام گیمز میں، میٹا نے کہا کہ سیسیرو نے انسانی کھلاڑیوں کے اوسط سے دوگنا اسکور حاصل کیا ہے اور ایک سے زیادہ گیمز کھیلنے والے سب سے اوپر 10% شرکاء میں درجہ بندی کی ہے۔

سرکردہ ٹیکنالوجی گروپ نے کہا کہ یہ مصنوعی ذہانت کے شعبے میں اس کے اسٹریٹجک اور طویل مدتی مقصد کا حصہ ہے تاکہ ایسے ایجنٹس تیار کیے جائیں جو قدرتی زبان میں انسانوں کے ساتھ منصوبہ بندی، ہم آہنگی اور گفت و شنید کر سکیں۔

Cicero کتنا اہم ہے؟

میٹا کا کہنا ہے کہ سیسرو کافی اہم ہے کیونکہ AI غیر مخالف ماحول پر انحصار کرتا ہے۔

ماضی کے برعکس جہاں ملٹی ایجنٹ AI کے لیے پہلے کی بڑی کامیابیاں خالصتاً مخالف ماحول میں رہی ہیں، جیسے Chess، Go، اور Poker، جہاں مواصلات کی کوئی اہمیت نہیں ہے، Cicero ایک اسٹریٹجک استدلال کے انجن اور قابل کنٹرول ڈائیلاگ ماڈیول کو استعمال کرتا ہے۔

ان وجوہات کی بنا پر، میٹا کا کہنا ہے کہ ڈپلومیسی نے ملٹی ایجنٹ سیکھنے کے لیے ایک چیلنجنگ بینچ مارک کے طور پر کام کیا ہے۔

"Cicero ایک سٹریٹجک استدلال انجن کے ساتھ ایک قابل کنٹرول ڈائیلاگ ماڈیول جوڑتا ہے۔ گیم کے ہر موڑ پر، سیسرو ماڈل بناتا ہے کہ دوسرے کھلاڑی گیم کی حالت اور ان کی گفتگو کی بنیاد پر کیسے کام کریں گے،میٹا کا کہنا ہے کہ.

پھر AI منصوبہ بناتا ہے کہ کھلاڑی اپنے باہمی فائدے کے لیے کس طرح ہم آہنگی پیدا کر سکتے ہیں اور ان منصوبوں کو قدرتی زبان کے پیغامات میں نقشہ بناتا ہے۔

صحت مند عدم اعتماد

Cicero دوسرے کھلاڑیوں کی تجاویز پر اندھا اعتماد کرنے سے گریز کرتا ہے اور ایسے منصوبوں کو مسترد کرتا ہے جن کی "پیش گوئی کی قیمت" کم ہوتی ہے اور جو اس کے اپنے مفادات کے متوازی چلتے ہیں۔

اس حقیقت کی وجہ سے کہ ڈپلومیسی میں مکالمہ کھلاڑیوں کے جوڑے کے درمیان نجی طور پر ہوتا ہے، سیسرو وجوہات اور ان معلومات کا تجزیہ کرتا ہے جن تک کھلاڑی پیشین گوئی کرتے وقت رسائی رکھتے ہیں۔

"مثال کے طور پر، اگر سیسرو ایک اتحادی کے ساتھ ایک مخالف کے خلاف حملے کو مربوط کر رہا ہے، تو مخالف کی پالیسی کے بارے میں سیسرو کی پیشین گوئی کو اس حقیقت کا حساب دینا چاہیے کہ مخالف مطلوبہ ہم آہنگی سے واقف نہیں ہے،"میٹا نے کہا.

میٹا کا کہنا ہے کہ اس نے 40 اگست اور 19 اکتوبر 13 کے درمیان انسانی کھلاڑیوں کی ایک آن لائن لیگ میں ڈپلومیسی کے 2022 گیمز میں گمنام طور پر سیسیرو میں داخل ہوا۔

اس میں کہا گیا ہے کہ 72 گھنٹے کے کھیل کے دوران جس میں 5,277 پیغامات بھیجے گئے، سیسیرو نے ایک سے زیادہ گیمز کھیلنے والے شرکاء میں سرفہرست 10 فیصد حصہ لیا۔

میٹا کا کہنا ہے کہ اس نے webDiplomacy.net پر آن لائن کھیلی جانے والی ڈپلومیسی کے 125,261 گیمز سے ڈیٹا اکٹھا کیا۔ ان گیمز میں سے کل 40,408 گیمز ڈائیلاگ پر مشتمل تھے جن میں کھلاڑیوں کے درمیان کل 12,901,662 پیغامات کا تبادلہ ہوا۔

پرامپٹ: "روبوٹ ڈپلومیسی کے کھیل میں باقی سب کو مارتا ہے"

پرامپٹ: "روبوٹ ڈپلومیسی کے کھیل میں باقی سب کو مارتا ہے" (AI سے تیار کردہ)۔

میٹا نوٹ، اس کا نیا AI کامل سے بہت دور ہے۔

سیسرو نے ایسے پیغامات بھیجے جن میں غلطیاں تھیں، بعض اوقات اس کے اپنے منصوبوں سے متصادم اور سٹریٹجک غلطیاں کیں۔

لیکن میٹا کا اصرار ہے کہ اس کے باوجود انسانوں نے AI کے ساتھ دوسرے کھلاڑیوں کے مقابلے میں تعاون کرنے کا انتخاب کیا یہ سمجھے بغیر کہ یہ بوٹ ہے۔

"گیمز میں تقریباً تمام سابقہ ​​AI کامیابیاں دو کھلاڑیوں کی زیرو سم (2p0s) سیٹنگ میں رہی ہیں، بشمول شطرنج، گو، ہیڈ اپ پوکر، اور سٹار کرافٹ۔ محدود 2p0s گیمز میں، کچھ ری انفورسمنٹ لرننگ (RL) الگورتھم جو خود کے خلاف کھیل کر سیکھتے ہیں — ایک ایسا عمل جسے سیلف پلے کہا جاتا ہے — ایک ایسی پالیسی میں بدل جائے گا جو متوازن گیمز میں توقع کے لحاظ سے ناقابل شکست ہے،” میٹا نے مقالے میں مزید کہا۔ "دوسرے الفاظ میں، کسی بھی محدود 2p0s گیم کو کافی کمپیوٹ اور ماڈل کی صلاحیت کے ساتھ سیلف پلے کے ذریعے حل کیا جا سکتا ہے۔"

تاہم، میٹا نے کہا کہ تعاون پر مشتمل گیمز کے بارے میں، انسانی ڈیٹا کے بغیر سیلف پلے اب ایسی پالیسی تلاش کرنے کی گارنٹی نہیں ہے جو انسانوں کے ساتھ اچھی کارکردگی کا مظاہرہ کرتی ہو، یہاں تک کہ لامحدود کمپیوٹ اور ماڈل کی صلاحیت کے ساتھ، کیونکہ سیلف پلے ایجنٹ ایسی پالیسی میں تبدیل ہو سکتا ہے جو انسانی اصولوں اور توقعات سے مطابقت نہیں رکھتا۔

Cicero ممکنہ کارروائیوں کی توقع کرتا ہے۔

میٹا نے مزید کہا کہ سیسرو بورڈ کی حالت اور مکالمے کی بنیاد پر ہر کھلاڑی کے لیے ممکنہ کارروائیوں کی توقع کرتا ہے، اسے RL-تربیت یافتہ ماڈلز کا استعمال کرتے ہوئے منصوبہ بندی کے الگورتھم کے نقطہ آغاز کے طور پر استعمال کرتا ہے۔

کمپنی کا کہنا ہے کہ AI ذہانت سے ارادوں اور اعمال کو منتخب کرنے کے لیے اسٹریٹجک استدلال کے ماڈیول کا استعمال کرتا ہے۔

اس کے بعد یہ ماڈیول ایک منصوبہ بندی کا الگورتھم چلاتا ہے جو گیم کی حالت اور مکالمے کی بنیاد پر دیگر تمام کھلاڑیوں کی پالیسیوں کی پیش گوئی کرتا ہے اور مختلف اعمال کی طاقت اور انسانی کھیلوں میں ان کے امکانات دونوں کا حساب کرتا ہے۔ اس معلومات اور متغیرات کی بنیاد پر، Cicero کے لیے بہترین بہترین کارروائی کی جاتی ہے۔

میٹا کے بانی اور سی ای او مارک زکربرگ کے تحت، کمپنی ٹیکنالوجی کے مستقبل کے طور پر دیکھی جانے والی تیزی سے ترقی کرتی ہوئی صنعت سے فائدہ اٹھانے کے لیے AI اور metaverse میں بہت زیادہ سرمایہ کاری کر رہی ہے۔

/میٹا نیوز

اسپاٹ_مگ

تازہ ترین انٹیلی جنس

اسپاٹ_مگ

ہمارے ساتھ بات چیت

ہیلو وہاں! میں آپ کی کیسے مدد کر سکتا ہوں؟