Meta Platforms Inc، شرکت مادر فیس بوک، گفت که هوش مصنوعی ایجاد کرده است که می تواند در نسخه آنلاین بازی استراتژیک محبوب، دیپلماسی، که در آن هفت بازیکن برای کنترل جغرافیایی اروپا با جابجایی قطعات بر روی نقشه، از انسان ها پیشی بگیرد، پیشی بگیرد.
متا در مقاله ای که در سایت Science.com منتشر شد، گفت سیسرو، اولین عامل هوش مصنوعی بود که به عملکردی در سطح انسانی در دیپلماسی دست یافت، یک بازی شامل همکاری و رقابت که بر مذاکره زبان طبیعی و هماهنگی تاکتیکی بین هفت بازیکن تأکید دارد.
در مجموع 40 بازی ناشناس دیپلماسی آنلاین، متا گفت که سیسرو بیش از دو برابر میانگین امتیاز بازیکنان انسانی به دست آورده و در 10 درصد برتر شرکتکنندگانی قرار گرفته است که بیش از یک بازی انجام دادهاند.
این گروه فناوری پیشرو گفت که این بخشی از هدف راهبردی و بلندمدت خود در زمینه هوش مصنوعی برای ساخت عواملی است که می توانند به زبان طبیعی با انسان ها برنامه ریزی، هماهنگی و مذاکره کنند.
سیسرو چقدر مهم است؟
متا می گوید سیسرو بسیار مهم است زیرا هوش مصنوعی به محیط های غیر خصمانه متکی است.
برخلاف گذشته که موفقیتهای عمده قبلی برای هوش مصنوعی چند عامله در محیطهای کاملاً متخاصم مانند شطرنج، برو و پوکر بوده است، جایی که ارتباطات هیچ ارزشی ندارد، سیسرو از یک موتور استدلال استراتژیک و ماژول گفتگوی قابل کنترل استفاده میکند.
به این دلایل، متا می گوید که دیپلماسی به عنوان یک معیار چالش برانگیز برای یادگیری چند عاملی عمل کرده است.
"سیسرو یک ماژول گفتگوی قابل کنترل را با یک موتور استدلال استراتژیک جفت می کند. در هر نقطه از بازی، سیسرو نحوه رفتار سایر بازیکنان را بر اساس وضعیت بازی و مکالمات آنها مدل می کند." متا می گوید.
سپس هوش مصنوعی برنامهریزی میکند که چگونه بازیکنان میتوانند به نفع متقابل خود هماهنگ شوند و این برنامهها را در پیامهای زبان طبیعی ترسیم میکند.
بی اعتمادی سالم
سیسرو از اعتماد کورکورانه به پیشنهادات سایر بازیکنان اجتناب میکند و طرحهایی را که «ارزش پیشبینیشده» پایینی دارند و موازی با منافع خود هستند، رد میکند.
با توجه به این واقعیت که گفتگو در دیپلماسی به طور خصوصی بین جفت بازیکن رخ می دهد، سیسرو اطلاعاتی را که بازیکنان هنگام پیش بینی به آنها دسترسی دارند، استدلال و تجزیه و تحلیل می کند.
"به عنوان مثال، اگر سیسرو در حال هماهنگ کردن یک حمله با یک متحد علیه یک دشمن باشد، پیشبینی سیسرو از سیاست دشمن باید این واقعیت را توضیح دهد که دشمن از هماهنگی مورد نظر آگاه نیست."متا گفت.
متا می گوید که بین 40 اوت تا 19 اکتبر 13 در 2022 بازی Diplomacy در لیگ آنلاین بازیکنان انسانی به صورت ناشناس وارد سیسرو شده است.
سیسرو در طول 72 ساعت بازی که شامل ارسال 5,277 پیام بود، در بین 10 درصد شرکتکنندگانی قرار گرفت که بیش از یک بازی انجام دادند.
متا می گوید که داده های 125,261 بازی دیپلماسی را که به صورت آنلاین در webDiplomacy.net انجام شده است جمع آوری کرده است. از این بازی ها، در مجموع 40,408 بازی حاوی دیالوگ بوده و در مجموع 12,901,662 پیام بین بازیکنان رد و بدل شده است.
متا اشاره می کند، هوش مصنوعی جدید آن بسیار عالی است
سیسرو پیام هایی ارسال می کرد که حاوی اشتباهاتی بود، گاهی اوقات با برنامه های خود در تناقض بود و اشتباهات راهبردی مرتکب می شد.
اما متا اصرار دارد که انسانها با این وجود ترجیح دادند با هوش مصنوعی نسبت به سایر بازیکنان همکاری کنند بدون اینکه متوجه باشند که یک ربات است.
تقریباً تمام پیشرفتهای قبلی هوش مصنوعی در بازیها در تنظیمات مجموع صفر دو نفره (2p0s) از جمله شطرنج، Go، پوکر هدز آپ و استارکرافت بوده است. متا در مقاله افزود: در بازیهای محدود 2p0s، الگوریتمهای یادگیری تقویتی خاصی (RL) که با بازی کردن در برابر خودشان یاد میگیرند - فرآیندی که به عنوان خود بازی شناخته میشود - به سیاستی همگرا میشوند که در بازیهای متعادل غیرقابل انتظار است. به عبارت دیگر، هر بازی محدود 2p0 را می توان از طریق خودبازی با ظرفیت محاسباتی و مدل کافی حل کرد.
با این حال، متا در رابطه با بازیهایی که شامل همکاری است، گفت، بازی خود بدون دادههای انسانی دیگر تضمینی برای یافتن خط مشیای نیست که با انسانها کارایی خوبی داشته باشد، حتی با ظرفیت محاسباتی و مدل بینهایت، زیرا عامل خودبازی ممکن است به سیاستی همگرا شود که با هنجارها و انتظارات انسانی ناسازگار است.
سیسرو اقدامات احتمالی را پیش بینی می کند
متا افزود که سیسرو اقدامات احتمالی را برای هر بازیکن بر اساس وضعیت صفحه و گفتگو پیش بینی می کند و از آن به عنوان نقطه شروع برای الگوریتم برنامه ریزی با استفاده از مدل های آموزش دیده RL استفاده می کند.
این شرکت می گوید که هوش مصنوعی از یک ماژول استدلال استراتژیک برای انتخاب هوشمندانه مقاصد و اقدامات استفاده می کند.
سپس این ماژول یک الگوریتم برنامهریزی را اجرا میکند که سیاستهای سایر بازیکنان را بر اساس وضعیت بازی و گفتگو پیشبینی میکند و هم قدرت اقدامات مختلف و هم احتمال آنها را در بازیهای انسانی محاسبه میکند. بر اساس این اطلاعات و متغیرها بهترین اقدام بهینه برای سیسرو انجام می شود.
تحت مدیریت مارک زاکربرگ، بنیانگذار و مدیر عامل متا، این شرکت سرمایه گذاری زیادی روی هوش مصنوعی و متاورس انجام داده است تا از این صنعت در حال رشد به عنوان آینده فناوری استفاده کند.
- Coinsmart. بهترین صرافی بیت کوین و کریپتو اروپا.اینجا کلیک کنید
- پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی به اینجا.
- منبع: https://www.metanews.com/crypto-seed-phrases-are-being-transformed-into-ai-generated-quiz-art/