هوش داده افلاطون
جستجوی عمودی و هوش مصنوعی

عبارات Crypto Seed در حال تبدیل شدن به هنر امتحانی تولید شده توسط هوش مصنوعی هستند

تاریخ:

Meta Platforms Inc، شرکت مادر فیس بوک، گفت که هوش مصنوعی ایجاد کرده است که می تواند در نسخه آنلاین بازی استراتژیک محبوب، دیپلماسی، که در آن هفت بازیکن برای کنترل جغرافیایی اروپا با جابجایی قطعات بر روی نقشه، از انسان ها پیشی بگیرد، پیشی بگیرد.

متا در مقاله ای که در سایت Science.com منتشر شد، گفت سیسرو، اولین عامل هوش مصنوعی بود که به عملکردی در سطح انسانی در دیپلماسی دست یافت، یک بازی شامل همکاری و رقابت که بر مذاکره زبان طبیعی و هماهنگی تاکتیکی بین هفت بازیکن تأکید دارد.

در مجموع 40 بازی ناشناس دیپلماسی آنلاین، متا گفت که سیسرو بیش از دو برابر میانگین امتیاز بازیکنان انسانی به دست آورده و در 10 درصد برتر شرکت‌کنندگانی قرار گرفته است که بیش از یک بازی انجام داده‌اند.

این گروه فناوری پیشرو گفت که این بخشی از هدف راهبردی و بلندمدت خود در زمینه هوش مصنوعی برای ساخت عواملی است که می توانند به زبان طبیعی با انسان ها برنامه ریزی، هماهنگی و مذاکره کنند.

سیسرو چقدر مهم است؟

متا می گوید سیسرو بسیار مهم است زیرا هوش مصنوعی به محیط های غیر خصمانه متکی است.

برخلاف گذشته که موفقیت‌های عمده قبلی برای هوش مصنوعی چند عامله در محیط‌های کاملاً متخاصم مانند شطرنج، برو و پوکر بوده است، جایی که ارتباطات هیچ ارزشی ندارد، سیسرو از یک موتور استدلال استراتژیک و ماژول گفتگوی قابل کنترل استفاده می‌کند.

به این دلایل، متا می گوید که دیپلماسی به عنوان یک معیار چالش برانگیز برای یادگیری چند عاملی عمل کرده است.

"سیسرو یک ماژول گفتگوی قابل کنترل را با یک موتور استدلال استراتژیک جفت می کند. در هر نقطه از بازی، سیسرو نحوه رفتار سایر بازیکنان را بر اساس وضعیت بازی و مکالمات آنها مدل می کند.متا می گوید.

سپس هوش مصنوعی برنامه‌ریزی می‌کند که چگونه بازیکنان می‌توانند به نفع متقابل خود هماهنگ شوند و این برنامه‌ها را در پیام‌های زبان طبیعی ترسیم می‌کند.

بی اعتمادی سالم

سیسرو از اعتماد کورکورانه به پیشنهادات سایر بازیکنان اجتناب می‌کند و طرح‌هایی را که «ارزش پیش‌بینی‌شده» پایینی دارند و موازی با منافع خود هستند، رد می‌کند.

با توجه به این واقعیت که گفتگو در دیپلماسی به طور خصوصی بین جفت بازیکن رخ می دهد، سیسرو اطلاعاتی را که بازیکنان هنگام پیش بینی به آنها دسترسی دارند، استدلال و تجزیه و تحلیل می کند.

"به عنوان مثال، اگر سیسرو در حال هماهنگ کردن یک حمله با یک متحد علیه یک دشمن باشد، پیش‌بینی سیسرو از سیاست دشمن باید این واقعیت را توضیح دهد که دشمن از هماهنگی مورد نظر آگاه نیست."متا گفت.

متا می گوید که بین 40 اوت تا 19 اکتبر 13 در 2022 بازی Diplomacy در لیگ آنلاین بازیکنان انسانی به صورت ناشناس وارد سیسرو شده است.

سیسرو در طول 72 ساعت بازی که شامل ارسال 5,277 پیام بود، در بین 10 درصد شرکت‌کنندگانی قرار گرفت که بیش از یک بازی انجام دادند.

متا می گوید که داده های 125,261 بازی دیپلماسی را که به صورت آنلاین در webDiplomacy.net انجام شده است جمع آوری کرده است. از این بازی ها، در مجموع 40,408 بازی حاوی دیالوگ بوده و در مجموع 12,901,662 پیام بین بازیکنان رد و بدل شده است.

اعلان: "روباتی که همه را در بازی دیپلماسی شکست می دهد"

اعلان: "ربات در بازی دیپلماسی همه را شکست می دهد" (تولید شده توسط هوش مصنوعی).

متا اشاره می کند، هوش مصنوعی جدید آن بسیار عالی است

سیسرو پیام هایی ارسال می کرد که حاوی اشتباهاتی بود، گاهی اوقات با برنامه های خود در تناقض بود و اشتباهات راهبردی مرتکب می شد.

اما متا اصرار دارد که انسان‌ها با این وجود ترجیح دادند با هوش مصنوعی نسبت به سایر بازیکنان همکاری کنند بدون اینکه متوجه باشند که یک ربات است.

تقریباً تمام پیشرفت‌های قبلی هوش مصنوعی در بازی‌ها در تنظیمات مجموع صفر دو نفره (2p0s) از جمله شطرنج، Go، پوکر هدز آپ و استارکرافت بوده است. متا در مقاله افزود: در بازی‌های محدود 2p0s، الگوریتم‌های یادگیری تقویتی خاصی (RL) که با بازی کردن در برابر خودشان یاد می‌گیرند - فرآیندی که به عنوان خود بازی شناخته می‌شود - به سیاستی همگرا می‌شوند که در بازی‌های متعادل غیرقابل انتظار است. به عبارت دیگر، هر بازی محدود 2p0 را می توان از طریق خودبازی با ظرفیت محاسباتی و مدل کافی حل کرد.

با این حال، متا در رابطه با بازی‌هایی که شامل همکاری است، گفت، بازی خود بدون داده‌های انسانی دیگر تضمینی برای یافتن خط مشی‌ای نیست که با انسان‌ها کارایی خوبی داشته باشد، حتی با ظرفیت محاسباتی و مدل بی‌نهایت، زیرا عامل خودبازی ممکن است به سیاستی همگرا شود که با هنجارها و انتظارات انسانی ناسازگار است.

سیسرو اقدامات احتمالی را پیش بینی می کند

متا افزود که سیسرو اقدامات احتمالی را برای هر بازیکن بر اساس وضعیت صفحه و گفتگو پیش بینی می کند و از آن به عنوان نقطه شروع برای الگوریتم برنامه ریزی با استفاده از مدل های آموزش دیده RL استفاده می کند.

این شرکت می گوید که هوش مصنوعی از یک ماژول استدلال استراتژیک برای انتخاب هوشمندانه مقاصد و اقدامات استفاده می کند.

سپس این ماژول یک الگوریتم برنامه‌ریزی را اجرا می‌کند که سیاست‌های سایر بازیکنان را بر اساس وضعیت بازی و گفتگو پیش‌بینی می‌کند و هم قدرت اقدامات مختلف و هم احتمال آنها را در بازی‌های انسانی محاسبه می‌کند. بر اساس این اطلاعات و متغیرها بهترین اقدام بهینه برای سیسرو انجام می شود.

تحت مدیریت مارک زاکربرگ، بنیانگذار و مدیر عامل متا، این شرکت سرمایه گذاری زیادی روی هوش مصنوعی و متاورس انجام داده است تا از این صنعت در حال رشد به عنوان آینده فناوری استفاده کند.

/متانیوز

نقطه_img

جدیدترین اطلاعات

نقطه_img

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟