Plato Data Intelligence។
ការស្វែងរកបញ្ឈរ & អាយ។

សូមអបអរសាទរ Cicero ដែលជាអ្នកឈ្នះ - AI វាយមនុស្សនៅក្នុងការទូត

កាលបរិច្ឆេទ:

Meta Platforms Inc ដែលជាក្រុមហ៊ុនមេរបស់ Facebook បាននិយាយថា ខ្លួនបានបង្កើត AI ដែលអាចយកឈ្នះមនុស្សបាននៅក្នុងកំណែអនឡាញនៃហ្គេមយុទ្ធសាស្ត្រដ៏ពេញនិយមមួយគឺ Diplomacy ដែលអ្នកលេងប្រាំពីរនាក់ប្រកួតប្រជែងដើម្បីគ្រប់គ្រងភូមិសាស្ត្រនៃទ្វីបអឺរ៉ុបដោយផ្លាស់ទីបំណែកជុំវិញនៅលើផែនទី។

លោក Meta បាននិយាយនៅក្នុងកាសែតមួយដែលត្រូវបានចេញផ្សាយនៅលើ Science.com Cicero គឺជាភ្នាក់ងារ AI ដំបូងគេដែលសម្រេចបាននូវការអនុវត្តកម្រិតមនុស្សនៅក្នុងការទូត ដែលជាហ្គេមដែលពាក់ព័ន្ធនឹងកិច្ចសហប្រតិបត្តិការ និងការប្រកួតប្រជែងដែលសង្កត់ធ្ងន់លើការចរចាជាភាសាធម្មជាតិ និងការសម្របសម្រួលយុទ្ធសាស្ត្ររវាងអ្នកលេងប្រាំពីរនាក់។

នៅក្នុងហ្គេមអនាមិកសរុបចំនួន 40 នៃការទូតអនឡាញ លោក Meta បាននិយាយថា Cicero ទទួលបានច្រើនជាងពីរដងនៃពិន្ទុមធ្យមនៃអ្នកលេងមនុស្ស ហើយជាប់ចំណាត់ថ្នាក់ក្នុងកំពូល 10% នៃអ្នកចូលរួមដែលបានលេងហ្គេមច្រើនជាងមួយ។

ក្រុមបច្ចេកវិទ្យាឈានមុខគេបាននិយាយថា នេះជាផ្នែកមួយនៃគោលដៅយុទ្ធសាស្ត្រ និងរយៈពេលវែងរបស់ខ្លួនក្នុងវិស័យបញ្ញាសិប្បនិមិត្ត ដើម្បីកសាងភ្នាក់ងារដែលអាចរៀបចំផែនការ សម្របសម្រួល និងចរចាជាមួយមនុស្សជាភាសាធម្មជាតិ។

តើ Cicero មានសារៈសំខាន់យ៉ាងណា?

Meta និយាយថា Cicero មានសារៈសំខាន់ណាស់ ពីព្រោះ AI ពឹងផ្អែកលើបរិស្ថានដែលមិនមែនជាសត្រូវ។

Unlike in the past where prior major successes for multi-agent AI have been in purely adversarial environments, such as Chess (2), Go (3), and Poker (4), where communication has no value, Cicero employs a strategic reasoning engine and controllable dialogue module.

សម្រាប់ហេតុផលទាំងនេះ មេតានិយាយថា ការទូតបានបម្រើការជាគោលដ៏លំបាកមួយសម្រាប់ការរៀនពហុភ្នាក់ងារ។

“Cicero couples a controllable dialogue module with a strategic reasoning engine. At each point in the game, Cicero models how the other players are likely to act based on the game state and their conversations,” Meta says.

បន្ទាប់មក AI រៀបចំផែនការពីរបៀបដែលអ្នកលេងអាចសម្របសម្រួលដើម្បីផលប្រយោជន៍ទៅវិញទៅមករបស់ពួកគេ ហើយរៀបចំផែនការទាំងនេះទៅជាសារជាភាសាធម្មជាតិ។

ការមិនទុកចិត្តសុខភាព

Cicero ជៀសវាងសំណើដែលមិនទុកចិត្តពីអ្នកលេងផ្សេងទៀត ហើយបដិសេធគម្រោងដែលមាន "តម្លៃព្យាករណ៍" ទាប ហើយដែលដំណើរការស្របទៅនឹងផលប្រយោជន៍ផ្ទាល់ខ្លួន។

ដោយសារតែការពិតដែលថាការសន្ទនានៅក្នុងការទូតកើតឡើងជាលក្ខណៈឯកជនរវាងអ្នកលេងជាគូ ហេតុផល Cicero និងវិភាគព័ត៌មានដែលអ្នកលេងមានសិទ្ធិចូលប្រើនៅពេលធ្វើការទស្សន៍ទាយ។

“For example, if Cicero is coordinating an attack with an ally against an adversary, Cicero’s prediction of the adversary’s policy must account for the fact that the adversary is not aware of the intended coordination,” said Meta.

Meta និយាយថាវាបានចូល Cicero ដោយមិនបញ្ចេញឈ្មោះនៅក្នុងហ្គេម 40 នៃ Diplomacy នៅក្នុងលីកអនឡាញនៃអ្នកលេងមនុស្សនៅចន្លោះថ្ងៃទី 19 ខែសីហាដល់ថ្ងៃទី 13 ខែតុលា ឆ្នាំ 2022។

វាបាននិយាយថាក្នុងអំឡុងពេលនៃការលេង 72 ម៉ោងដែលពាក់ព័ន្ធនឹងការផ្ញើសារចំនួន 5,277, Cicero បានជាប់ចំណាត់ថ្នាក់ក្នុងកំពូល 10% នៃអ្នកចូលរួមដែលបានលេងហ្គេមច្រើនជាងមួយ។

Meta និយាយថាខ្លួនបានប្រមូលទិន្នន័យពីហ្គេម 125,261 នៃការទូតដែលលេងតាមអ៊ីនធឺណិតនៅ webDiplomacy.net ។ ក្នុងចំណោមហ្គេមទាំងនេះ ហ្គេមសរុបចំនួន 40,408 មានការសន្ទនាជាមួយនឹងសារសរុបចំនួន 12,901,662 ដែលត្រូវបានផ្លាស់ប្តូររវាងអ្នកលេង។

បំផុសគំនិត៖ "មនុស្សយន្តវាយអ្នកផ្សេងក្នុងល្បែងការទូត"

បំផុសគំនិត៖ “មនុស្សយន្តវាយដំអ្នកផ្សេងក្នុងហ្គេមការទូត” (បង្កើតដោយ AI)។

ចំណាំ Meta, AI ថ្មីរបស់វាគឺនៅឆ្ងាយពីល្អឥតខ្ចោះ

Cicero បានផ្ញើសារដែលមានកំហុស ពេលខ្លះផ្ទុយពីផែនការរបស់ខ្លួន និងធ្វើឱ្យមានកំហុសជាយុទ្ធសាស្ត្រ។

ប៉ុន្តែ Meta ទទូចថាមនុស្សនៅតែជ្រើសរើសសហការជាមួយ AI លើអ្នកលេងផ្សេងទៀតដោយមិនដឹងថាវាជា Bot ទេ។

“ស្ទើរតែរាល់ការទម្លាយ AI ពីមុនទាំងអស់នៅក្នុងហ្គេមគឺស្ថិតនៅក្នុងការកំណត់សូន្យបូក (2p0s) ដែលមានអ្នកលេងពីរនាក់ រួមទាំងអុក, ទៅ, ល្បែងបៀរក្បាល និង StarCraft ។ នៅក្នុងហ្គេម 2p0s កំណត់ ក្បួនដោះស្រាយការរៀនពង្រឹងជាក់លាក់ (RL) ដែលរៀនដោយការលេងទល់នឹងខ្លួន - ដំណើរការដែលគេស្គាល់ថាការលេងដោយខ្លួនឯង - នឹងប្រែទៅជាគោលការណ៍ដែលមិនអាចយកឈ្នះបានក្នុងការរំពឹងទុកនៅក្នុងហ្គេមដែលមានតុល្យភាព" Meta បានបន្ថែមនៅក្នុងក្រដាស។ "និយាយម្យ៉ាងទៀត ហ្គេម 2p0s ណាមួយដែលអាចដោះស្រាយបានតាមរយៈការលេងដោយខ្លួនឯងជាមួយនឹងសមត្ថភាពកុំព្យូទ័រ និងគំរូគ្រប់គ្រាន់។"

ទោះបីជាយ៉ាងណាក៏ដោយ លោក Meta បាននិយាយថា ទាក់ទងនឹងហ្គេមដែលពាក់ព័ន្ធនឹងកិច្ចសហប្រតិបត្តិការ ការលេងដោយខ្លួនឯងដោយគ្មានទិន្នន័យរបស់មនុស្ស មិនត្រូវបានធានាទៀតទេក្នុងការស្វែងរកគោលការណ៍ដែលដំណើរការល្អជាមួយមនុស្ស ទោះបីជាមានកុំព្យូទ័រ និងសមត្ថភាពគំរូគ្មានកំណត់ក៏ដោយ ពីព្រោះភ្នាក់ងារលេងដោយខ្លួនឯងអាចឈានដល់គោលការណ៍ដែលមាន។ មិនត្រូវគ្នានឹងបទដ្ឋាន និងការរំពឹងទុករបស់មនុស្ស។

Meta បានបន្ថែមថា Cicero រំពឹងថានឹងមានសកម្មភាពសម្រាប់អ្នកលេងម្នាក់ៗ ដោយផ្អែកលើស្ថានភាពនៃក្រុមប្រឹក្សាភិបាល និងការសន្ទនា ដោយប្រើវាជាចំណុចចាប់ផ្តើមសម្រាប់ក្បួនដោះស្រាយការធ្វើផែនការដោយប្រើគំរូដែលបានបណ្តុះបណ្តាល RL ។

ក្រុមហ៊ុនបាននិយាយថា AI ប្រើប្រាស់ម៉ូឌុលហេតុផលយុទ្ធសាស្ត្រ ដើម្បីជ្រើសរើសចេតនា និងសកម្មភាពដោយឆ្លាតវៃ។

ម៉ូឌុលនេះបន្ទាប់មកដំណើរការក្បួនដោះស្រាយការធ្វើផែនការដែលព្យាករណ៍ពីគោលការណ៍របស់អ្នកលេងផ្សេងទៀតទាំងអស់ដោយផ្អែកលើស្ថានភាពហ្គេម និងការសន្ទនា ហើយរាប់បញ្ចូលទាំងកម្លាំងនៃសកម្មភាពផ្សេងៗគ្នា និងលទ្ធភាពរបស់ពួកគេនៅក្នុងហ្គេមរបស់មនុស្ស។ ដោយផ្អែកលើព័ត៌មាន និងអថេរនេះ សកម្មភាពដ៏ល្អប្រសើរបំផុតសម្រាប់ Cicero ត្រូវបានយក។

នៅក្រោមស្ថាបនិក និងជានាយកប្រតិបត្តិរបស់ Meta លោក Mark Zuckerberg ក្រុមហ៊ុនបាននិងកំពុងវិនិយោគយ៉ាងខ្លាំងលើ AI និង metaverse ដើម្បីទាញយកអត្ថប្រយោជន៍ពីឧស្សាហកម្មដែលកំពុងរីកចម្រើនយ៉ាងឆាប់រហ័សដែលត្រូវបានគេមើលឃើញថាជាអនាគតនៃបច្ចេកវិទ្យា។

សម្រាប់ MetaNews.

spot_img

បញ្ញាចុងក្រោយ

spot_img

ជជែកជាមួយយើង

សួស្តី! តើខ្ញុំអាចជួយអ្នកដោយរបៀបណា?