Plato Data Intelligence។
ការស្វែងរកបញ្ឈរ & អាយ។

អ្នក​ប្រើ​ត្រូវ​បាន​គេ​វាយ​ដោយ​រូបភាព​របស់ Microsoft ទៅ​ជា​ឧបករណ៍​វីដេអូ – VASA-

កាលបរិច្ឆេទ:

នៅពេលដែលការប្រជែងដណ្តើមយកឧត្តមភាព AI នៅតែបន្ត ពេលនេះក្រុមហ៊ុន Microsoft ចង់បំប្លែងរូបភាពបញ្ឈររបស់មនុស្សទៅជាមុខនិយាយ ឬវីដេអូជាមួយនឹងឧបករណ៍ចុងក្រោយរបស់ខ្លួនគឺ VASA-1។

យោងតាមឯកសារស្រាវជ្រាវដោយក្រុមហ៊ុនបច្ចេកវិទ្យាយក្ស Microsoft កំពុងតែយកការប្រណាំង AI ទៅកាន់កម្រិតមួយផ្សេងទៀតជាមួយនឹង វ៉ាសា ៣២ក្របខណ្ឌសម្រាប់បង្កើតមុខមាត់និយាយបែបជីវិតរបស់តួអង្គនិម្មិតជាមួយនឹងជំនាញដែលមើលឃើញ (VAS) ទាំងអស់ចេញពីរូបបញ្ឈរ។

អានផងដែរ: ឧស្សាហកម្មហ្គេមវីដេអូប្រញាប់ប្រញាល់រួបរួមគ្នាលើ AI

ពីរូបបញ្ឈររហូតដល់មុខនិយាយ

ទោះបីជាវាមិនទាន់មានជាសាធារណៈក៏ដោយ ឧបករណ៍នេះថតរូបបញ្ឈរតែមួយ និងសំឡេងនិយាយ ហើយផលិតវីដេអូមុខនិយាយបែបប្រាកដនិយមជាមួយនឹងការធ្វើសមកាលកម្មបបូរមាត់ច្បាស់លាស់ ឥរិយាបថមុខដូចជីវិត និងចលនាក្បាលធម្មជាតិដែលបង្កើតក្នុងពេលជាក់ស្តែង។

ឧបករណ៍នេះនៅតែស្ថិតក្នុងដំណាក់កាលស្រាវជ្រាវសាកល្បងជាមួយក្រុមស្រាវជ្រាវ Microsoft ហើយវីដេអូសាកល្បង "មើលទៅគួរអោយចាប់អារម្មណ៍"។

ខណៈពេលដែលក្រុមហ៊ុនដូចជា Nvidia និង Runway មានចលនាក្បាល និងបច្ចេកវិជ្ជាធ្វើសមកាលកម្មបបូរមាត់ស្រដៀងគ្នារួចហើយ VASA-1 ហាក់ដូចជា "មានគុណភាព និងប្រាកដនិយមជាង" ដែលកាត់បន្ថយវត្ថុបុរាណតាមមាត់។ ការណែនាំរបស់ថម។.

លើសពីនេះទៀត វិធីសាស្រ្តនេះចំពោះចលនាដែលជំរុញដោយអូឌីយ៉ូ ក៏ដូចទៅនឹងថ្មីៗនេះដែរ។ Vlogger AI គំរូដោយ Google Research ។

យោងតាមក្រុមហ៊ុន Microsoft ខណៈពេលដែលរូបភាពទាំងអស់នៅក្នុងឧទាហរណ៍នៃការបង្ហាញគឺសំយោគដែលបង្កើតឡើងដោយ Dall-E នោះ VASA-1 នៅតែអាចបង្កើតរូបភាពពិតបាន។

ការបង្ហាញបង្ហាញមនុស្សផ្សេងគ្នានិយាយជាមួយចលនាធម្មជាតិស្ទើរតែ ទឹកមុខ ចលនាភ្នែក "មិនមានវត្ថុបុរាណនៅជុំវិញផ្នែកខាងលើ និងខាងក្រោមនៃមាត់ដែលឃើញនៅក្នុងឧបករណ៍ផ្សេងទៀតទេ"។

វាក៏មិនតម្រូវឱ្យមានរូបភាពរចនាប័ទ្មបញ្ឈរខាងមុខសម្រាប់វាដំណើរការផងដែរ។

VASA-1 បានទទួលមនុស្សនិយាយ

រួចហើយ អ្នកចូលចិត្ត AI ហាក់បីដូចជាចាញ់បោកបច្ចេកវិជ្ជាដែលពណ៌នាថាវាជា "ព្រៃ" និង "ឆ្កួត" នៅលើវេទិកា X ។

"ការកែលម្អដែលយើងទទួលបានរវាងការចេញផ្សាយនីមួយៗគឺអស្ចារ្យណាស់" បាននិយាយថា: Linus Ekenstam ។

អ្នកផ្សេងទៀតមានទស្សនៈដែលពិភពលោកកំពុងមើលឃើញ "ការផ្លាស់ប្តូររញ្ជួយនៅក្នុងរបៀបដែលមាតិកាប្រព័ន្ធផ្សព្វផ្សាយត្រូវបានបង្កើតឡើង" និងរបៀបដែលវាត្រូវបានប្រើប្រាស់។

អ្នកចូលចិត្តម្នាក់ទៀតដែលគេស្គាល់ថាជា Sam បាននិយាយថា "នេះជាការបំផុសគំនិត ភាពប្រាកដនិយមគឺជាចំណុចកំពូល" ។

ទោះបីជាអ្នកផ្សេងទៀតទទួលស្គាល់សមត្ថភាពរបស់ឧបករណ៍នេះក៏ដោយ ក៏ពួកគេគិតថាវាមិនមានទំនួលខុសត្រូវបន្តិចលើផ្នែកនៃក្រុមហ៊ុន Microsoft ក្នុងការណែនាំឧបករណ៍ដែលអាចត្រូវបានរៀបចំយ៉ាងងាយស្រួលសម្រាប់ ការបោះឆ្នោតក្លែងក្លាយ.

“ចង់ទម្លាក់សិទ្ធិនេះមុនការបោះឆ្នោត” សរសេរ Rowan Cheung នៅលើវេទិកា X ។

អ្នកប្រើប្រាស់ម្នាក់ទៀត Evan Kirstel អត្ថាធិប្បាយដោយមានការព្រមានយ៉ាងម៉ឺងម៉ាត់៖ "VASA-1 របស់ Microsoft Research គឺជាកម្មវិធីផ្លាស់ប្តូរហ្គេម បង្កើតវីដេអូដែលបង្កើតដោយ AI ពិតប្រាកដពីរូបថត និងសំឡេងតែប៉ុណ្ណោះ។"

“លទ្ធភាពគឺគ្មានទីបញ្ចប់ ចាប់ពីការរស់ឡើងវិញនូវរឿងព្រេងភាពយន្តបុរាណ រហូតដល់ប្រព័ន្ធផ្សព្វផ្សាយផ្ទាល់ខ្លួន។ ប៉ុន្តែ​សូម​រក្សា​ការ​ប្រុង​ប្រយ័ត្ន​ចំពោះ​ហានិភ័យ​ក្លែងក្លាយ​យ៉ាង​ជ្រៅ​»។

រួច​ហើយ ពិភពលោក​បាន​មើល​ឃើញ​ការ​ហូរ​ចូល​នៃ​ការ​ក្លែង​បន្លំ​ការ​បោះ​ឆ្នោត ដែល​សំឡេង ឬ​រូបភាព​របស់​អ្នក​នយោបាយ​ត្រូវ​បាន​គេ​ប្រើ​ប្រាស់ AI ដើម្បី​ផ្សព្វផ្សាយ​ការ​ឃោសនា។ ប្រហែលមួយភាគបីនៃចំនួនប្រជាជនពិភពលោកនឹងទៅបោះឆ្នោតនៅឆ្នាំនេះ។

ទោះជាយ៉ាងណាក៏ដោយ អ្នកស្រាវជ្រាវនៅក្រុមហ៊ុន Microsoft បានបង្ហាញថា នេះគ្រាន់តែជាការបង្ហាញប៉ុណ្ណោះ ហើយបច្ចុប្បន្នមិនមានគម្រោងសម្រាប់ការចេញផ្សាយជាសាធារណៈ ឬធ្វើឱ្យវាអាចរកបានសម្រាប់អ្នកអភិវឌ្ឍន៍នោះទេ។

តើ VASA-1 ដំណើរការយ៉ាងដូចម្តេច?

យោងទៅតាម Tom's Guide អ្នកស្រាវជ្រាវខ្លួនឯងមានការភ្ញាក់ផ្អើលចំពោះសមត្ថភាពរបស់តារាម៉ូដែលក្នុងការ "ធ្វើសមកាលកម្មបបូរមាត់យ៉ាងល្អឥតខ្ចោះទៅនឹងបទចម្រៀង ឆ្លុះបញ្ចាំងពីពាក្យសម្ដីរបស់តារាចម្រៀងដោយគ្មានបញ្ហា ទោះបីជាមិនមានតន្ត្រីត្រូវបានប្រើនៅក្នុងសំណុំទិន្នន័យបណ្តុះបណ្តាលក៏ដោយ។"

លើសពីនេះ VASA-1 បានគ្រប់គ្រងរចនាបថរូបភាពផ្សេងៗគ្នា រួមទាំងរូបភាពប្រវត្តិសាស្ត្រដូចជារូបដ៏ល្បីល្បាញ Mona Lisa.

ឧបករណ៍នេះអាចត្រូវបានប្រើក្នុងការលេងហ្គេមនៅខាងក្រោយសមត្ថភាព lip-sync កម្រិតខ្ពស់របស់វា។ នេះ​បើ​តាម​អ្នក​ជំនាញ​បាន​និយាយ​ថា នេះ​អាច​ជា​ការ​ផ្លាស់​ប្តូរ​ហ្គេម​សម្រាប់​ការ​ពន្លិច។

លើសពីនេះ បច្ចេកវិទ្យាអាចជាឧបករណ៍មួយក្នុងការបង្កើតរូបតំណាងសម្រាប់វីដេអូប្រព័ន្ធផ្សព្វផ្សាយសង្គម ដូចករណីក្រុមហ៊ុនដូចជា Synthesia និង HeyGen ជាដើម។

ភាពយន្ត និងវីដេអូតន្ត្រីដែលមានមូលដ្ឋានលើ AI ក៏អាចប្រើប្រាស់បច្ចេកវិទ្យា VASA-1 សម្រាប់វីដេអូជាក់ស្តែងបន្ថែមទៀតផងដែរ។

មានឱកាសដែល Microsoft មានភាគហ៊ុននៅក្នុង OpenAI VASA-1 អាចជាផ្នែកមួយនៃ "Copilot នាពេលអនាគត សូរ៉ា សមាហរណកម្ម។”

spot_img

បញ្ញាចុងក្រោយ

spot_img

ជជែកជាមួយយើង

សួស្តី! តើខ្ញុំអាចជួយអ្នកដោយរបៀបណា?