នៅពេលដែលការប្រជែងដណ្តើមយកឧត្តមភាព AI នៅតែបន្ត ពេលនេះក្រុមហ៊ុន Microsoft ចង់បំប្លែងរូបភាពបញ្ឈររបស់មនុស្សទៅជាមុខនិយាយ ឬវីដេអូជាមួយនឹងឧបករណ៍ចុងក្រោយរបស់ខ្លួនគឺ VASA-1។
យោងតាមឯកសារស្រាវជ្រាវដោយក្រុមហ៊ុនបច្ចេកវិទ្យាយក្ស Microsoft កំពុងតែយកការប្រណាំង AI ទៅកាន់កម្រិតមួយផ្សេងទៀតជាមួយនឹង វ៉ាសា ៣២ក្របខណ្ឌសម្រាប់បង្កើតមុខមាត់និយាយបែបជីវិតរបស់តួអង្គនិម្មិតជាមួយនឹងជំនាញដែលមើលឃើញ (VAS) ទាំងអស់ចេញពីរូបបញ្ឈរ។
អានផងដែរ: ឧស្សាហកម្មហ្គេមវីដេអូប្រញាប់ប្រញាល់រួបរួមគ្នាលើ AI
ពីរូបបញ្ឈររហូតដល់មុខនិយាយ
ទោះបីជាវាមិនទាន់មានជាសាធារណៈក៏ដោយ ឧបករណ៍នេះថតរូបបញ្ឈរតែមួយ និងសំឡេងនិយាយ ហើយផលិតវីដេអូមុខនិយាយបែបប្រាកដនិយមជាមួយនឹងការធ្វើសមកាលកម្មបបូរមាត់ច្បាស់លាស់ ឥរិយាបថមុខដូចជីវិត និងចលនាក្បាលធម្មជាតិដែលបង្កើតក្នុងពេលជាក់ស្តែង។
ឧបករណ៍នេះនៅតែស្ថិតក្នុងដំណាក់កាលស្រាវជ្រាវសាកល្បងជាមួយក្រុមស្រាវជ្រាវ Microsoft ហើយវីដេអូសាកល្បង "មើលទៅគួរអោយចាប់អារម្មណ៍"។
ខណៈពេលដែលក្រុមហ៊ុនដូចជា Nvidia និង Runway មានចលនាក្បាល និងបច្ចេកវិជ្ជាធ្វើសមកាលកម្មបបូរមាត់ស្រដៀងគ្នារួចហើយ VASA-1 ហាក់ដូចជា "មានគុណភាព និងប្រាកដនិយមជាង" ដែលកាត់បន្ថយវត្ថុបុរាណតាមមាត់។ ការណែនាំរបស់ថម។.
លើសពីនេះទៀត វិធីសាស្រ្តនេះចំពោះចលនាដែលជំរុញដោយអូឌីយ៉ូ ក៏ដូចទៅនឹងថ្មីៗនេះដែរ។ Vlogger AI គំរូដោយ Google Research ។
យោងតាមក្រុមហ៊ុន Microsoft ខណៈពេលដែលរូបភាពទាំងអស់នៅក្នុងឧទាហរណ៍នៃការបង្ហាញគឺសំយោគដែលបង្កើតឡើងដោយ Dall-E នោះ VASA-1 នៅតែអាចបង្កើតរូបភាពពិតបាន។
ការបង្ហាញបង្ហាញមនុស្សផ្សេងគ្នានិយាយជាមួយចលនាធម្មជាតិស្ទើរតែ ទឹកមុខ ចលនាភ្នែក "មិនមានវត្ថុបុរាណនៅជុំវិញផ្នែកខាងលើ និងខាងក្រោមនៃមាត់ដែលឃើញនៅក្នុងឧបករណ៍ផ្សេងទៀតទេ"។
វាក៏មិនតម្រូវឱ្យមានរូបភាពរចនាប័ទ្មបញ្ឈរខាងមុខសម្រាប់វាដំណើរការផងដែរ។
ក្រុមហ៊ុន Microsoft ទើបតែណែនាំ VASA-1 ។
វាជាគំរូ AI ថ្មីដែលអាចប្រែក្លាយរូបថត 1 សន្លឹក និងសម្លេង 1 ដុំ ទៅជារូបភាពមនុស្សពិតយ៉ាងពេញលេញ។
ព្រៃផ្សៃទម្លាក់សិទ្ធិមុនបោះឆ្នោត 😬pic.twitter.com/MuLkZVOKRM
— Rowan Cheung (@rowancheung) ខែមេសា 18, 2024
VASA-1 បានទទួលមនុស្សនិយាយ
រួចហើយ អ្នកចូលចិត្ត AI ហាក់បីដូចជាចាញ់បោកបច្ចេកវិជ្ជាដែលពណ៌នាថាវាជា "ព្រៃ" និង "ឆ្កួត" នៅលើវេទិកា X ។
"ការកែលម្អដែលយើងទទួលបានរវាងការចេញផ្សាយនីមួយៗគឺអស្ចារ្យណាស់" បាននិយាយថា: Linus Ekenstam ។
អ្នកផ្សេងទៀតមានទស្សនៈដែលពិភពលោកកំពុងមើលឃើញ "ការផ្លាស់ប្តូររញ្ជួយនៅក្នុងរបៀបដែលមាតិកាប្រព័ន្ធផ្សព្វផ្សាយត្រូវបានបង្កើតឡើង" និងរបៀបដែលវាត្រូវបានប្រើប្រាស់។
អ្នកចូលចិត្តម្នាក់ទៀតដែលគេស្គាល់ថាជា Sam បាននិយាយថា "នេះជាការបំផុសគំនិត ភាពប្រាកដនិយមគឺជាចំណុចកំពូល" ។
ទោះបីជាអ្នកផ្សេងទៀតទទួលស្គាល់សមត្ថភាពរបស់ឧបករណ៍នេះក៏ដោយ ក៏ពួកគេគិតថាវាមិនមានទំនួលខុសត្រូវបន្តិចលើផ្នែកនៃក្រុមហ៊ុន Microsoft ក្នុងការណែនាំឧបករណ៍ដែលអាចត្រូវបានរៀបចំយ៉ាងងាយស្រួលសម្រាប់ ការបោះឆ្នោតក្លែងក្លាយ.
“ចង់ទម្លាក់សិទ្ធិនេះមុនការបោះឆ្នោត” សរសេរ Rowan Cheung នៅលើវេទិកា X ។
អ្នកប្រើប្រាស់ម្នាក់ទៀត Evan Kirstel អត្ថាធិប្បាយដោយមានការព្រមានយ៉ាងម៉ឺងម៉ាត់៖ "VASA-1 របស់ Microsoft Research គឺជាកម្មវិធីផ្លាស់ប្តូរហ្គេម បង្កើតវីដេអូដែលបង្កើតដោយ AI ពិតប្រាកដពីរូបថត និងសំឡេងតែប៉ុណ្ណោះ។"
“លទ្ធភាពគឺគ្មានទីបញ្ចប់ ចាប់ពីការរស់ឡើងវិញនូវរឿងព្រេងភាពយន្តបុរាណ រហូតដល់ប្រព័ន្ធផ្សព្វផ្សាយផ្ទាល់ខ្លួន។ ប៉ុន្តែសូមរក្សាការប្រុងប្រយ័ត្នចំពោះហានិភ័យក្លែងក្លាយយ៉ាងជ្រៅ»។
រួចហើយ ពិភពលោកបានមើលឃើញការហូរចូលនៃការក្លែងបន្លំការបោះឆ្នោត ដែលសំឡេង ឬរូបភាពរបស់អ្នកនយោបាយត្រូវបានគេប្រើប្រាស់ AI ដើម្បីផ្សព្វផ្សាយការឃោសនា។ ប្រហែលមួយភាគបីនៃចំនួនប្រជាជនពិភពលោកនឹងទៅបោះឆ្នោតនៅឆ្នាំនេះ។
ទោះជាយ៉ាងណាក៏ដោយ អ្នកស្រាវជ្រាវនៅក្រុមហ៊ុន Microsoft បានបង្ហាញថា នេះគ្រាន់តែជាការបង្ហាញប៉ុណ្ណោះ ហើយបច្ចុប្បន្នមិនមានគម្រោងសម្រាប់ការចេញផ្សាយជាសាធារណៈ ឬធ្វើឱ្យវាអាចរកបានសម្រាប់អ្នកអភិវឌ្ឍន៍នោះទេ។
តើ VASA-1 ដំណើរការយ៉ាងដូចម្តេច?
យោងទៅតាម Tom's Guide អ្នកស្រាវជ្រាវខ្លួនឯងមានការភ្ញាក់ផ្អើលចំពោះសមត្ថភាពរបស់តារាម៉ូដែលក្នុងការ "ធ្វើសមកាលកម្មបបូរមាត់យ៉ាងល្អឥតខ្ចោះទៅនឹងបទចម្រៀង ឆ្លុះបញ្ចាំងពីពាក្យសម្ដីរបស់តារាចម្រៀងដោយគ្មានបញ្ហា ទោះបីជាមិនមានតន្ត្រីត្រូវបានប្រើនៅក្នុងសំណុំទិន្នន័យបណ្តុះបណ្តាលក៏ដោយ។"
លើសពីនេះ VASA-1 បានគ្រប់គ្រងរចនាបថរូបភាពផ្សេងៗគ្នា រួមទាំងរូបភាពប្រវត្តិសាស្ត្រដូចជារូបដ៏ល្បីល្បាញ Mona Lisa.
ឧបករណ៍នេះអាចត្រូវបានប្រើក្នុងការលេងហ្គេមនៅខាងក្រោយសមត្ថភាព lip-sync កម្រិតខ្ពស់របស់វា។ នេះបើតាមអ្នកជំនាញបាននិយាយថា នេះអាចជាការផ្លាស់ប្តូរហ្គេមសម្រាប់ការពន្លិច។
លើសពីនេះ បច្ចេកវិទ្យាអាចជាឧបករណ៍មួយក្នុងការបង្កើតរូបតំណាងសម្រាប់វីដេអូប្រព័ន្ធផ្សព្វផ្សាយសង្គម ដូចករណីក្រុមហ៊ុនដូចជា Synthesia និង HeyGen ជាដើម។
ភាពយន្ត និងវីដេអូតន្ត្រីដែលមានមូលដ្ឋានលើ AI ក៏អាចប្រើប្រាស់បច្ចេកវិទ្យា VASA-1 សម្រាប់វីដេអូជាក់ស្តែងបន្ថែមទៀតផងដែរ។
មានឱកាសដែល Microsoft មានភាគហ៊ុននៅក្នុង OpenAI VASA-1 អាចជាផ្នែកមួយនៃ "Copilot នាពេលអនាគត សូរ៉ា សមាហរណកម្ម។”
- SEO ដែលដំណើរការដោយមាតិកា និងការចែកចាយ PR ។ ទទួលបានការពង្រីកថ្ងៃនេះ។
- PlatoData.Network Vertical Generative Ai. ផ្តល់អំណាចដល់ខ្លួនអ្នក។ ចូលប្រើទីនេះ។
- PlatoAiStream Web3 Intelligence ។ ចំណេះដឹងត្រូវបានពង្រីក។ ចូលប្រើទីនេះ។
- ផ្លាតូអេសជី។ កាបូន CleanTech, ថាមពល, បរិស្ថាន, ពន្លឺព្រះអាទិត្យ ការគ្រប់គ្រងកាកសំណល់។ ចូលប្រើទីនេះ។
- ផ្លាតូសុខភាព។ ជីវបច្ចេកវិទ្យា និង ភាពវៃឆ្លាត សាកល្បងគ្លីនិក។ ចូលប្រើទីនេះ។
- ប្រភព: https://metanews.com/enthusiasts-smitten-by-image-to-video-tool-vasa-1/