Plato Data Intelligence។
ការស្វែងរកបញ្ឈរ & អាយ។

Apple បញ្ចេញ OpenELM ដែលជា LLM ត្រឹមត្រូវជាងបន្តិច

កាលបរិច្ឆេទ:

Apple ដែលជាធម្មតាមិនត្រូវបានគេស្គាល់ដោយសារការបើកចំហររបស់ខ្លួនបានបញ្ចេញគំរូ AI ជំនាន់មួយដែលមានឈ្មោះថា OpenELM ដែលជាក់ស្តែងមានដំណើរការលើសពីគំរូភាសាផ្សេងទៀតដែលត្រូវបានបណ្តុះបណ្តាលលើសំណុំទិន្នន័យសាធារណៈ។

វាមិនច្រើនទេ - បើប្រៀបធៀបទៅនឹង អូលម៉ូដែលបានបង្ហាញខ្លួនក្នុងខែកុម្ភៈ។ OpenELM មានភាពសុក្រិតជាង 2.36 ភាគរយ ខណៈពេលដែលប្រើថូខឹន pretraining តិចជាង 2x ។ ប៉ុន្តែវាប្រហែលជាគ្រប់គ្រាន់ដើម្បីរំលឹកមនុស្សថាក្រុមហ៊ុន Apple លែងពេញចិត្តក្នុងការធ្វើជាផ្កាជញ្ជាំងនៅក្នុងឧស្សាហកម្ម AI យ៉ាងខ្លាំង។

ការអះអាងរបស់ក្រុមហ៊ុន Apple ចំពោះការបើកចំហរគឺមកពីការសម្រេចចិត្តរបស់ខ្លួនក្នុងការចេញផ្សាយមិនត្រឹមតែគំរូប៉ុណ្ណោះទេ ប៉ុន្តែការបណ្តុះបណ្តាល និងការវាយតម្លៃរបស់វាផងដែរ។

"ការបង្វែរពីការអនុវត្តពីមុនដែលផ្តល់តែទម្ងន់គំរូ និងលេខកូដសន្និដ្ឋាន និងការបណ្តុះបណ្តាលជាមុនលើសំណុំទិន្នន័យឯកជន ការចេញផ្សាយរបស់យើងរួមបញ្ចូលក្របខ័ណ្ឌពេញលេញសម្រាប់ការបណ្តុះបណ្តាល និងការវាយតម្លៃនៃគំរូភាសានៅលើសំណុំទិន្នន័យដែលមានជាសាធារណៈ រួមទាំងកំណត់ហេតុបណ្តុះបណ្តាល ចំណុចត្រួតពិនិត្យច្រើន និងមុន ការកំណត់រចនាសម្ព័ន្ធការបណ្តុះបណ្តាល” ពន្យល់អ្នកស្រាវជ្រាវ Apple ចំនួន ១១ នាក់ដែលពាក់ព័ន្ធ ក្រដាសបច្ចេកទេស.

ហើយខុសពីការអនុវត្តការសិក្សា អាសយដ្ឋានអ៊ីមែលរបស់អ្នកនិពន្ធមិនត្រូវបានរាយបញ្ជីទេ។ សរសេរវាទៅតាមការបកស្រាយរបស់ Apple អំពីការបើកចំហរ ដែលអាចប្រៀបធៀបទៅនឹង OpenAI ដែលមិនបើកចំហរខ្លាំង។

អមដំណើរ ការចេញផ្សាយកម្មវិធី មិន​មែន​ជា​អាជ្ញាប័ណ្ណ​ប្រភព​បើក​ចំហ​ដែល​ទទួល​ស្គាល់​ទេ។ វាមិនមានការរឹតត្បិតហួសហេតុនោះទេ ប៉ុន្តែវាបញ្ជាក់យ៉ាងច្បាស់ថា Apple រក្សាសិទ្ធិក្នុងការដាក់ពាក្យសុំប៉ាតង់ ប្រសិនបើការងារដេរីវេណាមួយដែលមានមូលដ្ឋានលើ OpenELM ត្រូវបានចាត់ទុកថារំលោភលើសិទ្ធិរបស់ខ្លួន។

OpenELM ប្រើប្រាស់បច្ចេកទេសហៅថា ការធ្វើមាត្រដ្ឋានតាមស្រទាប់ ដើម្បីបែងចែកប៉ារ៉ាម៉ែត្រឱ្យកាន់តែមានប្រសិទ្ធភាពនៅក្នុងគំរូប្លែង។ ដូច្នេះជំនួសឱ្យស្រទាប់នីមួយៗមានសំណុំប៉ារ៉ាម៉ែត្រដូចគ្នា ស្រទាប់ប្លែងរបស់ OpenELM មានការកំណត់រចនាសម្ព័ន្ធ និងប៉ារ៉ាម៉ែត្រខុសៗគ្នា។ លទ្ធផលគឺប្រសើរជាង ភាពត្រឹមត្រូវបង្ហាញក្នុងភាគរយនៃការព្យាករណ៍ត្រឹមត្រូវពីគំរូនៅក្នុងការធ្វើតេស្តគោល។

យើងត្រូវបានគេប្រាប់ថា OpenELM ត្រូវបានបណ្តុះបណ្តាលជាមុនដោយប្រើ ប៉ាចាម៉ាក្រហម សំណុំទិន្នន័យពី GitHub សៀវភៅជាច្រើនតោន វិគីភីឌា ប្រកាស StackExchange ក្រដាស ArXiv និងច្រើនទៀត និង ការ​បំពេញ កំណត់ពី Reddit, Wikibooks, Project Gutenberg និងច្រើនទៀត។ គំរូអាចត្រូវបានប្រើដូចដែលអ្នករំពឹងទុក៖ អ្នកផ្តល់ឱ្យវាភ្លាមៗ ហើយវាព្យាយាមឆ្លើយ ឬបំពេញវាដោយស្វ័យប្រវត្តិ។

ទិដ្ឋភាពគួរឱ្យកត់សម្គាល់មួយនៃការចេញផ្សាយគឺថាវាត្រូវបានអមដោយ "កូដដើម្បីបំប្លែងម៉ូដែលទៅជាបណ្ណាល័យ MLX សម្រាប់ការសន្និដ្ឋាន និងការកែតម្រូវលើឧបករណ៍ Apple" ។

អិម។ ម។ ក គឺ​ជា​ក្របខ័ណ្ឌ​ដែល​បាន​ចេញ​ផ្សាយ​កាល​ពី​ឆ្នាំ​មុន​សម្រាប់​ដំណើរ​ការ​រៀន​ម៉ាស៊ីន​នៅ​លើ Apple Silicon។ សមត្ថភាពក្នុងការដំណើរការក្នុងស្រុកនៅលើឧបករណ៍ Apple ជាជាងតាមរយៈបណ្តាញ គួរតែធ្វើឱ្យ OpenELM កាន់តែចាប់អារម្មណ៍សម្រាប់អ្នកអភិវឌ្ឍន៍។

Shahar Chen នាយកប្រតិបត្តិ និងជាសហស្ថាបនិកនៃសេវាកម្ម AI biz Aquant បានប្រាប់ឲ្យដឹងថា "ការចេញផ្សាយ OpenELM របស់ Apple បង្ហាញពីការវិវឌ្ឍយ៉ាងសំខាន់សម្រាប់សហគមន៍ AI ដោយផ្តល់ជូននូវដំណើរការ AI នៅលើឧបករណ៍ដ៏មានប្រសិទ្ធភាពសម្រាប់កម្មវិធីទូរស័ព្ទ និងឧបករណ៍ IoT ជាមួយនឹងថាមពលកុំព្យូទ័រមានកម្រិត" ។ ចុះឈ្មោះ. "នេះអនុញ្ញាតឱ្យធ្វើការសម្រេចចិត្តក្នុងមូលដ្ឋានបានរហ័ស និងចាំបាច់សម្រាប់អ្វីគ្រប់យ៉ាងចាប់ពីស្មាតហ្វូនរហូតដល់ឧបករណ៍ផ្ទះឆ្លាតវៃ ពង្រីកសក្តានុពលសម្រាប់ AI នៅក្នុងបច្ចេកវិទ្យាប្រចាំថ្ងៃ។"

Apple ចង់បង្ហាញពីគុណសម្បត្តិនៃស្ថាបត្យកម្មបន្ទះឈីបដើមកំណើតរបស់ខ្លួនសម្រាប់ការរៀនម៉ាស៊ីន ដែលគាំទ្រជាពិសេសនៅក្នុងផ្នែករឹងចាប់តាំងពី Cupertino ណែនាំវា ម៉ាស៊ីនសរសៃប្រសាទ ក្នុងឆ្នាំ 2017។ យ៉ាងណាក៏ដោយ OpenELM ខណៈពេលដែលវាអាចទទួលបានពិន្ទុខ្ពស់លើការវាស់ស្ទង់ភាពត្រឹមត្រូវ កើតឡើងក្នុងរយៈពេលខ្លីទាក់ទងនឹងការអនុវត្ត។

កាសែតនេះពន្យល់ដោយលើកឡើងពីការធ្វើតេស្តដំណើរការដោយប្រើ CUDA របស់ Nvidia នៅលើ Linux ក៏ដូចជាកំណែ MLX នៃ OpenELM នៅលើ Apple Silicon ។

ហេតុផលសម្រាប់ការបង្ហាញតិចជាងការទទួលជ័យជម្នះ boffins របស់ក្រុមហ៊ុន Apple បាននិយាយថាគឺជា "ការអនុវត្តឆោតល្ងង់របស់ពួកគេ។ RMNorm” ដែលជាបច្ចេកទេសសម្រាប់ធ្វើឱ្យទិន្នន័យធម្មតានៅក្នុងការរៀនម៉ាស៊ីន។ នៅពេលអនាគត ពួកគេមានគម្រោងស្វែងរកការបង្កើនប្រសិទ្ធភាពបន្ថែមទៀត។

OpenELM មាននៅក្នុងគំរូដែលបានបណ្តុះបណ្តាលជាមុន និងការណែនាំដែលមានប៉ារ៉ាម៉ែត្រ 270 លាន 450 លាន 1.1 ពាន់លាន និង 3 ពាន់លានប៉ារ៉ាម៉ែត្រ។ អ្នក​ដែល​ប្រើ​វា​ត្រូវ​បាន​ព្រមាន​ឱ្យ​អនុវត្ត​ដោយ​ការ​ឧស្សាហ៍​ព្យាយាម​មុន​នឹង​សាកល្បង​ម៉ូដែល​សម្រាប់​អ្វី​ដែល​មាន​អត្ថន័យ។

កាសែតនេះបាននិយាយថា "ការចេញផ្សាយគំរូ OpenELM មានគោលបំណងផ្តល់សិទ្ធិអំណាច និងពង្រឹងសហគមន៍ស្រាវជ្រាវបើកចំហដោយផ្តល់នូវការចូលទៅកាន់គំរូភាសាដែលទំនើបបំផុត"។ "ត្រូវបានបណ្តុះបណ្តាលលើសំណុំទិន្នន័យដែលមានជាសាធារណៈ ម៉ូដែលទាំងនេះត្រូវបានបង្កើតឡើងដោយគ្មានការធានាសុវត្ថិភាពណាមួយឡើយ។" ®

spot_img

ហ្គេម Magic Force 7 នៅ Cleveland

បញ្ញាចុងក្រោយ

spot_img

ជជែកជាមួយយើង

សួស្តី! តើខ្ញុំអាចជួយអ្នកដោយរបៀបណា?