പ്ലേറ്റോ ഡാറ്റ ഇന്റലിജൻസ്.
ലംബ തിരച്ചിൽ & Ai.

കുറച്ചുകൂടി കൃത്യമായ LLM ആയ OpenELM ആപ്പിൾ പുറത്തിറക്കുന്നു

തീയതി:

തുറന്ന് പറയുന്നതിന് സാധാരണയായി അറിയപ്പെടാത്ത ആപ്പിൾ, ഓപ്പൺഇഎൽഎം എന്ന ജനറേറ്റീവ് AI മോഡൽ പുറത്തിറക്കി, ഇത് പൊതു ഡാറ്റാ സെറ്റുകളിൽ പരിശീലിപ്പിച്ച മറ്റ് ഭാഷാ മോഡലുകളുടെ ഒരു കൂട്ടത്തെ മറികടക്കുന്നു.

ഇതുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ ഇത് അധികമല്ല OLMoഫെബ്രുവരിയിൽ അരങ്ങേറിയ, ഓപ്പൺഇഎൽഎം 2.36x കുറവ് പ്രീട്രെയിനിംഗ് ടോക്കണുകൾ ഉപയോഗിക്കുമ്പോൾ 2 ശതമാനം കൂടുതൽ കൃത്യതയുള്ളതാണ്. എന്നാൽ വ്യവസായ AI റേവിലെ വാൾഫ്ലവർ ആകുന്നതിൽ ആപ്പിൾ ഇനി സംതൃപ്തരല്ലെന്ന് ആളുകളെ ഓർമ്മിപ്പിക്കാൻ ഇത് മതിയാകും.

മോഡലിനെ മാത്രമല്ല, പരിശീലനവും മൂല്യനിർണ്ണയ ചട്ടക്കൂടും പുറത്തിറക്കാനുള്ള തീരുമാനത്തിൽ നിന്നാണ് ആപ്പിളിൻ്റെ തുറന്നുപറച്ചിൽ അവകാശപ്പെടുന്നത്.

“മോഡൽ വെയ്റ്റുകളും അനുമാന കോഡും പ്രൈവറ്റ് ഡാറ്റാസെറ്റുകളിൽ പ്രീ-ട്രെയിനുകളും മാത്രം നൽകുന്ന മുൻ സമ്പ്രദായങ്ങളിൽ നിന്ന് വ്യതിചലിച്ച്, പരിശീലന ലോഗുകൾ, ഒന്നിലധികം ചെക്ക്‌പോസ്റ്റുകൾ, പ്രീ എന്നിവ ഉൾപ്പെടെ പൊതുവായി ലഭ്യമായ ഡാറ്റാസെറ്റുകളിൽ ഭാഷാ മോഡലിൻ്റെ പരിശീലനത്തിനും വിലയിരുത്തലിനും വേണ്ടിയുള്ള പൂർണ്ണമായ ചട്ടക്കൂട് ഞങ്ങളുടെ റിലീസിൽ ഉൾപ്പെടുന്നു. -പരിശീലന കോൺഫിഗറേഷനുകൾ," ബന്ധപ്പെട്ട പതിനൊന്ന് ആപ്പിൾ ഗവേഷകർ വിശദീകരിക്കുന്നു സാങ്കേതിക പേപ്പർ.

അക്കാദമിക് പരിശീലനത്തിൽ നിന്ന് വ്യതിചലിച്ച്, രചയിതാക്കളുടെ ഇമെയിൽ വിലാസങ്ങൾ പട്ടികപ്പെടുത്തിയിട്ടില്ല. വളരെ തുറന്നിട്ടില്ലാത്ത ഓപ്പൺ എഐയുമായി താരതമ്യപ്പെടുത്താവുന്ന, ഓപ്പൺനെസ് എന്ന ആപ്പിളിൻ്റെ വ്യാഖ്യാനവുമായി ഇത് ചർച്ച ചെയ്യുക.

അനുഗമിക്കുന്നവർ സോഫ്റ്റ്വെയർ റിലീസ് അംഗീകൃത ഓപ്പൺ സോഴ്സ് ലൈസൻസ് അല്ല. ഇത് അനാവശ്യമായ നിയന്ത്രണങ്ങളല്ല, എന്നാൽ OpenELM അടിസ്ഥാനമാക്കിയുള്ള ഏതെങ്കിലും ഡെറിവേറ്റീവ് വർക്ക് അതിൻ്റെ അവകാശങ്ങൾ ലംഘിക്കുന്നതായി കണക്കാക്കപ്പെട്ടാൽ ഒരു പേറ്റൻ്റ് ക്ലെയിം ഫയൽ ചെയ്യാനുള്ള അവകാശം ആപ്പിളിൽ നിക്ഷിപ്തമാണെന്ന് ഇത് വ്യക്തമാക്കുന്നു.

ട്രാൻസ്ഫോർമർ മോഡലിൽ പാരാമീറ്ററുകൾ കൂടുതൽ കാര്യക്ഷമമായി അനുവദിക്കുന്നതിന്, ലെയർ-വൈസ് സ്കെയിലിംഗ് എന്ന സാങ്കേതികത OpenELM ഉപയോഗിക്കുന്നു. അതിനാൽ ഓരോ ലെയറിനും ഒരേ പാരാമീറ്ററുകൾ ഉണ്ടായിരിക്കുന്നതിനുപകരം, OpenELM-ൻ്റെ ട്രാൻസ്ഫോർമർ ലെയറുകൾക്ക് വ്യത്യസ്ത കോൺഫിഗറേഷനുകളും പാരാമീറ്ററുകളും ഉണ്ട്. ഫലം മികച്ചതാണ് കൃത്യത, ബെഞ്ച്മാർക്ക് ടെസ്റ്റുകളിൽ മോഡലിൽ നിന്നുള്ള ശരിയായ പ്രവചനങ്ങളുടെ ശതമാനത്തിൽ കാണിച്ചിരിക്കുന്നു.

ഓപ്പൺഇഎൽഎം ഉപയോഗിച്ചാണ് മുൻകൂട്ടി പരിശീലിപ്പിച്ചതെന്ന് ഞങ്ങളോട് പറയപ്പെടുന്നു റെഡ്പജാമ GitHub-ൽ നിന്നുള്ള ഡാറ്റാസെറ്റ്, ഒരു ടൺ പുസ്തകങ്ങൾ, വിക്കിപീഡിയ, StackExchange പോസ്റ്റുകൾ, ArXiv പേപ്പറുകൾ എന്നിവയും അതിലേറെയും സ്റ്റഫ് Reddit, Wikibooks, Project Gutenberg എന്നിവയിൽ നിന്നും മറ്റും സജ്ജീകരിച്ചിരിക്കുന്നു. നിങ്ങൾ പ്രതീക്ഷിക്കുന്നതുപോലെ മോഡൽ ഉപയോഗിക്കാം: നിങ്ങൾ അതിന് ഒരു പ്രോംപ്റ്റ് നൽകുന്നു, അത് ഉത്തരം നൽകാനോ സ്വയമേവ പൂർത്തിയാക്കാനോ ശ്രമിക്കുന്നു.

റിലീസിൻ്റെ ശ്രദ്ധേയമായ ഒരു വശം, "ആപ്പിൾ ഉപകരണങ്ങളിൽ അനുമാനിക്കുന്നതിനും മികച്ച ട്യൂണിംഗിനുമായി മോഡലുകളെ MLX ലൈബ്രറിയിലേക്ക് പരിവർത്തനം ചെയ്യുന്നതിനുള്ള കോഡ്" ഉണ്ട് എന്നതാണ്.

എം.എൽ.എക്സ് ആപ്പിൾ സിലിക്കണിൽ മെഷീൻ ലേണിംഗ് പ്രവർത്തിപ്പിക്കുന്നതിനായി കഴിഞ്ഞ വർഷം പുറത്തിറക്കിയ ചട്ടക്കൂടാണ്. നെറ്റ്‌വർക്കിലൂടെയല്ല, ആപ്പിൾ ഉപകരണങ്ങളിൽ പ്രാദേശികമായി പ്രവർത്തിക്കാനുള്ള കഴിവ്, ഡെവലപ്പർമാർക്ക് OpenELM-നെ കൂടുതൽ രസകരമാക്കും.

പരിമിതമായ കമ്പ്യൂട്ടിംഗ് പവർ ഉള്ള മൊബൈൽ ആപ്പുകൾക്കും IoT ഉപകരണങ്ങൾക്കും കാര്യക്ഷമവും ഉപകരണത്തിൽ AI പ്രോസസ്സിംഗ് അനുയോജ്യവും വാഗ്ദാനം ചെയ്യുന്ന, AI കമ്മ്യൂണിറ്റിക്ക് കാര്യമായ പുരോഗതിയാണ് ആപ്പിളിൻ്റെ OpenELM റിലീസ് സൂചിപ്പിക്കുന്നത്, AI സേവന ബിസ് അക്വാൻ്റിൻ്റെ സിഇഒയും സഹസ്ഥാപകനുമായ ഷഹർ ചെൻ പറഞ്ഞു. രജിസ്റ്റർ. “ഇത് സ്‌മാർട്ട്‌ഫോണുകൾ മുതൽ സ്‌മാർട്ട് ഹോം ഉപകരണങ്ങൾ വരെയുള്ള എല്ലാ കാര്യങ്ങളിലും വേഗത്തിലുള്ളതും പ്രാദേശികവുമായ തീരുമാനമെടുക്കൽ പ്രാപ്‌തമാക്കുന്നു, ദൈനംദിന സാങ്കേതികവിദ്യയിൽ AI-യുടെ സാധ്യതകൾ വികസിപ്പിക്കുന്നു.”

ക്യൂപെർട്ടിനോ അവതരിപ്പിച്ചതുമുതൽ ഹാർഡ്‌വെയറിൽ പ്രത്യേകമായി പിന്തുണയ്‌ക്കുന്ന മെഷീൻ ലേണിംഗിനായി അതിൻ്റെ ഹോംഗ്രൗൺ ചിപ്പ് ആർക്കിടെക്‌ചറിൻ്റെ ഗുണങ്ങൾ കാണിക്കാൻ ആപ്പിൾ താൽപ്പര്യപ്പെടുന്നു. ന്യൂറൽ എഞ്ചിൻ 2017-ൽ. എന്നിരുന്നാലും, ഓപ്പൺഇഎൽഎം, കൃത്യത മാനദണ്ഡങ്ങളിൽ കൂടുതൽ സ്കോർ ചെയ്തേക്കാം, പ്രകടനത്തിൻ്റെ കാര്യത്തിൽ അത് കുറവാണ്.

"സമാനമായ പാരാമീറ്റർ എണ്ണത്തിന് OpenELM-ൻ്റെ ഉയർന്ന കൃത്യത ഉണ്ടായിരുന്നിട്ടും, അത് OLMo-യേക്കാൾ വേഗത കുറവാണെന്ന് ഞങ്ങൾ നിരീക്ഷിക്കുന്നു," ലിനക്സിൽ എൻവിഡിയയുടെ CUDA ഉപയോഗിച്ചും ആപ്പിൾ സിലിക്കണിലെ OpenELM-ൻ്റെ MLX പതിപ്പും ഉപയോഗിച്ചുള്ള ടെസ്റ്റുകളെ ഉദ്ധരിച്ച് പേപ്പർ വിശദീകരിക്കുന്നു.

വിജയിക്കുന്നതിൽ കുറവുള്ളതിൻ്റെ കാരണം, ആപ്പിളിൻ്റെ ബോഫിനുകൾ പറയുന്നത്, അവരുടെ “നിഷ്കളങ്കമായ നടപ്പാക്കലാണ്. RMSNorm,” മെഷീൻ ലേണിംഗിൽ ഡാറ്റ നോർമലൈസ് ചെയ്യുന്നതിനുള്ള ഒരു സാങ്കേതികത. ഭാവിയിൽ, കൂടുതൽ ഒപ്റ്റിമൈസേഷനുകൾ പര്യവേക്ഷണം ചെയ്യാൻ അവർ പദ്ധതിയിടുന്നു.

270 ദശലക്ഷം, 450 ദശലക്ഷം, 1.1 ബില്ല്യൻ, 3 ബില്ല്യൺ പാരാമീറ്ററുകളുള്ള പ്രീട്രെയിൻഡ്, ഇൻസ്ട്രക്ഷൻ ട്യൂൺഡ് മോഡലുകളിൽ OpenELM ലഭ്യമാണ്. അർത്ഥവത്തായ എന്തിനും മാതൃക പരീക്ഷിക്കുന്നതിന് മുമ്പ് അത് ഉപയോഗിക്കുന്നവർ ജാഗ്രത പാലിക്കണമെന്ന് മുന്നറിയിപ്പ് നൽകുന്നു.

"ഓപ്പൺഇഎൽഎം മോഡലുകളുടെ പ്രകാശനം അത്യാധുനിക ഭാഷാ മോഡലുകളിലേക്ക് പ്രവേശനം നൽകിക്കൊണ്ട് ഓപ്പൺ റിസർച്ച് കമ്മ്യൂണിറ്റിയെ ശാക്തീകരിക്കാനും സമ്പന്നമാക്കാനും ലക്ഷ്യമിടുന്നു," പത്രം പറയുന്നു. "പൊതുവായി ലഭ്യമായ ഡാറ്റാസെറ്റുകളിൽ പരിശീലനം ലഭിച്ച ഈ മോഡലുകൾ യാതൊരു സുരക്ഷാ ഗ്യാരൻ്റിയും ഇല്ലാതെ ലഭ്യമാക്കിയിട്ടുണ്ട്." ®

സ്പോട്ട്_ഐഎംജി

ഏറ്റവും പുതിയ ഇന്റലിജൻസ്

സ്പോട്ട്_ഐഎംജി

ഞങ്ങളുമായി ചാറ്റുചെയ്യുക

ഹേയ്, അവിടെയുണ്ടോ! എനിക്ക് നിങ്ങളെ എങ്ങനെ സഹായിക്കാനാകും?