প্লেটো ডেটা ইন্টেলিজেন্স।
উল্লম্ব অনুসন্ধান এবং Ai.

অ্যাপল ওপেনইএলএম প্রকাশ করে, একটি সামান্য বেশি নির্ভুল এলএলএম

তারিখ:

অ্যাপল, সাধারণত তার খোলামেলাতার জন্য পরিচিত নয়, OpenELM নামে একটি জেনারেটিভ এআই মডেল প্রকাশ করেছে যা স্পষ্টতই পাবলিক ডেটা সেটগুলিতে প্রশিক্ষিত অন্যান্য ভাষার মডেলগুলির একটি সেটকে ছাড়িয়ে যায়।

এটা অনেক দ্বারা না – তুলনায় OLMO, যা ফেব্রুয়ারিতে আত্মপ্রকাশ করেছিল, OpenELM 2.36x কম প্রিট্রেনিং টোকেন ব্যবহার করার সময় 2 শতাংশ বেশি নির্ভুল। তবে এটি সম্ভবত লোকেদের মনে করিয়ে দেওয়ার জন্য যথেষ্ট যে অ্যাপল আর এআই রেভ ইন্ডাস্ট্রিতে ওয়ালফ্লাওয়ার হতে সন্তুষ্ট নয়।

অ্যাপলের উন্মুক্ততার দাবিটি কেবল মডেলটি নয়, এর প্রশিক্ষণ এবং মূল্যায়ন কাঠামো প্রকাশ করার সিদ্ধান্ত থেকে আসে।

"আগের অনুশীলনগুলি থেকে বিচ্ছিন্ন হয়ে যা শুধুমাত্র মডেল ওজন এবং অনুমান কোড প্রদান করে এবং ব্যক্তিগত ডেটাসেটে প্রাক-ট্রেন প্রদান করে, আমাদের রিলিজে প্রশিক্ষণ লগ, একাধিক চেকপয়েন্ট এবং প্রাক-সহ সর্বজনীনভাবে উপলব্ধ ডেটাসেটে ভাষা মডেলের প্রশিক্ষণ এবং মূল্যায়নের সম্পূর্ণ কাঠামো অন্তর্ভুক্ত রয়েছে। -প্রশিক্ষণ কনফিগারেশন,” সংশ্লিষ্ট এগারোজন অ্যাপল গবেষক ব্যাখ্যা করেন প্রযুক্তিগত কাগজ.

এবং একাডেমিক অনুশীলন থেকে ভিন্ন, লেখকদের ইমেল ঠিকানা তালিকাভুক্ত করা হয় না। এটিকে অ্যাপলের খোলামেলা ব্যাখ্যার সাথে মিলিয়ে নিন, যা কিছুটা খোলামেলা ওপেনএআই-এর সাথে তুলনীয়।

সাথে সফ্টওয়্যার রিলিজ একটি স্বীকৃত ওপেন সোর্স লাইসেন্স নয়। এটি অযথা সীমাবদ্ধ নয়, তবে এটি স্পষ্ট করে যে অ্যাপল একটি পেটেন্ট দাবি করার অধিকার সংরক্ষণ করে যদি OpenELM-এর উপর ভিত্তি করে কোনো ডেরিভেটিভ কাজ তার অধিকার লঙ্ঘন করে বলে মনে করা হয়।

OpenELM ট্রান্সফরমার মডেলে আরও দক্ষতার সাথে প্যারামিটার বরাদ্দ করার জন্য স্তর-ভিত্তিক স্কেলিং নামে একটি কৌশল ব্যবহার করে। সুতরাং প্রতিটি স্তরের প্যারামিটারের একই সেটের পরিবর্তে, OpenELM এর ট্রান্সফরমার স্তরগুলির বিভিন্ন কনফিগারেশন এবং পরামিতি রয়েছে। ফলাফল ভালো হয় সঠিকতা, বেঞ্চমার্ক পরীক্ষায় মডেল থেকে সঠিক ভবিষ্যদ্বাণীর শতাংশে দেখানো হয়েছে।

আমাদের বলা হয়েছে যে OpenELM ব্যবহার করে প্রাক-প্রশিক্ষিত ছিল লালপাজামা GitHub থেকে ডেটাসেট, এক টন বই, উইকিপিডিয়া, স্ট্যাকএক্সচেঞ্জ পোস্ট, ArXiv কাগজপত্র এবং আরও অনেক কিছু এবং স্টাফ করা Reddit, Wikibooks, Project Gutenberg, এবং আরও অনেক কিছু থেকে সেট করা হয়েছে। মডেলটি আপনার প্রত্যাশা অনুযায়ী ব্যবহার করা যেতে পারে: আপনি এটিকে একটি প্রম্পট দেন এবং এটি উত্তর দেওয়ার বা স্বয়ংক্রিয়ভাবে সম্পূর্ণ করার চেষ্টা করে।

রিলিজের একটি উল্লেখযোগ্য দিক হল যে এটির সাথে "অ্যাপল ডিভাইসে অনুমান এবং ফাইন-টিউনিংয়ের জন্য মডেলগুলিকে MLX লাইব্রেরিতে রূপান্তর করার কোড" রয়েছে৷

এমএলএক্স অ্যাপল সিলিকনে মেশিন লার্নিং চালানোর জন্য গত বছর প্রকাশিত একটি ফ্রেমওয়ার্ক। নেটওয়ার্কের পরিবর্তে Apple ডিভাইসে স্থানীয়ভাবে কাজ করার ক্ষমতা OpenELM কে ডেভেলপারদের কাছে আরও আকর্ষণীয় করে তুলবে।

"অ্যাপলের ওপেনইএলএম রিলিজ এআই সম্প্রদায়ের জন্য একটি উল্লেখযোগ্য অগ্রগতি চিহ্নিত করে, সীমিত কম্পিউটিং শক্তি সহ মোবাইল অ্যাপস এবং আইওটি ডিভাইসগুলির জন্য দক্ষ, অন-ডিভাইস এআই প্রসেসিং আদর্শ প্রদান করে," শাহার চেন, এআই পরিষেবা বিজ অ্যাকোয়ান্টের সিইও এবং সহ-প্রতিষ্ঠাতা বলেছেন নিবন্ধনকর্মী. "এটি স্মার্টফোন থেকে স্মার্ট হোম ডিভাইস পর্যন্ত সমস্ত কিছুর জন্য দ্রুত, স্থানীয় সিদ্ধান্ত গ্রহণের প্রয়োজনীয়তা সক্ষম করে, দৈনন্দিন প্রযুক্তিতে AI এর সম্ভাবনাকে প্রসারিত করে।"

অ্যাপল মেশিন লার্নিংয়ের জন্য তার স্বদেশী চিপ আর্কিটেকচারের গুণাবলী দেখাতে আগ্রহী, বিশেষভাবে হার্ডওয়্যারে সমর্থিত যেহেতু কিউপার্টিনো এর প্রবর্তন করেছে নিউরাল ইঞ্জিন 2017 সালে। তথাপি OpenELM, যদিও এটি নির্ভুলতার মানদণ্ডে উচ্চতর স্কোর করতে পারে, পারফরম্যান্সের ক্ষেত্রে সংক্ষিপ্ত হয়।

"একই অনুরূপ পরামিতি গণনার জন্য OpenELM-এর উচ্চতর নির্ভুলতা সত্ত্বেও, আমরা লক্ষ্য করি যে এটি OLMO-এর চেয়ে ধীর," কাগজটি ব্যাখ্যা করে, লিনাক্সে এনভিডিয়ার CUDA এবং অ্যাপল সিলিকনে OpenELM-এর MLX সংস্করণ ব্যবহার করে পরীক্ষাগুলি উদ্ধৃত করে৷

কম বিজয়ী দেখানোর জন্য কারণ, অ্যাপল এর boffins বলে, তাদের “এর নিষ্পাপ বাস্তবায়ন RMSNorm,” মেশিন লার্নিংয়ে ডেটা স্বাভাবিক করার একটি কৌশল। ভবিষ্যতে, তারা আরও অপ্টিমাইজেশন অন্বেষণ করার পরিকল্পনা করে।

ওপেনইএলএম 270 মিলিয়ন, 450 মিলিয়ন, 1.1 বিলিয়ন এবং 3 বিলিয়ন প্যারামিটার সহ প্রাক-প্রশিক্ষিত এবং নির্দেশনাযুক্ত মডেলগুলিতে উপলব্ধ। যারা এটি ব্যবহার করছেন তারা অর্থপূর্ণ কিছুর জন্য মডেলটি চেষ্টা করার আগে যথাযথ অধ্যবসায় অনুশীলন করার জন্য সতর্ক করা হয়েছে।

"OpenELM মডেল প্রকাশের লক্ষ্য হল অত্যাধুনিক ভাষার মডেলগুলিতে অ্যাক্সেস প্রদান করে উন্মুক্ত গবেষণা সম্প্রদায়কে ক্ষমতায়ন করা এবং সমৃদ্ধ করা," কাগজটি বলে৷ "সর্বজনীনভাবে উপলব্ধ ডেটাসেটগুলিতে প্রশিক্ষিত, এই মডেলগুলি কোনও নিরাপত্তা গ্যারান্টি ছাড়াই উপলব্ধ করা হয়।" ®

স্পট_আইএমজি

সর্বশেষ বুদ্ধিমত্তা

স্পট_আইএমজি

আমাদের সাথে খোস গল্প কর

হাই সেখানে! আপনাকে কিভাবে সাহায্য করতে পারি?