غول وب کره ای Naver هفته گذشته خانواده ای از مدل های زبانی بزرگ به نام HyperCLOVA X را معرفی کرد که ادعا کرد در استدلال میان زبانی در زبان های آسیایی نسبت به سایر مدل ها بهتر عمل می کنند - و بنابراین ممکن است به منطقه برای توسعه مدل های زبان بزرگ مستقل کمک کند.
ناور اعلام کرد اولین HyperCLOVA X به زبان کره ای و به انگلیسی زبان اشاره کرد گزارش فنی در مجله دسترسی آزاد arXiv که ادعا می کند "ما معتقدیم که HyperCLOVA X - با قابلیت های رقابتی خود در انگلیسی و سایر زبان های فراتر از کره ای - می تواند راهنمایی مفیدی برای مناطق یا کشورها در توسعه LLM های مستقل خود ارائه دهد."
LLM ها روی داده های «شامل بخش های کره ای، چند زبانه و کد» از قبل آموزش دیده بودند.
زیرمجموعه چند زبانه عمدتاً انگلیسی بود، اما همچنین شامل انواع زبانهای دیگر مانند ژاپنی، آلمانی و فرانسوی بود.
مطالب زبان کره ای حدود یک سوم داده های قبل از آموزش را تشکیل می داد، که نشان می دهد ناور تصمیم گرفته است عملکرد مدل های خود را در زبان اصلی خود بهبود بخشد. فرآیند پیشآموزشی نیز گرامر خاص زبان کرهای را در نظر گرفت.
ناور بیان میکند که نتیجه این تلاش، مدلهایی «با مهارت ذاتی در کرهای و انگلیسی» است.
بهتر از آن، مدلها «چندزبانی» را نشان میدهند - توانایی کار به زبانهایی غیر از زبانهایی که آموزش دیدهاند.
"تحلیل ما نشان می دهد که HyperCLOVA X نه تنها قادر است توانایی استدلال خود را فراتر از زبان های هدف اصلی خود گسترش دهد، بلکه همچنین می تواند به سطح پیشرفته ای در ترجمه ماشینی بین زبان های کره ای و غیر هدفمند مانند ژاپنی و چینی دست یابد." گزارش فنی بیان می کند. "توانایی چشمگیر چند زبانه HyperCLOVA X همچنین شامل انتقال بین زبانی بین کره ای و انگلیسی است، جایی که تنظیم آموزش در یک زبان می تواند منجر به ظهور قابلیت های دنبال کردن دستورالعمل در زبان دیگر شود."
نتایج آزمون چند زبانه توسعهدهنده را به این نتیجه رساند که HyperCLOVA X میتواند به زبانهای آسیایی که در دادههای قبل از آموزش کمتر ارائه شدهاند، منتقل شود.
هوش مصنوعی مستقل به عنوان یک ظرفیت ملی ضروری در حال ظهور است - به عنوان وسیله ای برای تضمین امنیت داده ها و کاهش وابستگی به ارائه دهندگان خارج از کشور. انویدیا از این مفهوم دفاع کرده است که اتفاقاً پتانسیل ایجاد بازار بزرگتری برای کالاهای خود دارد.
اما همانطور که گزارش فنی ناور اشاره میکند، فرهنگهای انگلیسی و آمریکای شمالی «بسیار بیش از حد در مجموعههای پیشآموزشی» برای LLMهای اصلی موجود وجود دارد.
در نتیجه، این LLM ها محدودیت هایی را در ظرفیت پردازش و درک زبان های غیرانگلیسی مانند کره ای، که مظهر تفاوت های فرهنگی متمایز، موقعیت های ژئوپلیتیکی، و سایر ویژگی های منطقه ای، و همچنین ویژگی های زبانی منحصر به فرد است، نشان می دهند.
چین سنگین وزن منطقه ای به دنبال توسعه LLM در راستای منافع ملی خود – یا حداقل به نفع حکچ – بوده است. موفقیت متفاوت. با این وجود، رباتهای چت مانند ERNIE بایدو داشتند جمع آوری شد بیش از 100 میلیون کاربر تا پایان سال 2023.
Nak-ho-Seon، رئیس فناوری هوش مصنوعی Naver Cloud Hyperscale، اعلام کرد که قصد دارد "در آینده هوش مصنوعی فوقالعادهای را برای مناطق و کشورهای مختلف ایجاد کند."
در همین حال، گزارش فنی شامل تعهدی برای "کاوش چندوجهی، با هدف گسترش قابلیتهای HyperCLOVA X برای پردازش و یکپارچهسازی انواع مختلف دادهها، مانند متن، تصاویر، و صوت" است، در حالی که به دنبال بهینهسازی تواناییهای استنتاج مدل است.
ناور ادعا کرد که "به طور فعال در حال تحقیق در مورد ادغام ابزارهای خارجی و APIها برای تقویت عملکردهای مدل است" - تلاشی که معتقد است "HyperCLOVA X را قادر می سازد تا به مجموعه داده ها و خدمات تخصصی دسترسی پیدا کند." ®
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://go.theregister.com/feed/www.theregister.com/2024/04/08/naver_cloud_hyperclova_llm_sovereign_ai/