هوش داده افلاطون
جستجوی عمودی و هوش مصنوعی

Naver HyperCLOVA X LLM را معرفی کرد

تاریخ:

غول وب کره ای Naver هفته گذشته خانواده ای از مدل های زبانی بزرگ به نام HyperCLOVA X را معرفی کرد که ادعا کرد در استدلال میان زبانی در زبان های آسیایی نسبت به سایر مدل ها بهتر عمل می کنند - و بنابراین ممکن است به منطقه برای توسعه مدل های زبان بزرگ مستقل کمک کند.

ناور اعلام کرد اولین HyperCLOVA X به زبان کره ای و به انگلیسی زبان اشاره کرد گزارش فنی در مجله دسترسی آزاد arXiv که ادعا می کند "ما معتقدیم که HyperCLOVA X - با قابلیت های رقابتی خود در انگلیسی و سایر زبان های فراتر از کره ای - می تواند راهنمایی مفیدی برای مناطق یا کشورها در توسعه LLM های مستقل خود ارائه دهد."

LLM ها روی داده های «شامل بخش های کره ای، چند زبانه و کد» از قبل آموزش دیده بودند.

زیرمجموعه چند زبانه عمدتاً انگلیسی بود، اما همچنین شامل انواع زبان‌های دیگر مانند ژاپنی، آلمانی و فرانسوی بود.

مطالب زبان کره ای حدود یک سوم داده های قبل از آموزش را تشکیل می داد، که نشان می دهد ناور تصمیم گرفته است عملکرد مدل های خود را در زبان اصلی خود بهبود بخشد. فرآیند پیش‌آموزشی نیز گرامر خاص زبان کره‌ای را در نظر گرفت.

ناور بیان می‌کند که نتیجه این تلاش، مدل‌هایی «با مهارت ذاتی در کره‌ای و انگلیسی» است.

بهتر از آن، مدل‌ها «چندزبانی» را نشان می‌دهند - توانایی کار به زبان‌هایی غیر از زبان‌هایی که آموزش دیده‌اند.

"تحلیل ما نشان می دهد که HyperCLOVA X نه تنها قادر است توانایی استدلال خود را فراتر از زبان های هدف اصلی خود گسترش دهد، بلکه همچنین می تواند به سطح پیشرفته ای در ترجمه ماشینی بین زبان های کره ای و غیر هدفمند مانند ژاپنی و چینی دست یابد." گزارش فنی بیان می کند. "توانایی چشمگیر چند زبانه HyperCLOVA X همچنین شامل انتقال بین زبانی بین کره ای و انگلیسی است، جایی که تنظیم آموزش در یک زبان می تواند منجر به ظهور قابلیت های دنبال کردن دستورالعمل در زبان دیگر شود."

نتایج آزمون چند زبانه توسعه‌دهنده را به این نتیجه رساند که HyperCLOVA X می‌تواند به زبان‌های آسیایی که در داده‌های قبل از آموزش کمتر ارائه شده‌اند، منتقل شود.

هوش مصنوعی مستقل به عنوان یک ظرفیت ملی ضروری در حال ظهور است - به عنوان وسیله ای برای تضمین امنیت داده ها و کاهش وابستگی به ارائه دهندگان خارج از کشور. انویدیا از این مفهوم دفاع کرده است که اتفاقاً پتانسیل ایجاد بازار بزرگتری برای کالاهای خود دارد.

اما همانطور که گزارش فنی ناور اشاره می‌کند، فرهنگ‌های انگلیسی و آمریکای شمالی «بسیار بیش از حد در مجموعه‌های پیش‌آموزشی» برای LLM‌های اصلی موجود وجود دارد.

در نتیجه، این LLM ها محدودیت هایی را در ظرفیت پردازش و درک زبان های غیرانگلیسی مانند کره ای، که مظهر تفاوت های فرهنگی متمایز، موقعیت های ژئوپلیتیکی، و سایر ویژگی های منطقه ای، و همچنین ویژگی های زبانی منحصر به فرد است، نشان می دهند.

چین سنگین وزن منطقه ای به دنبال توسعه LLM در راستای منافع ملی خود – یا حداقل به نفع ح‌ک‌چ – بوده است. موفقیت متفاوت. با این وجود، ربات‌های چت مانند ERNIE بایدو داشتند جمع آوری شد بیش از 100 میلیون کاربر تا پایان سال 2023.

Nak-ho-Seon، رئیس فناوری هوش مصنوعی Naver Cloud Hyperscale، اعلام کرد که قصد دارد "در آینده هوش مصنوعی فوق‌العاده‌ای را برای مناطق و کشورهای مختلف ایجاد کند."

در همین حال، گزارش فنی شامل تعهدی برای "کاوش چندوجهی، با هدف گسترش قابلیت‌های HyperCLOVA X برای پردازش و یکپارچه‌سازی انواع مختلف داده‌ها، مانند متن، تصاویر، و صوت" است، در حالی که به دنبال بهینه‌سازی توانایی‌های استنتاج مدل است.

ناور ادعا کرد که "به طور فعال در حال تحقیق در مورد ادغام ابزارهای خارجی و APIها برای تقویت عملکردهای مدل است" - تلاشی که معتقد است "HyperCLOVA X را قادر می سازد تا به مجموعه داده ها و خدمات تخصصی دسترسی پیدا کند." ®

نقطه_img

جدیدترین اطلاعات

نقطه_img

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟