เพลโต ดาต้า อินเทลลิเจนซ์
ค้นหาแนวตั้ง & Ai

Apple เปิดตัว OpenELM ซึ่งเป็น LLM ที่แม่นยำยิ่งขึ้นเล็กน้อย

วันที่:

Apple ซึ่งปกติไม่เป็นที่รู้จักในเรื่องความเปิดกว้างได้เปิดตัวโมเดล AI เจนเนอเรชั่นที่เรียกว่า OpenELM ซึ่งเห็นได้ชัดว่ามีประสิทธิภาพเหนือกว่าชุดโมเดลภาษาอื่น ๆ ที่ได้รับการฝึกในชุดข้อมูลสาธารณะ

มันไม่มากเมื่อเทียบกับ โอลโมซึ่งเปิดตัวในเดือนกุมภาพันธ์ OpenELM มีความแม่นยำมากขึ้น 2.36 เปอร์เซ็นต์ ในขณะที่ใช้โทเค็นการฝึกล่วงหน้าน้อยลง 2 เท่า แต่อาจจะเพียงพอที่จะเตือนผู้คนว่า Apple ไม่พอใจที่จะเป็นเจ้าพ่อในวงการ AI อีกต่อไป

การเรียกร้องความเปิดกว้างของ Apple มาจากการตัดสินใจที่จะเปิดตัวไม่เพียงแค่โมเดลเท่านั้น แต่ยังรวมถึงกรอบการฝึกอบรมและการประเมินผลด้วย

“แตกต่างจากแนวทางปฏิบัติก่อนหน้านี้ที่ให้เฉพาะน้ำหนักโมเดลและรหัสการอนุมาน และการฝึกอบรมล่วงหน้ากับชุดข้อมูลส่วนตัว การเปิดตัวของเราประกอบด้วยเฟรมเวิร์กที่สมบูรณ์สำหรับการฝึกอบรมและการประเมินโมเดลภาษาบนชุดข้อมูลที่เปิดเผยต่อสาธารณะ รวมถึงบันทึกการฝึกอบรม จุดตรวจสอบหลายจุด และก่อน -การกำหนดค่าการฝึกอบรม” อธิบายนักวิจัยของ Apple 11 คนในหน่วยงานที่เกี่ยวข้อง เอกสารทางเทคนิค.

และแตกต่างจากการปฏิบัติทางวิชาการ ที่อยู่อีเมลของผู้เขียนไม่อยู่ในรายการ ลองทำความเข้าใจกับการตีความความเปิดกว้างของ Apple ซึ่งค่อนข้างเทียบได้กับ OpenAI ที่ไม่เปิดกว้างมากนัก

ที่มาพร้อมกับ การเปิดตัวซอฟต์แวร์ ไม่ใช่ใบอนุญาตโอเพ่นซอร์สที่ได้รับการยอมรับ ไม่ได้มีข้อจำกัดมากเกินไป แต่แสดงให้เห็นชัดเจนว่า Apple ขอสงวนสิทธิ์ในการยื่นคำร้องสิทธิบัตร หากผลงานลอกเลียนใดๆ ที่ใช้ OpenELM ถือเป็นการละเมิดสิทธิ์ของตน

OpenELM ใช้เทคนิคที่เรียกว่า Layer-wise scaling เพื่อจัดสรรพารามิเตอร์ในโมเดลหม้อแปลงได้อย่างมีประสิทธิภาพมากขึ้น ดังนั้นแทนที่จะแต่ละเลเยอร์มีชุดพารามิเตอร์เหมือนกัน เลเยอร์หม้อแปลงของ OpenELM จึงมีการกำหนดค่าและพารามิเตอร์ที่แตกต่างกัน ผลลัพธ์ที่ได้ก็ดีขึ้น ความถูกต้องซึ่งแสดงเป็นเปอร์เซ็นต์ของการคาดการณ์ที่ถูกต้องจากแบบจำลองในการทดสอบเกณฑ์มาตรฐาน

เราได้รับแจ้งว่า OpenELM ได้รับการฝึกอบรมล่วงหน้าโดยใช้ ชุดนอนสีแดง ชุดข้อมูลจาก GitHub, หนังสือมากมาย, Wikipedia, โพสต์ StackExchange, เอกสาร ArXiv และอื่นๆ อีกมากมาย และ ยัดไส้ กำหนดจาก Reddit, Wikibooks, Project Gutenberg และอีกมากมาย สามารถใช้โมเดลได้ตามที่คุณคาดหวัง: คุณแจ้งและพยายามตอบหรือเติมให้อัตโนมัติ

ด้านที่น่าสังเกตอย่างหนึ่งของการเปิดตัวคือมาพร้อมกับ “โค้ดสำหรับแปลงโมเดลเป็นไลบรารี MLX สำหรับการอนุมานและการปรับแต่งบนอุปกรณ์ Apple”

ม.ล เป็นเฟรมเวิร์กที่เปิดตัวเมื่อปีที่แล้วสำหรับการรันการเรียนรู้ของเครื่องบน Apple Silicon ความสามารถในการทำงานภายในเครื่องบนอุปกรณ์ Apple แทนที่จะทำงานผ่านเครือข่าย น่าจะทำให้ OpenELM น่าสนใจสำหรับนักพัฒนามากขึ้น

“การเปิดตัว OpenELM ของ Apple ถือเป็นความก้าวหน้าครั้งสำคัญสำหรับชุมชน AI โดยนำเสนอการประมวลผล AI บนอุปกรณ์ที่มีประสิทธิภาพ เหมาะสำหรับแอพมือถือและอุปกรณ์ IoT ที่มีพลังการประมวลผลจำกัด” Shahar Chen ซีอีโอและผู้ร่วมก่อตั้งธุรกิจบริการ AI Aquant กล่าว ลงทะเบียน- “สิ่งนี้ช่วยให้ทำการตัดสินใจในท้องถิ่นได้อย่างรวดเร็วและจำเป็นสำหรับทุกสิ่งตั้งแต่สมาร์ทโฟนไปจนถึงอุปกรณ์สมาร์ทโฮม ซึ่งเป็นการขยายศักยภาพของ AI ในเทคโนโลยีในชีวิตประจำวัน”

Apple กระตือรือร้นที่จะแสดงข้อดีของสถาปัตยกรรมชิปที่ผลิตเองสำหรับการเรียนรู้ของเครื่อง ซึ่งรองรับฮาร์ดแวร์โดยเฉพาะนับตั้งแต่ที่ Cupertino เปิดตัว เครื่องยนต์ประสาท ในปี 2017 อย่างไรก็ตาม แม้ว่า OpenELM อาจได้คะแนนที่สูงกว่าในเกณฑ์มาตรฐานความแม่นยำ แต่ก็กลับมีน้อยในแง่ของประสิทธิภาพ

“แม้ว่า OpenELM จะมีความแม่นยำสูงกว่าสำหรับการนับพารามิเตอร์ที่คล้ายกัน แต่เราสังเกตว่ามันช้ากว่า OLMo” เอกสารอธิบาย โดยอ้างถึงการทดสอบที่ทำงานโดยใช้ CUDA ของ Nvidia บน Linux รวมถึง OpenELM เวอร์ชัน MLX บน Apple Silicon

เหตุผลสำหรับการแสดงที่น้อยกว่าชัยชนะ boffins ของ Apple กล่าวว่าคือ "การดำเนินการที่ไร้เดียงสาของพวกเขา" RMSนอร์ม” เทคนิคการทำให้ข้อมูลเป็นมาตรฐานในการเรียนรู้ของเครื่อง ในอนาคต พวกเขาวางแผนที่จะสำรวจการเพิ่มประสิทธิภาพเพิ่มเติม

OpenELM มีจำหน่ายในรุ่นที่ปรับแต่งล่วงหน้าและคำสั่งพร้อมพารามิเตอร์ 270 ล้าน, 450 ล้าน, 1.1 พันล้าน และ 3 พันล้านพารามิเตอร์ ผู้ที่ใช้โมเดลนี้ควรระมัดระวังก่อนที่จะลองใช้โมเดลนี้เพื่อสิ่งที่มีความหมาย

“การเปิดตัวโมเดล OpenELM มีเป้าหมายเพื่อเพิ่มศักยภาพและเสริมสร้างชุมชนการวิจัยแบบเปิดโดยให้การเข้าถึงโมเดลภาษาที่ล้ำสมัย” รายงานกล่าว “โมเดลเหล่านี้ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่เปิดเผยต่อสาธารณะ โดยไม่มีการรับประกันความปลอดภัยใดๆ”

จุด_img

ข่าวกรองล่าสุด

จุด_img

แชทกับเรา

สวัสดี! ฉันจะช่วยคุณได้อย่างไร?