เพลโต ดาต้า อินเทลลิเจนซ์
ค้นหาแนวตั้ง & Ai

AI รู้หรือไม่ว่า Apple คืออะไร? เธอตั้งเป้าที่จะค้นหาคำตอบ - นิตยสารควอนต้า

วันที่:

บทนำ

เริ่มพูดคุยด้วย เอลลี่ พาฟลิค เกี่ยวกับงานของเธอ — มองหาหลักฐานความเข้าใจในโมเดลภาษาขนาดใหญ่ (LLM) — และเธออาจฟังดูราวกับว่าเธอกำลังล้อเล่นกับมัน วลี “hand-wavy” เป็นวลียอดนิยม และหากเธอพูดถึง “ความหมาย” หรือ “การให้เหตุผล” ก็มักจะมาพร้อมกับคำพูดที่สื่อความหมายอย่างชัดเจน นี่เป็นเพียงวิธีของพาฟลิคในการรักษาตัวเองให้ซื่อสัตย์ ในฐานะนักวิทยาศาสตร์คอมพิวเตอร์ที่กำลังศึกษาโมเดลภาษาที่ Brown University และ Google DeepMind เธอรู้ดีว่าการเปิดรับความนุ่มนวลโดยธรรมชาติของภาษาธรรมชาติเป็นวิธีเดียวที่จะจริงจังกับเรื่องนี้ “นี่เป็นระเบียบวินัยทางวิทยาศาสตร์ และมันค่อนข้างจะน่าเบื่อนิดหน่อย” เธอกล่าว

ความแม่นยำและความแตกต่างเล็กๆ น้อยๆ อยู่ร่วมกันในโลกของ Pavlick มาตั้งแต่วัยรุ่น เมื่อเธอชอบคณิตศาสตร์และวิทยาศาสตร์ “แต่มักถูกมองว่าเป็นคนประเภทสร้างสรรค์มากกว่า” ในฐานะนักศึกษาระดับปริญญาตรี เธอได้รับปริญญาสาขาเศรษฐศาสตร์และการแสดงแซกโซโฟน ก่อนที่จะไปศึกษาต่อในระดับปริญญาเอกสาขาวิทยาการคอมพิวเตอร์ ซึ่งเป็นสาขาที่เธอยังคงรู้สึกเหมือนเป็นคนนอก “มีคนจำนวนมากที่ [คิดว่า] ระบบอัจฉริยะจะมีลักษณะคล้ายกับรหัสคอมพิวเตอร์: เรียบร้อยและสะดวกเหมือนกับระบบอื่นๆ ที่เข้าใจได้ดี” เธอกล่าว “ฉันแค่เชื่อว่าคำตอบนั้นซับซ้อน หากฉันมีวิธีแก้ปัญหาง่ายๆ ฉันค่อนข้างแน่ใจว่ามันผิด และฉันไม่ต้องการที่จะผิด”

การเผชิญหน้ากับนักวิทยาศาสตร์คอมพิวเตอร์โดยบังเอิญซึ่งบังเอิญทำงานด้านการประมวลผลภาษาธรรมชาติทำให้ Pavlick เริ่มต้นการทำงานระดับปริญญาเอกของเธอเพื่อศึกษาว่าคอมพิวเตอร์สามารถเข้ารหัสความหมายหรือความหมายในภาษาได้อย่างไร “ฉันคิดว่ามันทำให้เกิดอาการคัน” เธอกล่าว “มันเข้ากับปรัชญา และมันเข้ากับหลาย ๆ อย่างที่ผมกำลังทำอยู่” ในปัจจุบัน งานวิจัยหลักประการหนึ่งของ Pavlick มุ่งเน้นไปที่ "การต่อสายดิน" ซึ่งเป็นคำถามที่ว่าความหมายของคำนั้นขึ้นอยู่กับสิ่งต่าง ๆ ที่มีอยู่โดยไม่ขึ้นอยู่กับภาษาหรือไม่ เช่น การรับรู้ทางประสาทสัมผัส ปฏิสัมพันธ์ทางสังคม หรือแม้แต่ความคิดอื่น ๆ โมเดลภาษาได้รับการฝึกฝนโดยใช้ข้อความทั้งหมด ดังนั้นจึงเป็นแพลตฟอร์มที่มีประโยชน์สำหรับการสำรวจว่าพื้นฐานสำคัญต่อความหมายอย่างไร แต่คำถามนี้ทำให้นักภาษาศาสตร์และนักคิดคนอื่น ๆ หมกมุ่นมานานหลายทศวรรษ

“สิ่งเหล่านี้ไม่ได้เป็นเพียงปัญหา 'ทางเทคนิค' เท่านั้น” พาฟลิคกล่าว “ภาษามีขนาดใหญ่มาก สำหรับฉันแล้ว มันรู้สึกเหมือนว่ามันครอบคลุมทุกสิ่ง”

ควอนตั้ม พูดคุยกับ Pavlick เกี่ยวกับการสร้างวิทยาศาสตร์จากปรัชญา ความหมายของ "ความหมาย" และความสำคัญของผลลัพธ์ที่ไม่เซ็กซี่ บทสัมภาษณ์ได้รับการย่อและเรียบเรียงเพื่อความชัดเจน

บทนำ

“ความเข้าใจ” หรือ “ความหมาย” ในเชิงประจักษ์หมายถึงอะไร? คุณมองหาอะไรโดยเฉพาะ?

ตอนที่ฉันเริ่มโครงการวิจัยที่ Brown เราตัดสินใจว่าความหมายเกี่ยวข้องกับแนวคิดในทางใดทางหนึ่ง ฉันรู้ว่านี่เป็นข้อผูกมัดทางทฤษฎีที่ไม่ใช่ทุกคนทำ แต่ดูเหมือนว่าจะเป็นไปตามสัญชาตญาณ หากคุณใช้คำว่า "apple" เพื่อหมายถึงแอปเปิ้ล คุณต้องมีแนวคิดของแอปเปิ้ล นั่นจะต้องเป็นสิ่งที่ไม่ว่าคุณจะใช้คำเพื่ออ้างถึงมันหรือไม่ก็ตาม นั่นคือสิ่งที่หมายถึง "มีความหมาย": ต้องมีแนวคิด ซึ่งเป็นสิ่งที่คุณกำลังพูด

ฉันต้องการค้นหาแนวคิดในแบบจำลอง ฉันต้องการบางสิ่งบางอย่างที่ฉันสามารถคว้าไว้ในโครงข่ายประสาทเทียม ซึ่งเป็นหลักฐานว่ามีสิ่งที่เป็นตัวแทนของ "แอปเปิ้ล" ภายใน ซึ่งช่วยให้สามารถเรียกสิ่งนั้นด้วยคำเดียวกันได้อย่างสม่ำเสมอ เพราะดูเหมือนว่าจะมีโครงสร้างภายในที่ไม่สุ่มและไร้เหตุผล คุณจะพบฟังก์ชันเล็กๆ น้อยๆ ที่มีการกำหนดไว้อย่างดีซึ่งสามารถทำอะไรบางอย่างได้อย่างน่าเชื่อถือ

ฉันมุ่งเน้นไปที่การกำหนดลักษณะโครงสร้างภายในนี้ มันมีรูปแบบอะไร? มันอาจเป็นเซตย่อยของน้ำหนักภายในโครงข่ายประสาทเทียม หรือการดำเนินการพีชคณิตเชิงเส้นบางประเภทเหนือน้ำหนักเหล่านั้น หรือเป็นนามธรรมทางเรขาคณิตบางประเภท แต่ต้องมีบทบาทเชิงสาเหตุ [ในพฤติกรรมของแบบจำลอง]: มันเชื่อมต่อกับอินพุตเหล่านี้ แต่ไม่ใช่สิ่งเหล่านั้น และเอาต์พุตเหล่านี้ ไม่ใช่สิ่งเหล่านั้น

นั่นให้ความรู้สึกเหมือนเป็นสิ่งที่คุณเริ่มเรียกว่า "ความหมาย" คือการหาวิธีค้นหาโครงสร้างนี้และสร้างความสัมพันธ์ เพื่อว่าเมื่อเราได้ทุกอย่างเข้าที่แล้ว เราก็สามารถนำมันไปใช้กับคำถามอย่างเช่น “มันรู้ไหมว่า 'แอปเปิ้ล' หมายถึงอะไร”

คุณพบตัวอย่างโครงสร้างนี้หรือไม่?

ใช่หนึ่ง ผล เกี่ยวข้องกับเมื่อโมเดลภาษาดึงข้อมูลชิ้นส่วน หากคุณถามโมเดลว่า "เมืองหลวงของฝรั่งเศสคืออะไร" จะต้องตอบว่า "ปารีส" และ "เมืองหลวงของโปแลนด์คืออะไร" ควรส่งคืน "วอร์ซอ" มันสามารถจดจำคำตอบเหล่านี้ทั้งหมดได้อย่างง่ายดาย และอาจกระจัดกระจายไปทั่ว [ภายในแบบจำลอง] ไม่มีเหตุผลที่แท้จริงที่จะต้องมีความเชื่อมโยงระหว่างสิ่งเหล่านั้น

แต่เรากลับพบสถานที่เล็กๆ ในโมเดล โดยพื้นฐานแล้วมันจะรวมการเชื่อมต่อนั้นให้เป็นเวกเตอร์เล็กๆ ตัวเดียว หากคุณเพิ่มลงใน "เมืองหลวงของฝรั่งเศสคืออะไร" ระบบจะดึงข้อมูล "ปารีส" และเวกเตอร์เดียวกันนั้น หากคุณถามว่า "เมืองหลวงของโปแลนด์คืออะไร" ก็จะเรียกข้อมูล "วอร์ซอ" มันเหมือนกับเวกเตอร์ "ดึงเมืองหลวง" ที่เป็นระบบนี้

นั่นเป็นการค้นพบที่น่าตื่นเต้นมาก เพราะดูเหมือนว่า [แบบจำลองนี้] กำลังต้มแนวคิดเล็กๆ น้อยๆ เหล่านี้ จากนั้นจึงนำอัลกอริธึมทั่วไปมาใช้กับพวกมัน แม้ว่าเราจะดูคำถาม [ง่ายๆ] เหล่านี้จริงๆ แต่ก็เป็นการค้นหาหลักฐานของวัตถุดิบเหล่านี้ที่แบบจำลองใช้อยู่ ในกรณีนี้ การหลีกหนีจากการท่องจำจะง่ายกว่า — ในหลาย ๆ ด้าน นั่นคือสิ่งที่เครือข่ายเหล่านี้ได้รับการออกแบบมาให้ทำ แต่จะแยก [ข้อมูล] ออกเป็นชิ้น ๆ และ "เหตุผล" เกี่ยวกับข้อมูลนั้น และเราหวังว่าเมื่อเราออกแบบการทดลองที่ดีขึ้น เราอาจพบสิ่งที่คล้ายกันสำหรับแนวคิดประเภทที่ซับซ้อนมากขึ้น

บทนำ

การต่อลงดินเกี่ยวข้องกับการเป็นตัวแทนเหล่านี้อย่างไร

วิธีที่มนุษย์เรียนรู้ภาษามีพื้นฐานมาจากข้อมูลที่ไม่ใช่ภาษาศาสตร์มากมาย ไม่ว่าจะเป็นความรู้สึกทางร่างกาย อารมณ์ ไม่ว่าคุณจะหิว หรืออะไรก็ตาม นั่นถือว่ามีความสำคัญอย่างยิ่งต่อความหมาย

แต่มีแนวคิดอื่นๆ เกี่ยวกับการลงดินซึ่งเกี่ยวข้องกับการเป็นตัวแทนภายในมากกว่า มีคำบางคำที่ไม่ได้เชื่อมโยงกับโลกทางกายภาพอย่างชัดเจน แต่ก็ยังมีความหมาย คำเช่น "ประชาธิปไตย" เป็นตัวอย่างที่ชื่นชอบ มันเป็นสิ่งที่อยู่ในหัวของคุณ: ฉันสามารถคิดถึงประชาธิปไตยได้โดยไม่ต้องพูดถึงมัน ดังนั้นพื้นฐานอาจมาจากภาษาไปสู่สิ่งนั้น การเป็นตัวแทนภายใน

แต่คุณโต้แย้งว่าแม้แต่สิ่งที่อยู่ภายนอกมากกว่า เช่น สี ก็อาจยังคงยึดติดกับการนำเสนอ "แนวความคิด" ภายใน โดยไม่ต้องอาศัยการรับรู้ มันจะทำงานอย่างไร?

โมเดลภาษาไม่มีตาใช่ไหม? มันไม่ “รู้” อะไรเกี่ยวกับสีเลย ดังนั้นบางที [มันจับ] บางสิ่งบางอย่างที่กว้างกว่านั้น เช่น การทำความเข้าใจความสัมพันธ์ระหว่างสิ่งเหล่านั้น ฉันรู้ว่าเมื่อฉันรวมสีน้ำเงินและสีแดงเข้าด้วยกัน ฉันจะได้สีม่วง ความสัมพันธ์เหล่านั้นสามารถกำหนดโครงสร้างภายใน [สายดิน] ได้

เราสามารถยกตัวอย่างสีให้กับ LLM ได้โดยใช้รหัส RGB [สตริงตัวเลขที่แสดงถึงสี] หากคุณพูดว่า "ตกลง นี่คือสีแดง" และให้รหัส RGB เป็นสีแดง และ "นี่คือสีน้ำเงิน" และให้รหัส RGB เป็นสีน้ำเงิน จากนั้นพูดว่า "บอกฉันว่าสีม่วงคืออะไร" ควรสร้างโค้ด RGB สำหรับ สีม่วง. การแมปนี้ควรเป็นตัวบ่งชี้ที่ดีว่าโครงสร้างภายในของแบบจำลองนั้นมีเสียง — ไม่มีการรับรู้ [สำหรับสี] แต่มีโครงสร้างแนวคิดอยู่ที่นั่น

สิ่งที่ยุ่งยากคือ [แบบจำลอง] สามารถจดจำรหัส RGB ซึ่งอยู่ทั่วข้อมูลการฝึกได้ ดังนั้นเราจึง "หมุนเวียน" สีทั้งหมด [ออกจากค่า RGB จริง]: เราจะบอก LLM ว่าคำว่า "สีเหลือง" มีความเกี่ยวข้องกับรหัส RGB สำหรับสีเขียว และอื่นๆ โมเดลทำงานได้ดี: เมื่อคุณขอสีเขียว มันจะให้รหัส RGB เวอร์ชันที่หมุนแก่คุณ นั่นแสดงให้เห็นว่ามีความสอดคล้องบางอย่างในการแสดงสีภายใน เป็นการใช้ความรู้เกี่ยวกับความสัมพันธ์ของพวกเขา ไม่ใช่แค่การท่องจำ

นั่นคือจุดรวมของการต่อสายดิน การแมปชื่อลงบนสีนั้นเป็นไปตามอำเภอใจ มันเกี่ยวกับความสัมพันธ์ระหว่างพวกเขามากกว่า นั่นมันน่าตื่นเต้นมาก

บทนำ

คำถามที่ฟังดูเป็นเชิงปรัชญาเหล่านี้สามารถเป็นวิทยาศาสตร์ได้อย่างไร?

ฉันเพิ่งได้เรียนรู้เกี่ยวกับการทดลองทางความคิด: จะเกิดอะไรขึ้นถ้ามหาสมุทรพัดขึ้นไปบนพื้นทรายและ (เมื่อมัน) ถอยกลับ ลวดลายต่างๆ ก็ทำให้เกิดบทกวีขึ้นมา บทกวีมีความหมายหรือไม่? นั่นดูเป็นนามธรรมสุดๆ และคุณสามารถถกเถียงกันในเชิงปรัชญาที่ยาวนานได้

ข้อดีของโมเดลภาษาคือเราไม่จำเป็นต้องมีการทดลองทางความคิด ไม่ใช่ว่า “ในทางทฤษฎี สิ่งเช่นนั้นจะฉลาดหรือไม่?” เป็นเพียง: สิ่งนี้ฉลาดหรือไม่? มันกลายเป็นวิทยาศาสตร์และเชิงประจักษ์

บางครั้งผู้คนก็เพิกเฉย นั่นคือ “นกแก้วสุ่ม" เข้าใกล้. ฉันคิดว่ามัน [มาจาก] ความกลัวว่าผู้คนจะสมัครใช้สติปัญญามากเกินไปกับสิ่งเหล่านี้ - ซึ่งเราเห็นอยู่ และเพื่อแก้ไขสิ่งนั้น ผู้คนก็แบบว่า "ไม่ มันเป็นเรื่องหลอกลวง นี่คือควันและกระจก”

มันเป็นเรื่องเสียหายเล็กน้อย เราได้ค้นพบสิ่งที่น่าตื่นเต้นและค่อนข้างใหม่ และมันก็คุ้มค่าที่จะเข้าใจมันอย่างลึกซึ้ง นั่นเป็นโอกาสสำคัญที่ไม่ควรมองข้ามเพราะเรากังวลเกี่ยวกับการตีความโมเดลมากเกินไป

แน่นอนคุณ'ได้ผลิตด้วย การวิจัย หักล้างการตีความมากเกินไปแบบนั้น

งานนั้นซึ่งผู้คนค้นพบ "ฮิวริสติกแบบตื้น" ทั้งหมดที่แบบจำลองใช้ประโยชน์ [เพื่อเลียนแบบความเข้าใจ] ซึ่งเป็นรากฐานที่สำคัญมากสำหรับการเข้าสู่วัยผู้ใหญ่ของฉันในฐานะนักวิทยาศาสตร์ แต่มันซับซ้อน เหมือนอย่าประกาศชัยชนะเร็วเกินไป มีความสงสัยหรือหวาดระแวงเล็กน้อย [ในตัวฉัน] ว่าการประเมินทำถูกต้อง แม้กระทั่งการประเมินที่ฉันรู้ว่าฉันออกแบบมาอย่างระมัดระวังมาก!

นั่นเป็นส่วนหนึ่งของมัน: การไม่อ้างสิทธิ์มากเกินไป อีกส่วนหนึ่งก็คือ ถ้าคุณจัดการกับระบบ [โมเดลภาษา] เหล่านี้ คุณจะรู้ว่าระบบเหล่านั้นไม่ใช่ระดับมนุษย์ — วิธีที่พวกมันแก้ไขสิ่งต่าง ๆ ไม่ได้ฉลาดเท่าที่ควร

บทนำ

เมื่อมีวิธีการและเงื่อนไขพื้นฐานมากมายสำหรับการอภิปรายในสาขานี้ คุณจะวัดความสำเร็จได้อย่างไร

สิ่งที่ฉันคิดว่าเรากำลังมองหาในฐานะนักวิทยาศาสตร์ คือคำอธิบายที่แม่นยำและเข้าใจได้ของมนุษย์เกี่ยวกับสิ่งที่เราสนใจ ซึ่งในกรณีนี้คือความฉลาด จากนั้นเราก็แนบคำเพื่อช่วยให้เราไปที่นั่น เราต้องการคำศัพท์ในการทำงานบางอย่าง

แต่นั่นก็ยาก เพราะเมื่อนั้นคุณก็จะเข้าสู่การต่อสู้แห่งความหมายได้ เมื่อมีคนพูดว่า “มันมีความหมาย ใช่ หรือ ไม่ใช่?” ฉันไม่รู้. เรากำลังกำหนดเส้นทางการสนทนาผิดไป

สิ่งที่ฉันพยายามนำเสนอคือการอธิบายพฤติกรรมที่เราใส่ใจในการอธิบายอย่างชัดเจน และ ณ จุดนั้นก็ยังมีข้อสงสัยอยู่ว่าคุณต้องการเรียกมันว่า "ความหมาย" หรือ "การเป็นตัวแทน" หรือคำใด ๆ ที่โหลดเหล่านี้ ประเด็นก็คือ มีทฤษฎีหรือแบบจำลองที่นำเสนออยู่บนโต๊ะ มาประเมินกันดีกว่า

บทนำ

แล้วการวิจัยเกี่ยวกับแบบจำลองภาษาจะก้าวไปสู่แนวทางที่ตรงมากขึ้นได้อย่างไร

คำถามเชิงลึกประเภทต่างๆ ที่ฉันอยากจะตอบจริงๆ — อะไรคือองค์ประกอบสำคัญของความฉลาด? ความฉลาดของมนุษย์มีลักษณะอย่างไร? Model Intelligence มีลักษณะอย่างไร? — มีความสำคัญจริงๆ แต่ผมคิดว่าสิ่งที่จะต้องเกิดขึ้นในอีก 10 ปีข้างหน้าไม่ใช่เรื่องเซ็กซี่มากนัก

หากเราต้องการจัดการกับการนำเสนอ [ภายใน] เหล่านี้ เราจำเป็นต้องมีวิธีการในการค้นหาพวกมัน — วิธีการที่ถูกต้องตามหลักวิทยาศาสตร์ หากทำด้วยวิธีที่ถูกต้อง ระเบียบวิธีแบบละเอียดยิบระดับต่ำนี้จะไม่พาดหัวข่าว แต่นั่นคือสิ่งที่สำคัญจริงๆ ที่จะช่วยให้เราตอบคำถามเชิงลึกเหล่านี้ได้อย่างถูกต้อง

ในขณะเดียวกันโมเดลก็จะเปลี่ยนแปลงไปเรื่อย ๆ จะมีสิ่งต่างๆ มากมายที่ผู้คนจะเผยแพร่ต่อไปราวกับว่าเป็น "ความก้าวหน้า" แต่อาจจะไม่เป็นเช่นนั้น ในใจของฉันรู้สึกว่าเร็วเกินไปที่จะได้รับการพัฒนาครั้งใหญ่

ผู้คนกำลังศึกษางานง่ายๆ เหล่านี้ เช่น ขอให้ [แบบจำลองภาษาทำให้สมบูรณ์] “จอห์นให้เครื่องดื่มแก่ _______” และพยายามดูว่ามันพูดว่า “จอห์น” หรือ “แมรี่” นั่นไม่มีความรู้สึกถึงผลลัพธ์ที่อธิบายความฉลาดได้ แต่ฉันเชื่อจริงๆ ว่าเครื่องมือที่เราใช้ อธิบายปัญหาน่าเบื่อๆ นี้ จำเป็นสำหรับการตอบคำถามเชิงลึกเกี่ยวกับความฉลาด

จุด_img

ข่าวกรองล่าสุด

จุด_img

แชทกับเรา

สวัสดี! ฉันจะช่วยคุณได้อย่างไร?