แนวทางปฏิบัติที่ดีที่สุดในการสร้างแอปพลิเคชัน AI เชิงสร้างสรรค์บน AWS | Amazon Web Services

กำเนิด AI แอปพลิเคชันที่ขับเคลื่อนโดยโมเดลพื้นฐาน (FM) ช่วยให้องค์กรมีมูลค่าทางธุรกิจที่สำคัญในด้านประสบการณ์ของลูกค้า ผลผลิต การเพิ่มประสิทธิภาพกระบวนการ และนวัตกรรม อย่างไรก็ตาม การนำ FM เหล่านี้ไปใช้เกี่ยวข้องกับการจัดการกับความท้าทายที่สำคัญบางประการ รวมถึงผลลัพธ์ที่มีคุณภาพ ความเป็นส่วนตัวของข้อมูล ความปลอดภัย การบูรณาการกับข้อมูลองค์กร ต้นทุน และทักษะในการส่งมอบ

ในโพสต์นี้ เราจะสำรวจแนวทางต่างๆ ที่คุณสามารถทำได้เมื่อสร้างแอปพลิเคชันที่ใช้ AI เชิงสร้างสรรค์ ด้วยความก้าวหน้าอย่างรวดเร็วของ FM จึงเป็นเวลาที่น่าตื่นเต้นในการควบคุมพลังของพวกเขา แต่ยังเป็นสิ่งสำคัญที่จะต้องเข้าใจวิธีใช้พลังเหล่านั้นอย่างเหมาะสมเพื่อให้บรรลุผลลัพธ์ทางธุรกิจ เรานำเสนอภาพรวมของแนวทาง Generative AI ที่สำคัญ รวมถึงวิศวกรรมที่รวดเร็ว การเรียกข้อมูล Augmented Generation (RAG) และการปรับแต่งโมเดล เมื่อนำแนวทางเหล่านี้ไปใช้ เราจะหารือเกี่ยวกับข้อควรพิจารณาที่สำคัญเกี่ยวกับอาการประสาทหลอนที่อาจเกิดขึ้น การผสานรวมกับข้อมูลองค์กร คุณภาพผลผลิต และต้นทุน ในตอนท้าย คุณจะมีแนวทางที่ชัดเจนและผังงานที่เป็นประโยชน์ในการกำหนดวิธีที่ดีที่สุดในการพัฒนาแอปพลิเคชันที่ขับเคลื่อนด้วย FM ของคุณเอง โดยมีพื้นฐานมาจากตัวอย่างในชีวิตจริง ไม่ว่าจะสร้างแชทบอทหรือเครื่องมือสรุป คุณสามารถปรับแต่ง FM อันทรงพลังให้เหมาะกับความต้องการของคุณได้

AI สร้างสรรค์ด้วย AWS

การเกิดขึ้นของ FMs กำลังสร้างทั้งโอกาสและความท้าทายสำหรับองค์กรที่ต้องการใช้เทคโนโลยีเหล่านี้ ความท้าทายที่สำคัญคือการรับรองว่าผลลัพธ์มีคุณภาพสูงและสอดคล้องกันซึ่งสอดคล้องกับความต้องการทางธุรกิจ แทนที่จะเป็นภาพหลอนหรือข้อมูลเท็จ องค์กรยังต้องจัดการความเป็นส่วนตัวของข้อมูลและความเสี่ยงด้านความปลอดภัยที่เกิดขึ้นจากการประมวลผลข้อมูลที่เป็นกรรมสิทธิ์กับ FM อย่างระมัดระวัง ทักษะที่จำเป็นในการบูรณาการ ปรับแต่ง และตรวจสอบความถูกต้องของ FM ภายในระบบและข้อมูลที่มีอยู่นั้นขาดแคลน การสร้างโมเดลภาษาขนาดใหญ่ (LLM) ตั้งแต่เริ่มต้นหรือปรับแต่งโมเดลที่ได้รับการฝึกอบรมล่วงหน้านั้นต้องใช้ทรัพยากรการประมวลผลจำนวนมาก นักวิทยาศาสตร์ข้อมูลผู้เชี่ยวชาญ และงานด้านวิศวกรรมเป็นเวลาหลายเดือน ค่าใช้จ่ายในการคำนวณเพียงอย่างเดียวสามารถสร้างรายได้นับล้านได้อย่างง่ายดายเพื่อฝึกฝนโมเดลที่มีพารามิเตอร์หลายแสนล้านชุดบนชุดข้อมูลขนาดใหญ่ที่ใช้ GPU หรือ TPU หลายพันตัว นอกเหนือจากฮาร์ดแวร์แล้ว การล้างข้อมูลและการประมวลผล การออกแบบสถาปัตยกรรมโมเดล การปรับไฮเปอร์พารามิเตอร์ และการพัฒนาไปป์ไลน์การฝึกอบรม ยังต้องการทักษะการเรียนรู้ของเครื่องเฉพาะทาง (ML) กระบวนการตั้งแต่ต้นจนจบมีความซับซ้อน ใช้เวลานาน และมีราคาแพงมากสำหรับองค์กรส่วนใหญ่ที่ไม่มีโครงสร้างพื้นฐานที่จำเป็นและการลงทุนด้านผู้มีความสามารถ องค์กรที่ไม่สามารถจัดการกับความเสี่ยงเหล่านี้ได้อย่างเพียงพออาจเผชิญกับผลกระทบด้านลบต่อชื่อเสียงของแบรนด์ ความไว้วางใจของลูกค้า การดำเนินงาน และรายได้

อเมซอน เบดร็อค เป็นบริการที่มีการจัดการเต็มรูปแบบซึ่งเสนอตัวเลือกโมเดลพื้นฐานประสิทธิภาพสูง (FM) จากบริษัท AI ชั้นนำ เช่น AI21 Labs, Anthropic, Cohere, Meta, Mistral AI, Stability AI และ Amazon ผ่าน API เดียว ด้วยประสบการณ์แบบไร้เซิร์ฟเวอร์ของ Amazon Bedrock คุณสามารถเริ่มต้นได้อย่างรวดเร็ว ปรับแต่ง FM แบบส่วนตัวด้วยข้อมูลของคุณเอง และผสานรวมและปรับใช้ลงในแอปพลิเคชันของคุณโดยใช้เครื่องมือ AWS โดยไม่ต้องจัดการโครงสร้างพื้นฐานใดๆ Amazon Bedrock มีสิทธิ์ HIPAA และคุณสามารถใช้ Amazon Bedrock ได้ตาม GDPR ด้วย Amazon Bedrock เนื้อหาของคุณจะไม่ถูกนำไปใช้เพื่อปรับปรุงโมเดลพื้นฐานและจะไม่แชร์กับผู้ให้บริการโมเดลบุคคลที่สาม ข้อมูลของคุณใน Amazon Bedrock จะถูกเข้ารหัสเสมอทั้งระหว่างการส่งผ่านและขณะพัก และคุณสามารถเลือกเข้ารหัสทรัพยากรโดยใช้คีย์ของคุณเองได้ คุณสามารถใช้ได้ AWS PrivateLink ด้วย Amazon Bedrock เพื่อสร้างการเชื่อมต่อส่วนตัวระหว่าง FM และ VPC ของคุณโดยไม่เปิดเผยการรับส่งข้อมูลไปยังอินเทอร์เน็ต กับ ฐานความรู้สำหรับ Amazon Bedrockคุณสามารถให้ข้อมูลเชิงบริบทแก่ FM และตัวแทนจากแหล่งข้อมูลส่วนตัวของบริษัทของคุณสำหรับ RAG เพื่อส่งมอบการตอบสนองที่เกี่ยวข้อง แม่นยำ และปรับแต่งได้มากขึ้น คุณสามารถปรับแต่ง FM แบบส่วนตัวด้วยข้อมูลของคุณเองผ่านอินเทอร์เฟซแบบภาพโดยไม่ต้องเขียนโค้ดใดๆ ในฐานะบริการที่มีการจัดการเต็มรูปแบบ Amazon Bedrock มอบประสบการณ์นักพัฒนาที่ตรงไปตรงมาเพื่อทำงานร่วมกับ FM ที่มีประสิทธิภาพสูงที่หลากหลาย

เปิดตัวใน 2017, อเมซอน SageMaker เป็นบริการที่มีการจัดการเต็มรูปแบบซึ่งทำให้สร้าง ฝึกอบรม และปรับใช้โมเดล ML ได้อย่างง่ายดาย ลูกค้าจำนวนมากขึ้นเรื่อยๆ กำลังสร้าง FM ของตนเองโดยใช้ SageMaker รวมถึง Stability AI, AI21 Labs, Hugging Face, Perplexity AI, Hippocratic AI, LG AI Research และ Technology Innovation Institute เพื่อช่วยให้คุณเริ่มต้นได้อย่างรวดเร็ว Amazon SageMaker JumpStart มีฮับ ML ที่คุณสามารถสำรวจ ฝึกฝน และปรับใช้ FM สาธารณะที่มีให้เลือกมากมาย เช่น รุ่น Mistral, รุ่น LightOn, RedPajama, Mosiac MPT-7B, FLAN-T5/UL2, GPT-J-6B/Neox-20B และ Bloom/BloomZ โดยใช้เครื่องมือ SageMaker ที่สร้างขึ้นโดยเฉพาะ เช่น การทดลองและไปป์ไลน์

แนวทาง AI ทั่วไป

ในส่วนนี้ เราจะพูดถึงแนวทางทั่วไปในการใช้โซลูชัน AI เชิงสร้างสรรค์ที่มีประสิทธิภาพ เราสำรวจเทคนิคทางวิศวกรรมที่รวดเร็วยอดนิยมที่ช่วยให้คุณบรรลุงานที่ซับซ้อนและน่าสนใจยิ่งขึ้นด้วย FM นอกจากนี้เรายังอภิปรายว่าเทคนิคต่างๆ เช่น RAG และการปรับแต่งโมเดลจะช่วยเพิ่มขีดความสามารถของ FM และเอาชนะความท้าทายต่างๆ เช่น ข้อมูลที่จำกัดและข้อจำกัดด้านการคำนวณได้อย่างไร ด้วยเทคนิคที่เหมาะสม คุณสามารถสร้างโซลูชัน AI เจนเนอเรชั่นที่ทรงพลังและสร้างผลกระทบได้

วิศวกรรมทันใจ

วิศวกรรมพร้อมท์คือแนวทางปฏิบัติในการออกแบบคำสั่งอย่างระมัดระวังเพื่อใช้ประโยชน์จากความสามารถของ FM ได้อย่างมีประสิทธิภาพ โดยเกี่ยวข้องกับการใช้ข้อความแจ้งซึ่งเป็นข้อความสั้นๆ ที่แนะนำแบบจำลองเพื่อสร้างคำตอบที่แม่นยำและเกี่ยวข้องมากขึ้น ด้วยวิศวกรรมที่รวดเร็ว คุณสามารถปรับปรุงประสิทธิภาพของ FM และทำให้มีประสิทธิภาพมากขึ้นสำหรับการใช้งานที่หลากหลาย ในส่วนนี้ เราจะสำรวจเทคนิคต่างๆ เช่น การกระตุ้นแบบ Zero-shot และแบบไม่กี่ช็อต ซึ่งปรับ FMs อย่างรวดเร็วให้เข้ากับงานใหม่ด้วยตัวอย่างเพียงไม่กี่ตัวอย่าง และการกระตุ้นแบบลูกโซ่แห่งความคิด ซึ่งแบ่งการให้เหตุผลที่ซับซ้อนออกเป็นขั้นตอนระดับกลาง วิธีการเหล่านี้แสดงให้เห็นว่าวิศวกรรมที่รวดเร็วสามารถทำให้ FM มีประสิทธิภาพมากขึ้นในงานที่ซับซ้อนได้อย่างไรโดยไม่ต้องมีการฝึกอบรมแบบจำลองใหม่

การกระตุ้นแบบ Zero-shot

เทคนิคการแจ้งแบบ Zero-shot ต้องการ FM ในการสร้างคำตอบโดยไม่ต้องให้ตัวอย่างที่ชัดเจนของพฤติกรรมที่ต้องการ โดยอาศัยการฝึกอบรมล่วงหน้าเพียงอย่างเดียว ภาพหน้าจอต่อไปนี้แสดงตัวอย่างของพรอมต์ Zero-shot ด้วยโมเดล Anthropic Claude 2.1 บนคอนโซล Amazon Bedrock

ในคำแนะนำเหล่านี้ เราไม่ได้ให้ตัวอย่างใดๆ ไว้ อย่างไรก็ตาม โมเดลสามารถเข้าใจงานและสร้างผลลัพธ์ที่เหมาะสมได้ Zero-shot prompts เป็นเทคนิคการแจ้งที่ตรงไปตรงมาที่สุดในการเริ่มต้นประเมิน FM สำหรับกรณีการใช้งานของคุณ อย่างไรก็ตาม แม้ว่า FM จะโดดเด่นด้วยการแจ้งเตือนแบบ Zero-shot แต่ก็อาจไม่ได้ให้ผลลัพธ์ที่แม่นยำหรือเป็นที่ต้องการเสมอไปสำหรับงานที่ซับซ้อนมากขึ้น เมื่อข้อความเตือนแบบ Zero-shot ขาด ขอแนะนำให้จัดเตรียมตัวอย่างบางส่วนในข้อความแจ้ง (พร้อมท์ไม่กี่ช็อต)

การกระตุ้นเตือนไม่กี่นัด

เทคนิคพรอมต์แบบไม่กี่ช็อตช่วยให้ FM สามารถเรียนรู้ในบริบทจากตัวอย่างในพรอมต์และดำเนินงานได้แม่นยำยิ่งขึ้น ด้วยตัวอย่างเพียงไม่กี่ตัวอย่าง คุณสามารถปรับ FM ให้เข้ากับงานใหม่ได้อย่างรวดเร็วโดยไม่ต้องมีการฝึกอบรมจำนวนมาก และนำทางพวกเขาไปสู่พฤติกรรมที่ต้องการ ต่อไปนี้เป็นตัวอย่างของพรอมต์สั้นๆ ด้วยโมเดล Cohere Command บนคอนโซล Amazon Bedrock

ในตัวอย่างก่อนหน้านี้ FM สามารถระบุเอนทิตีจากข้อความที่ป้อน (บทวิจารณ์) และดึงความรู้สึกที่เกี่ยวข้องออกมา การแจ้งเตือนสั้นๆ เป็นวิธีที่มีประสิทธิภาพในการจัดการกับงานที่ซับซ้อนโดยให้ตัวอย่างคู่อินพุต-เอาท์พุตสองสามตัวอย่าง สำหรับงานที่ไม่ซับซ้อน คุณสามารถยกตัวอย่างได้หนึ่งตัวอย่าง (1 ช็อต) ในขณะที่งานที่ยากกว่าคุณควรยกตัวอย่าง 3 (5 ช็อต) ถึงห้า (XNUMX ช็อต) มินและคณะ (2022) ผลการวิจัยที่ตีพิมพ์เกี่ยวกับการเรียนรู้ในบริบทสามารถเพิ่มประสิทธิภาพของเทคนิคการกระตุ้นเตือนแบบไม่กี่ช็อตได้ คุณสามารถใช้คำแนะนำสั้นๆ สำหรับงานต่างๆ เช่น การวิเคราะห์ความรู้สึก การรับรู้เอนทิตี การตอบคำถาม การแปล และการสร้างโค้ด

การกระตุ้นเตือนแบบลูกโซ่แห่งความคิด

แม้จะมีศักยภาพ แต่การเตือนเพียงไม่กี่ขั้นตอนก็มีข้อจำกัด โดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับงานการให้เหตุผลที่ซับซ้อน (เช่น งานทางคณิตศาสตร์หรืองานเชิงตรรกะ) งานเหล่านี้จำเป็นต้องแบ่งปัญหาออกเป็นขั้นตอนแล้วจึงแก้ไข เหว่ยและคณะ (2022) แนะนำเทคนิคการกระตุ้นลูกโซ่แห่งความคิด (CoT) เพื่อแก้ปัญหาการใช้เหตุผลที่ซับซ้อนผ่านขั้นตอนการให้เหตุผลระดับกลาง คุณสามารถรวม CoT เข้ากับการแจ้งเตือนแบบไม่กี่ช็อตเพื่อปรับปรุงผลลัพธ์ของงานที่ซับซ้อน ต่อไปนี้เป็นตัวอย่างของงานการให้เหตุผลโดยใช้ CoT แบบไม่กี่ช็อตพร้อมท์ด้วยโมเดล Anthropic Claude 2 บนคอนโซล Amazon Bedrock

โคจิมะ และคณะ (2022) แนะนำแนวคิดเรื่อง Zero-Shot CoT โดยใช้ความสามารถ Zero-Shot ที่ยังไม่ได้ใช้ของ FM การวิจัยของพวกเขาระบุว่า Zero-shot CoT ซึ่งใช้เทมเพลตพร้อมท์เดียวเดียวกัน มีประสิทธิภาพเหนือกว่าประสิทธิภาพ Zero-shot FM อย่างมากในงานการให้เหตุผลเกณฑ์มาตรฐานที่หลากหลาย คุณสามารถใช้การพร้อมท์แบบ Zero-shot CoT สำหรับงานการให้เหตุผลง่ายๆ โดยเพิ่ม "มาคิดทีละขั้นตอน" ลงในพร้อมท์ต้นฉบับ

เกิดปฏิกิริยา

การแจ้งเตือน CoT สามารถเพิ่มความสามารถในการให้เหตุผลของ FM ได้ แต่ก็ยังขึ้นอยู่กับความรู้ภายในของโมเดล และไม่พิจารณาฐานความรู้หรือสภาพแวดล้อมภายนอกใดๆ เพื่อรวบรวมข้อมูลเพิ่มเติม ซึ่งอาจนำไปสู่ปัญหาต่างๆ เช่น อาการประสาทหลอน วิธีการ ReAct (การใช้เหตุผลและการดำเนินการ) จัดการกับช่องว่างนี้โดยการขยาย CoT และอนุญาตให้ใช้เหตุผลแบบไดนามิกโดยใช้สภาพแวดล้อมภายนอก (เช่น Wikipedia)

บูรณาการ

FM มีความสามารถในการเข้าใจคำถามและให้คำตอบโดยใช้ความรู้ที่ได้รับการฝึกอบรมมาล่วงหน้า อย่างไรก็ตาม พวกเขาขาดความสามารถในการตอบสนองต่อข้อซักถามที่ต้องการเข้าถึงข้อมูลส่วนตัวขององค์กรหรือความสามารถในการดำเนินงานโดยอัตโนมัติ RAG และตัวแทนเป็นวิธีการเชื่อมต่อแอปพลิเคชันที่ขับเคลื่อนด้วย AI เหล่านี้กับชุดข้อมูลระดับองค์กร ช่วยให้แอปพลิเคชันเหล่านี้สามารถให้การตอบสนองที่คำนึงถึงข้อมูลขององค์กรและเปิดใช้งานการดำเนินการตามคำขอได้

การดึงข้อมูล Augmented Generation

การดึงข้อมูล Augmented Generation (RAG) ช่วยให้คุณสามารถปรับแต่งการตอบสนองของโมเดลได้ เมื่อคุณต้องการให้โมเดลพิจารณาความรู้ใหม่หรือข้อมูลที่ทันสมัย เมื่อข้อมูลของคุณเปลี่ยนแปลงบ่อยครั้ง เช่น สินค้าคงคลังหรือราคา การปรับแต่งและอัปเดตโมเดลในขณะที่กำลังให้บริการคำค้นหาของผู้ใช้นั้นไม่สามารถทำได้ เพื่อให้ FM มีข้อมูลที่เป็นกรรมสิทธิ์ที่ทันสมัย องค์กรต่างๆ หันมาใช้ RAG ซึ่งเป็นเทคนิคที่เกี่ยวข้องกับการดึงข้อมูลจากแหล่งข้อมูลของบริษัท และเพิ่มคุณค่าให้กับข้อมูลนั้นเพื่อให้การตอบสนองที่เกี่ยวข้องและแม่นยำยิ่งขึ้น

มีกรณีการใช้งานหลายประการที่ RAG สามารถช่วยปรับปรุงประสิทธิภาพ FM:

ตอบคำถาม – โมเดล RAG ช่วยให้แอปพลิเคชันตอบคำถามค้นหาและบูรณาการข้อมูลจากเอกสารหรือแหล่งความรู้เพื่อสร้างคำตอบคุณภาพสูง ตัวอย่างเช่น แอปพลิเคชันตอบคำถามสามารถดึงข้อความเกี่ยวกับหัวข้อหนึ่งๆ ก่อนที่จะสร้างคำตอบแบบสรุป
Chatbots และตัวแทนการสนทนา – RAG อนุญาตให้แชทบอทเข้าถึงข้อมูลที่เกี่ยวข้องจากแหล่งความรู้ภายนอกขนาดใหญ่ สิ่งนี้ทำให้การตอบกลับของแชทบอทมีความรู้และเป็นธรรมชาติมากขึ้น
ความช่วยเหลือด้านการเขียน – RAG สามารถแนะนำเนื้อหา ข้อเท็จจริง และประเด็นพูดคุยที่เกี่ยวข้อง เพื่อช่วยให้คุณเขียนเอกสาร เช่น บทความ รายงาน และอีเมลได้อย่างมีประสิทธิภาพมากขึ้น ข้อมูลที่ดึงมาจะให้บริบทและแนวคิดที่เป็นประโยชน์
สรุป – RAG สามารถค้นหาเอกสารต้นฉบับ ข้อความ หรือข้อเท็จจริงที่เกี่ยวข้อง เพื่อเพิ่มความเข้าใจในหัวข้อของโมเดลการสรุป ซึ่งช่วยให้สร้างสรุปได้ดีขึ้น
การเขียนเชิงสร้างสรรค์และการเล่าเรื่อง – RAG สามารถดึงแนวคิดโครงเรื่อง ตัวละคร ฉาก และองค์ประกอบสร้างสรรค์จากเรื่องราวที่มีอยู่เพื่อสร้างแรงบันดาลใจให้กับโมเดลการสร้างเรื่องราวของ AI สิ่งนี้ทำให้เอาต์พุตน่าสนใจและมีเหตุผลมากขึ้น
การแปลภาษา – RAG สามารถค้นหาตัวอย่างวิธีการแปลวลีบางภาษาระหว่างภาษาต่างๆ ซึ่งจะให้บริบทแก่โมเดลการแปล ซึ่งช่วยปรับปรุงการแปลวลีที่คลุมเครือ
กำหนดค่าส่วนบุคคล – ในแชทบอทและแอปพลิเคชันแนะนำ RAG สามารถดึงบริบทส่วนบุคคล เช่น การสนทนาในอดีต ข้อมูลโปรไฟล์ และการตั้งค่า เพื่อให้การตอบกลับเป็นส่วนตัวและเกี่ยวข้องมากขึ้น

มีข้อดีหลายประการในการใช้เฟรมเวิร์ก RAG:

ภาพหลอนลดลง – การดึงข้อมูลที่เกี่ยวข้องช่วยให้ข้อความที่สร้างขึ้นเป็นข้อเท็จจริงและความรู้ในโลกแห่งความเป็นจริง แทนที่จะเป็นข้อความหลอนประสาท สิ่งนี้ส่งเสริมการตอบกลับที่แม่นยำ เป็นข้อเท็จจริง และน่าเชื่อถือมากขึ้น
คุ้มครอง – การดึงข้อมูลช่วยให้ FM ครอบคลุมหัวข้อและสถานการณ์ที่หลากหลายนอกเหนือจากข้อมูลการฝึกอบรมโดยการดึงข้อมูลภายนอก ซึ่งจะช่วยแก้ไขปัญหาความครอบคลุมที่จำกัด
อย่างมีประสิทธิภาพ – การดึงข้อมูลช่วยให้โมเดลมุ่งเน้นไปที่การสร้างข้อมูลที่เกี่ยวข้องมากที่สุด แทนที่จะสร้างทุกอย่างตั้งแต่เริ่มต้น สิ่งนี้ช่วยปรับปรุงประสิทธิภาพและช่วยให้สามารถใช้บริบทที่ใหญ่ขึ้นได้
ความปลอดภัย – การดึงข้อมูลจากแหล่งข้อมูลที่จำเป็นและได้รับอนุญาตสามารถปรับปรุงการกำกับดูแลและการควบคุมการสร้างเนื้อหาที่เป็นอันตรายและไม่ถูกต้องได้ สิ่งนี้สนับสนุนการยอมรับที่ปลอดภัยยิ่งขึ้น
scalability – การจัดทำดัชนีและการดึงข้อมูลจากคลังข้อมูลขนาดใหญ่ช่วยให้แนวทางขยายขนาดได้ดีขึ้น เมื่อเทียบกับการใช้คลังข้อมูลเต็มรูปแบบระหว่างการสร้าง สิ่งนี้ทำให้คุณสามารถปรับใช้ FM ในสภาพแวดล้อมที่มีทรัพยากรจำกัดมากขึ้น

RAG ให้ผลลัพธ์ที่มีคุณภาพ เนื่องจากการเพิ่มบริบทการใช้งานเฉพาะกรณีโดยตรงจากที่เก็บข้อมูลแบบเวกเตอร์ เมื่อเปรียบเทียบกับวิศวกรรมที่ทันท่วงที มันให้ผลลัพธ์ที่ดีขึ้นอย่างมากโดยมีโอกาสเกิดอาการประสาทหลอนน้อยมาก คุณสามารถสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย RAG บนข้อมูลองค์กรของคุณโดยใช้ อเมซอน เคนดรา- RAG มีความซับซ้อนสูงกว่าวิศวกรรมที่รวดเร็ว เนื่องจากคุณต้องมีทักษะการเขียนโค้ดและสถาปัตยกรรมเพื่อใช้โซลูชันนี้ อย่างไรก็ตาม ฐานความรู้สำหรับ Amazon Bedrock มอบประสบการณ์ RAG ที่มีการจัดการเต็มรูปแบบและวิธีที่ตรงไปตรงมาที่สุดในการเริ่มต้นใช้งาน RAG ใน Amazon Bedrock ฐานความรู้สำหรับ Amazon Bedrock ทำให้เวิร์กโฟลว์ RAG แบบ end-to-end เป็นแบบอัตโนมัติ รวมถึงการนำเข้า การดึงข้อมูล และการเพิ่มทันที ทำให้คุณไม่จำเป็นต้องเขียนโค้ดแบบกำหนดเองเพื่อผสานรวมแหล่งข้อมูลและจัดการการสืบค้น มีการจัดการบริบทเซสชันในตัวเพื่อให้แอปของคุณสามารถรองรับการสนทนาแบบหลายรอบได้ คำตอบจากฐานความรู้มาพร้อมกับการอ้างอิงแหล่งที่มาเพื่อปรับปรุงความโปร่งใสและลดอาการประสาทหลอน วิธีที่ตรงไปตรงมาที่สุดในการสร้างผู้ช่วยที่ขับเคลื่อนด้วย generative-AI คือการใช้ อเมซอน คิวซึ่งมีระบบ RAG ในตัว

RAG มีความยืดหยุ่นในระดับสูงสุดเมื่อพูดถึงการเปลี่ยนแปลงทางสถาปัตยกรรม คุณสามารถเปลี่ยนโมเดลการฝัง ที่เก็บเวคเตอร์ และ FM ได้อย่างอิสระโดยมีผลกระทบน้อยที่สุดถึงปานกลางต่อส่วนประกอบอื่นๆ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับแนวทาง RAG ด้วย บริการ Amazon OpenSearch และ Amazon Bedrock โปรดดูที่ สร้างเวิร์กโฟลว์ RAG ที่ปรับขนาดได้และไร้เซิร์ฟเวอร์ด้วยกลไกเวกเตอร์สำหรับโมเดล Amazon OpenSearch Serverless และ Amazon Bedrock Claude- หากต้องการเรียนรู้เกี่ยวกับวิธีการใช้งาน RAG กับ Amazon Kendra โปรดดูที่ ควบคุมพลังของข้อมูลองค์กรด้วย AI เชิงสร้างสรรค์: ข้อมูลเชิงลึกจาก Amazon Kendra, LangChain และโมเดลภาษาขนาดใหญ่.

ตัวแทน

FM สามารถเข้าใจและตอบคำถามตามความรู้ที่ได้รับการฝึกอบรมมาล่วงหน้า อย่างไรก็ตาม พวกเขาไม่สามารถทำงานในชีวิตจริงใดๆ ได้สำเร็จ เช่น การจองเที่ยวบินหรือดำเนินการตามใบสั่งซื้อได้ด้วยตนเอง เนื่องจากงานดังกล่าวต้องการข้อมูลเฉพาะองค์กรและเวิร์กโฟลว์ที่โดยทั่วไปต้องมีการเขียนโปรแกรมแบบกำหนดเอง กรอบเช่น หลังเชน และ FM บางอย่าง เช่น โมเดล Claude มีความสามารถในการเรียกใช้ฟังก์ชันเพื่อโต้ตอบกับ API และเครื่องมือต่างๆ อย่างไรก็ตาม, ตัวแทนของ Amazon Bedrockซึ่งเป็นความสามารถ AI ใหม่ที่ได้รับการจัดการอย่างเต็มรูปแบบจาก AWS มีเป้าหมายเพื่อให้นักพัฒนาสามารถสร้างแอปพลิเคชันโดยใช้ FM รุ่นต่อไปได้ง่ายขึ้น ด้วยการคลิกเพียงไม่กี่ครั้ง ระบบก็สามารถแยกย่อยงานและสร้างตรรกะการเรียบเรียงที่จำเป็นได้โดยอัตโนมัติ โดยไม่จำเป็นต้องเขียนโค้ดด้วยตนเอง เจ้าหน้าที่สามารถเชื่อมต่อกับฐานข้อมูลของบริษัทได้อย่างปลอดภัยผ่าน API นำเข้าและจัดโครงสร้างข้อมูลสำหรับการใช้งานเครื่องจักร และเพิ่มรายละเอียดตามบริบทเพื่อสร้างการตอบสนองที่แม่นยำยิ่งขึ้นและตอบสนองคำขอได้ เนื่องจากจัดการการบูรณาการและโครงสร้างพื้นฐาน Agents สำหรับ Amazon Bedrock จึงช่วยให้คุณสามารถควบคุม AI กำเนิดสำหรับกรณีการใช้งานทางธุรกิจได้อย่างเต็มที่ ตอนนี้นักพัฒนาสามารถมุ่งเน้นไปที่แอปพลิเคชันหลักของตนได้ แทนที่จะมุ่งเน้นไปที่ระบบประปาตามปกติ การประมวลผลข้อมูลอัตโนมัติและการเรียก API ยังช่วยให้ FM สามารถส่งมอบคำตอบที่ได้รับการปรับปรุงและปรับแต่งให้เหมาะสม และดำเนินงานจริงโดยใช้ความรู้ที่เป็นกรรมสิทธิ์

การปรับแต่งโมเดล

โมเดลพื้นฐานมีความสามารถอย่างมากและเปิดใช้งานแอปพลิเคชันที่ยอดเยี่ยมได้ แต่สิ่งที่จะช่วยขับเคลื่อนธุรกิจของคุณคือ AI เชิงสร้างสรรค์ที่รู้ว่าอะไรสำคัญต่อลูกค้า ผลิตภัณฑ์ของคุณ และบริษัทของคุณ และนั่นจะเป็นไปได้ก็ต่อเมื่อคุณเพิ่มพลังให้กับโมเดลด้วยข้อมูลของคุณ ข้อมูลเป็นกุญแจสำคัญในการย้ายจากแอปพลิเคชันทั่วไปไปสู่แอปพลิเคชัน AI ที่สร้างเองซึ่งสร้างมูลค่าที่แท้จริงให้กับลูกค้าและธุรกิจของคุณ

ในส่วนนี้ เราจะพูดถึงเทคนิคต่างๆ และคุณประโยชน์ของการปรับแต่ง FM ของคุณ เราครอบคลุมถึงวิธีที่การปรับแต่งโมเดลเกี่ยวข้องกับการฝึกอบรมเพิ่มเติมและการเปลี่ยนแปลงน้ำหนักของโมเดลเพื่อปรับปรุงประสิทธิภาพ

ปรับจูน

การปรับแต่งอย่างละเอียดเป็นกระบวนการของการรับ FM ที่ได้รับการฝึกอบรมล่วงหน้า เช่น Llama 2 และการฝึกอบรมเพิ่มเติมในงานดาวน์สตรีมด้วยชุดข้อมูลเฉพาะสำหรับงานนั้น โมเดลที่ได้รับการฝึกอบรมล่วงหน้าจะให้ความรู้ทางภาษาทั่วไป และการปรับแต่งอย่างละเอียดทำให้สามารถเชี่ยวชาญและปรับปรุงประสิทธิภาพในงานเฉพาะ เช่น การจัดหมวดหมู่ข้อความ การตอบคำถาม หรือการสร้างข้อความ ด้วยการปรับแต่งอย่างละเอียด คุณจะจัดเตรียมชุดข้อมูลที่มีป้ายกำกับซึ่งมีคำอธิบายประกอบพร้อมบริบทเพิ่มเติม เพื่อฝึกโมเดลในงานที่เฉพาะเจาะจง จากนั้นคุณสามารถปรับพารามิเตอร์โมเดลสำหรับงานเฉพาะตามบริบททางธุรกิจของคุณได้

คุณสามารถใช้การปรับจูนแบบละเอียดบน FM ได้ด้วย Amazon SageMaker JumpStart และอเมซอนเบดร็อค สำหรับรายละเอียดเพิ่มเติม โปรดดูที่ ปรับใช้และปรับแต่งโมเดลพื้นฐานใน Amazon SageMaker JumpStart ด้วยโค้ดสองบรรทัด และ ปรับแต่งโมเดลใน Amazon Bedrock ด้วยข้อมูลของคุณเองโดยใช้การปรับแต่งอย่างละเอียดและการฝึกอบรมล่วงหน้าอย่างต่อเนื่อง.

ฝึกอบรมล่วงหน้าต่อไป

การฝึกอบรมล่วงหน้าอย่างต่อเนื่องใน Amazon Bedrock ช่วยให้คุณสามารถสอนโมเดลที่ผ่านการฝึกอบรมก่อนหน้านี้เกี่ยวกับข้อมูลเพิ่มเติมที่คล้ายกับข้อมูลต้นฉบับได้ ช่วยให้แบบจำลองได้รับความรู้ทางภาษาทั่วไปมากขึ้น แทนที่จะมุ่งเน้นไปที่แอปพลิเคชันเดียว ด้วยการฝึกอบรมล่วงหน้าอย่างต่อเนื่อง คุณสามารถใช้ชุดข้อมูลหรือข้อมูลดิบที่ไม่มีป้ายกำกับ เพื่อปรับปรุงความแม่นยำของโมเดลพื้นฐานสำหรับโดเมนของคุณผ่านการปรับแต่งพารามิเตอร์โมเดล ตัวอย่างเช่น บริษัทด้านการดูแลสุขภาพสามารถฝึกอบรมโมเดลล่วงหน้าต่อไปได้โดยใช้วารสารทางการแพทย์ บทความ และรายงานการวิจัย เพื่อให้มีความรู้มากขึ้นเกี่ยวกับคำศัพท์เฉพาะทางในอุตสาหกรรม สำหรับรายละเอียดเพิ่มเติม โปรดดูที่ ประสบการณ์นักพัฒนา Amazon Bedrock.

ประโยชน์ของการปรับแต่งโมเดล

การปรับแต่งโมเดลมีข้อดีหลายประการ และสามารถช่วยองค์กรได้ดังต่อไปนี้:

การปรับเปลี่ยนเฉพาะโดเมน – คุณสามารถใช้ FM เอนกประสงค์ จากนั้นฝึกเพิ่มเติมเกี่ยวกับข้อมูลจากโดเมนเฉพาะ (เช่น ชีวการแพทย์ กฎหมาย หรือการเงิน) ซึ่งจะปรับโมเดลให้เข้ากับคำศัพท์ สไตล์ และอื่นๆ ของโดเมนนั้น
การปรับแต่งเฉพาะงาน – คุณสามารถใช้ FM ที่ผ่านการฝึกอบรมมาแล้วและปรับแต่งข้อมูลสำหรับงานเฉพาะ (เช่น การวิเคราะห์ความรู้สึก หรือการตอบคำถาม) สิ่งนี้เชี่ยวชาญโมเดลสำหรับงานนั้นโดยเฉพาะ
กำหนดค่าส่วนบุคคล – คุณสามารถปรับแต่ง FM ในข้อมูลของแต่ละบุคคล (อีเมล ข้อความ เอกสารที่พวกเขาเขียน) เพื่อปรับโมเดลให้เข้ากับสไตล์ที่เป็นเอกลักษณ์ของพวกเขา สิ่งนี้สามารถเปิดใช้งานแอปพลิเคชันที่เป็นส่วนตัวมากขึ้น
การปรับแต่งภาษาที่มีทรัพยากรต่ำ – คุณสามารถฝึกเฉพาะชั้นบนสุดของ FM ที่พูดได้หลายภาษาในภาษาที่มีทรัพยากรต่ำเพื่อปรับให้เข้ากับภาษานั้นได้ดียิ่งขึ้น
แก้ไขข้อบกพร่อง – หากพบพฤติกรรมที่ไม่ได้ตั้งใจบางอย่างในโมเดล การปรับแต่งข้อมูลที่เหมาะสมสามารถช่วยอัปเดตโมเดลเพื่อลดข้อบกพร่องเหล่านั้นได้

การปรับแต่งโมเดลช่วยเอาชนะความท้าทายในการนำ FM มาใช้ดังต่อไปนี้:

การปรับตัวให้เข้ากับโดเมนและงานใหม่ – FM ที่ได้รับการฝึกอบรมล่วงหน้าเกี่ยวกับคลังข้อความทั่วไปมักจะต้องได้รับการปรับแต่งข้อมูลเฉพาะงานอย่างละเอียดเพื่อให้ทำงานได้ดีกับแอปพลิเคชันดาวน์สตรีม การปรับแต่งอย่างละเอียดจะปรับโมเดลให้เข้ากับโดเมนใหม่หรืองานที่ไม่เคยมีการฝึกมาก่อน
การเอาชนะอคติ – FM อาจแสดงอคติจากข้อมูลการฝึกอบรมดั้งเดิม การปรับแต่งโมเดลจากข้อมูลใหม่สามารถลดอคติที่ไม่พึงประสงค์ในเอาต์พุตของโมเดลได้
การปรับปรุงประสิทธิภาพการคำนวณ – FM ที่ได้รับการฝึกอบรมล่วงหน้ามักจะมีขนาดใหญ่มากและมีราคาแพงในการคำนวณ การปรับแต่งโมเดลสามารถช่วยลดขนาดโมเดลได้โดยการตัดพารามิเตอร์ที่ไม่สำคัญ ทำให้การปรับใช้เป็นไปได้มากขึ้น
การจัดการกับข้อมูลเป้าหมายที่จำกัด – ในบางกรณี มีข้อมูลในโลกแห่งความเป็นจริงที่จำกัดสำหรับงานเป้าหมาย การปรับแต่งโมเดลใช้ตุ้มน้ำหนักที่ได้รับการฝึกล่วงหน้าซึ่งเรียนรู้จากชุดข้อมูลขนาดใหญ่เพื่อเอาชนะความขาดแคลนข้อมูลนี้
การปรับปรุงประสิทธิภาพของงาน – การปรับแต่งอย่างละเอียดจะช่วยเพิ่มประสิทธิภาพในงานเป้าหมายได้เกือบทุกครั้ง เมื่อเทียบกับการใช้ตุ้มน้ำหนักที่ได้รับการฝึกล่วงหน้าแบบเดิม การปรับโมเดลให้เหมาะสมที่สุดสำหรับการใช้งานตามวัตถุประสงค์นี้ช่วยให้คุณสามารถปรับใช้ FM ในแอปพลิเคชันจริงได้สำเร็จ

การปรับแต่งโมเดลมีความซับซ้อนสูงกว่าวิศวกรรมที่รวดเร็วและ RAG เนื่องจากน้ำหนักและพารามิเตอร์ของโมเดลมีการเปลี่ยนแปลงผ่านสคริปต์การปรับแต่ง ซึ่งต้องใช้วิทยาศาสตร์ข้อมูลและความเชี่ยวชาญด้าน ML อย่างไรก็ตาม Amazon Bedrock ช่วยให้คุณได้รับประสบการณ์ที่มีการจัดการเพื่อปรับแต่งโมเดลต่างๆ ได้อย่างง่ายดาย ปรับจูน or การฝึกอบรมล่วงหน้าอย่างต่อเนื่อง- การปรับแต่งโมเดลให้ผลลัพธ์ที่แม่นยำสูงพร้อมเอาต์พุตคุณภาพที่เทียบเคียงได้กว่า RAG เนื่องจากคุณกำลังอัปเดตน้ำหนักโมเดลในข้อมูลเฉพาะโดเมน โมเดลจึงสร้างการตอบสนองตามบริบทมากขึ้น เมื่อเปรียบเทียบกับ RAG คุณภาพอาจจะดีกว่าเล็กน้อย ขึ้นอยู่กับกรณีการใช้งาน ดังนั้นจึงเป็นเรื่องสำคัญที่ต้องทำการวิเคราะห์การแลกเปลี่ยนระหว่างทั้งสองเทคนิค คุณสามารถใช้ RAG กับโมเดลที่กำหนดเองได้

การอบรมขึ้นใหม่หรือการฝึกอบรมตั้งแต่เริ่มต้น

การสร้างโมเดล AI พื้นฐานของคุณเอง แทนที่จะใช้โมเดลสาธารณะที่ได้รับการฝึกอบรมล่วงหน้าเพียงอย่างเดียว ช่วยให้สามารถควบคุมได้มากขึ้น ปรับปรุงประสิทธิภาพ และปรับแต่งให้เหมาะกับกรณีการใช้งานและข้อมูลเฉพาะขององค์กรของคุณ การลงทุนในการสร้าง FM ที่ได้รับการปรับแต่งสามารถให้ความสามารถในการปรับตัว การอัพเกรด และการควบคุมความสามารถได้ดีขึ้น การฝึกอบรมแบบกระจายช่วยให้สามารถปรับขยายได้ซึ่งจำเป็นในการฝึก FM ขนาดใหญ่มากบนชุดข้อมูลขนาดใหญ่ในเครื่องหลายๆ เครื่อง การทำงานแบบขนานนี้ทำให้โมเดลที่มีพารามิเตอร์นับแสนล้านที่ได้รับการฝึกฝนเกี่ยวกับโทเค็นนับล้านล้านเป็นไปได้ โมเดลขนาดใหญ่มีความสามารถในการเรียนรู้และสรุปข้อมูลได้มากขึ้น

การฝึกอบรมตั้งแต่เริ่มต้นสามารถสร้างผลลัพธ์คุณภาพสูงได้ เนื่องจากแบบจำลองกำลังฝึกอบรมเกี่ยวกับข้อมูลเฉพาะกรณีการใช้งานตั้งแต่เริ่มต้น โอกาสที่จะเกิดภาพหลอนนั้นเกิดขึ้นได้ยาก และความแม่นยำของผลลัพธ์ก็อยู่ในระดับสูงสุด อย่างไรก็ตาม หากชุดข้อมูลของคุณมีการพัฒนาอย่างต่อเนื่อง คุณยังคงประสบปัญหาภาพหลอนได้ การฝึกอบรมตั้งแต่เริ่มต้นมีความซับซ้อนและต้นทุนในการใช้งานสูงสุด ต้องใช้ความพยายามมากที่สุดเพราะต้องใช้การรวบรวมข้อมูลจำนวนมหาศาล การดูแลจัดการและการประมวลผล และการฝึกอบรม FM ขนาดใหญ่พอสมควร ซึ่งต้องใช้วิทยาศาสตร์ข้อมูลเชิงลึกและความเชี่ยวชาญด้าน ML แนวทางนี้ใช้เวลานาน (โดยทั่วไปอาจใช้เวลาหลายสัปดาห์หรือหลายเดือน)

คุณควรพิจารณาฝึกอบรม FM ตั้งแต่เริ่มต้น เมื่อไม่มีวิธีอื่นใดที่เหมาะกับคุณ และคุณสามารถสร้าง FM ด้วยข้อมูลโทเค็นที่ได้รับการดูแลจัดการอย่างดีจำนวนมาก งบประมาณที่ซับซ้อน และทีมผู้เชี่ยวชาญด้าน ML ที่มีทักษะสูง . AWS มอบโครงสร้างพื้นฐานระบบคลาวด์ที่ทันสมัยที่สุดเพื่อฝึกอบรมและเรียกใช้ LLM และ FM อื่นๆ ที่ขับเคลื่อนโดย GPU และชิปการฝึกอบรม ML ที่สร้างขึ้นตามวัตถุประสงค์ การฝึกอบรม AWSและตัวเร่งการอนุมาน ML การอนุมาน AWS- สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการฝึกอบรม LLM บน SageMaker โปรดดูที่ ฝึกอบรมโมเดลภาษาขนาดใหญ่บน Amazon SageMaker: แนวทางปฏิบัติที่ดีที่สุด และ SageMaker ไฮเปอร์พอด.

การเลือกแนวทางที่เหมาะสมสำหรับการพัฒนาแอปพลิเคชัน AI เชิงสร้างสรรค์

เมื่อพัฒนาแอปพลิเคชัน Generative AI องค์กรจะต้องพิจารณาปัจจัยสำคัญหลายประการอย่างรอบคอบก่อนที่จะเลือกรุ่นที่เหมาะสมที่สุดเพื่อตอบสนองความต้องการของพวกเขา ควรพิจารณาแง่มุมต่างๆ มากมาย เช่น ต้นทุน (เพื่อให้แน่ใจว่าโมเดลที่เลือกสอดคล้องกับข้อจำกัดด้านงบประมาณ) คุณภาพ (เพื่อส่งมอบผลลัพธ์ที่สอดคล้องกันและถูกต้องตามข้อเท็จจริง) การบูรณาการอย่างราบรื่นกับแพลตฟอร์มองค์กรและขั้นตอนการทำงานในปัจจุบัน และการลดอาการประสาทหลอนหรือการสร้างข้อมูลเท็จ . ด้วยตัวเลือกมากมายที่มีให้เลือก การสละเวลาในการประเมินแง่มุมเหล่านี้อย่างละเอียดจะช่วยให้องค์กรต่างๆ เลือกโมเดล AI เชิงสร้างสรรค์ที่ตอบสนองความต้องการและลำดับความสำคัญเฉพาะของตนได้ดีที่สุด คุณควรตรวจสอบปัจจัยต่อไปนี้อย่างใกล้ชิด:

บูรณาการกับระบบองค์กร – เพื่อให้ FM มีประโยชน์อย่างแท้จริงในบริบทขององค์กร พวกเขาจำเป็นต้องบูรณาการและทำงานร่วมกับระบบธุรกิจและขั้นตอนการทำงานที่มีอยู่ ซึ่งอาจเกี่ยวข้องกับการเข้าถึงข้อมูลจากฐานข้อมูล การวางแผนทรัพยากรองค์กร (ERP) และการจัดการลูกค้าสัมพันธ์ (CRM) รวมถึงการกระตุ้นการดำเนินการและเวิร์กโฟลว์ หากไม่มีการบูรณาการอย่างเหมาะสม FM อาจเสี่ยงต่อการเป็นเครื่องมือที่แยกออกจากกัน ระบบองค์กร เช่น ERP มีข้อมูลทางธุรกิจที่สำคัญ (ลูกค้า ผลิตภัณฑ์ คำสั่งซื้อ) FM จำเป็นต้องเชื่อมต่อกับระบบเหล่านี้เพื่อใช้ข้อมูลองค์กร แทนที่จะใช้กราฟความรู้ของตนเอง ซึ่งอาจไม่ถูกต้องหรือล้าสมัย สิ่งนี้ทำให้มั่นใจได้ถึงความถูกต้องและเป็นแหล่งที่มาของความจริงแหล่งเดียว
ภาพหลอน – อาการประสาทหลอนเกิดขึ้นเมื่อแอปพลิเคชัน AI สร้างข้อมูลเท็จซึ่งปรากฏเป็นข้อเท็จจริง สิ่งเหล่านี้จำเป็นต้องได้รับการแก้ไขอย่างรอบคอบก่อนที่ FMs จะถูกนำมาใช้อย่างกว้างขวาง ตัวอย่างเช่น แชทบอททางการแพทย์ที่ออกแบบมาเพื่อให้คำแนะนำในการวินิจฉัยอาจทำให้เห็นภาพหลอนในรายละเอียดเกี่ยวกับอาการของผู้ป่วยหรือประวัติทางการแพทย์ ส่งผลให้เสนอการวินิจฉัยที่ไม่ถูกต้อง การป้องกันอาการประสาทหลอนที่เป็นอันตรายเช่นนี้ผ่านโซลูชันทางเทคนิคและการดูแลชุดข้อมูลจะมีความสำคัญอย่างยิ่งในการทำให้ FM เหล่านี้เชื่อถือได้สำหรับการใช้งานที่มีความละเอียดอ่อน เช่น การดูแลสุขภาพ การเงิน และกฎหมาย การทดสอบอย่างละเอียดและความโปร่งใสเกี่ยวกับข้อมูลการฝึกอบรมของ FM และข้อบกพร่องที่เหลืออยู่จะต้องมาพร้อมกับการใช้งาน
ทักษะและทรัพยากร – การนำ FM มาใช้อย่างประสบความสำเร็จจะขึ้นอยู่กับการมีทักษะและทรัพยากรที่เหมาะสมในการใช้เทคโนโลยีอย่างมีประสิทธิภาพ องค์กรต่างๆ ต้องการพนักงานที่มีทักษะทางเทคนิคที่แข็งแกร่งเพื่อนำไปใช้ ปรับแต่ง และบำรุงรักษา FM อย่างเหมาะสมเพื่อให้เหมาะกับความต้องการเฉพาะของพวกเขา นอกจากนี้ยังต้องการทรัพยากรการคำนวณที่เพียงพอ เช่น ฮาร์ดแวร์ขั้นสูงและความสามารถในการประมวลผลบนคลาวด์เพื่อเรียกใช้ FM ที่ซับซ้อน ตัวอย่างเช่น ทีมการตลาดที่ต้องการใช้ FM เพื่อสร้างสำเนาโฆษณาและโพสต์บนโซเชียลมีเดียต้องการวิศวกรที่มีทักษะในการบูรณาการระบบ ครีเอทีฟโฆษณาเพื่อให้พร้อมท์และประเมินคุณภาพผลลัพธ์ และพลังการประมวลผลบนคลาวด์ที่เพียงพอในการปรับใช้โมเดลอย่างคุ้มค่า การลงทุนในการพัฒนาความเชี่ยวชาญและโครงสร้างพื้นฐานทางเทคนิคจะช่วยให้องค์กรได้รับมูลค่าทางธุรกิจที่แท้จริงจากการประยุกต์ใช้ FM
คุณภาพผลผลิต – คุณภาพของผลผลิตที่ผลิตโดย FM จะมีความสำคัญอย่างยิ่งในการพิจารณานำไปใช้และใช้งาน โดยเฉพาะอย่างยิ่งในแอปพลิเคชันที่ต้องพบปะกับผู้บริโภค เช่น แชทบอท หากแชทบอทที่ขับเคลื่อนโดย FM ให้คำตอบที่ไม่ถูกต้อง ไร้สาระ หรือไม่เหมาะสม ผู้ใช้จะรู้สึกหงุดหงิดอย่างรวดเร็วและหยุดมีส่วนร่วมกับพวกเขา ดังนั้น บริษัทที่ต้องการปรับใช้แชทบอทจำเป็นต้องทดสอบ FM ที่ขับเคลื่อนพวกเขาอย่างเข้มงวด เพื่อให้แน่ใจว่าพวกเขาสร้างการตอบกลับคุณภาพสูงอย่างสม่ำเสมอ ซึ่งเป็นประโยชน์ เกี่ยวข้อง และเหมาะสมเพื่อมอบประสบการณ์ผู้ใช้ที่ดี คุณภาพเอาต์พุตครอบคลุมปัจจัยต่างๆ เช่น ความเกี่ยวข้อง ความแม่นยำ การเชื่อมโยงกัน และความเหมาะสม ซึ่งทั้งหมดนี้ส่งผลต่อความพึงพอใจของผู้ใช้โดยรวม และจะสร้างหรือทำลายการนำ FM มาใช้เหมือนกับที่ใช้สำหรับแชทบอท
ราคา – พลังการคำนวณสูงที่จำเป็นในการฝึกและใช้งานโมเดล AI ขนาดใหญ่ เช่น FM อาจทำให้เกิดค่าใช้จ่ายจำนวนมากได้ หลายองค์กรอาจขาดทรัพยากรทางการเงินหรือโครงสร้างพื้นฐานระบบคลาวด์ที่จำเป็นต่อการใช้โมเดลขนาดใหญ่เช่นนี้ นอกจากนี้ การบูรณาการและการปรับแต่ง FM สำหรับกรณีการใช้งานเฉพาะจะเพิ่มต้นทุนด้านวิศวกรรม ค่าใช้จ่ายจำนวนมากที่จำเป็นในการใช้ FM อาจขัดขวางการยอมรับในวงกว้าง โดยเฉพาะอย่างยิ่งในกลุ่มบริษัทขนาดเล็กและบริษัทสตาร์ทอัพที่มีงบประมาณจำกัด การประเมินผลตอบแทนจากการลงทุนที่เป็นไปได้และการชั่งน้ำหนักต้นทุนเทียบกับผลประโยชน์ของ FM เป็นสิ่งสำคัญสำหรับองค์กรที่พิจารณาการใช้งานและอรรถประโยชน์ ความมีประสิทธิภาพด้านต้นทุนน่าจะเป็นปัจจัยในการตัดสินใจในการพิจารณาว่าโมเดลที่มีประสิทธิภาพแต่ต้องใช้ทรัพยากรจำนวนมากเหล่านี้สามารถนำไปใช้งานได้อย่างเป็นไปได้หรือไม่และอย่างไร

การตัดสินใจออกแบบ

ดังที่เรากล่าวถึงในโพสต์นี้ ปัจจุบันมีเทคนิค AI ที่แตกต่างกันมากมาย เช่น วิศวกรรมที่รวดเร็ว RAG และการปรับแต่งโมเดล ตัวเลือกที่หลากหลายนี้ทำให้บริษัทต่างๆ กำหนดแนวทางที่เหมาะสมที่สุดสำหรับกรณีการใช้งานเฉพาะของตนได้ยาก การเลือกชุดเทคนิคที่เหมาะสมขึ้นอยู่กับปัจจัยต่างๆ รวมถึงการเข้าถึงแหล่งข้อมูลภายนอก การฟีดข้อมูลแบบเรียลไทม์ และความจำเพาะของโดเมนของแอปพลิเคชันที่ต้องการ เพื่อช่วยในการระบุเทคนิคที่เหมาะสมที่สุดตามกรณีการใช้งานและข้อควรพิจารณาที่เกี่ยวข้อง เราจะดำเนินการตามผังงานต่อไปนี้ ซึ่งสรุปคำแนะนำสำหรับการจับคู่ความต้องการและข้อจำกัดเฉพาะด้วยวิธีการที่เหมาะสม

เพื่อให้เกิดความเข้าใจที่ชัดเจน เรามาดูผังงานการตัดสินใจออกแบบโดยใช้ตัวอย่างประกอบบางส่วน:

ค้นหาองค์กร – พนักงานต้องการขอลาออกจากองค์กร เพื่อให้การตอบสนองสอดคล้องกับนโยบายทรัพยากรบุคคลขององค์กร FM จำเป็นต้องมีบริบทเพิ่มเติมนอกเหนือจากความรู้และความสามารถของตนเอง โดยเฉพาะอย่างยิ่ง FM จำเป็นต้องเข้าถึงแหล่งข้อมูลภายนอกที่ให้แนวทางและนโยบายด้านทรัพยากรบุคคลที่เกี่ยวข้อง เมื่อพิจารณาจากสถานการณ์สมมติของคำขอของพนักงานที่ต้องมีการอ้างอิงถึงข้อมูลเฉพาะโดเมนภายนอก แนวทางที่แนะนำตามแผนผังลำดับงานคือวิศวกรรมทันทีด้วย RAG RAG จะช่วยในการให้ข้อมูลที่เกี่ยวข้องจากแหล่งข้อมูลภายนอกเพื่อเป็นบริบทให้กับ FM
การค้นหาระดับองค์กรพร้อมผลลัพธ์เฉพาะองค์กร – สมมติว่าคุณมีแบบวิศวกรรมและต้องการดึงรายการวัสดุออกมา โดยจัดรูปแบบเอาต์พุตตามมาตรฐานอุตสาหกรรม ในการดำเนินการนี้ คุณสามารถใช้เทคนิคที่ผสมผสานวิศวกรรมที่รวดเร็วเข้ากับ RAG และโมเดลภาษาที่ได้รับการปรับแต่งอย่างละเอียด แบบจำลองที่ได้รับการปรับแต่งอย่างละเอียดจะได้รับการฝึกอบรมให้จัดทำรายการวัสดุเมื่อได้รับแบบทางวิศวกรรมเป็นข้อมูลนำเข้า RAG ช่วยค้นหาแบบวิศวกรรมที่เกี่ยวข้องมากที่สุดจากแหล่งข้อมูลขององค์กรเพื่อป้อนในบริบทของ FM โดยรวมแล้ว วิธีการนี้จะแยกรายการวัสดุจากแบบทางวิศวกรรมและโครงสร้างผลลัพธ์ที่เหมาะสมสำหรับขอบเขตทางวิศวกรรม
ค้นหาทั่วไป – ลองจินตนาการว่าคุณต้องการค้นหาตัวตนของประธานาธิบดีคนที่ 30 ของสหรัฐอเมริกา คุณสามารถใช้ prompt Engineering เพื่อรับคำตอบจาก FM ได้ เนื่องจากแบบจำลองเหล่านี้ได้รับการฝึกอบรมจากแหล่งข้อมูลจำนวนมาก จึงมักจะสามารถให้คำตอบที่ถูกต้องสำหรับคำถามที่เป็นข้อเท็จจริงเช่นนี้ได้
การค้นหาทั่วไปกับเหตุการณ์ล่าสุด – หากคุณต้องการกำหนดราคาหุ้นปัจจุบันของ Amazon คุณสามารถใช้แนวทางวิศวกรรมที่รวดเร็วกับตัวแทนได้ ตัวแทนจะแจ้งราคาหุ้นล่าสุดให้ FM เพื่อให้สามารถสร้างการตอบกลับตามข้อเท็จจริงได้

สรุป

Generative AI นำเสนอศักยภาพมหาศาลสำหรับองค์กรในการขับเคลื่อนนวัตกรรมและเพิ่มประสิทธิภาพการทำงานในแอปพลิเคชันที่หลากหลาย อย่างไรก็ตาม การนำเทคโนโลยี AI ที่เกิดขึ้นใหม่เหล่านี้ไปใช้ให้ประสบความสำเร็จนั้น จำเป็นต้องคำนึงถึงประเด็นสำคัญเกี่ยวกับการบูรณาการ คุณภาพผลผลิต ทักษะ ต้นทุน และความเสี่ยงที่อาจเกิดขึ้น เช่น ภาพหลอนที่เป็นอันตราย หรือช่องโหว่ด้านความปลอดภัย องค์กรจำเป็นต้องใช้แนวทางที่เป็นระบบในการประเมินข้อกำหนดและข้อจำกัดกรณีการใช้งานของตน เพื่อกำหนดเทคนิคที่เหมาะสมที่สุดสำหรับการปรับและประยุกต์ใช้ FM ตามที่ไฮไลต์ในโพสต์นี้ วิธีการทางวิศวกรรมที่รวดเร็ว RAG และการปรับแต่งโมเดลที่มีประสิทธิภาพแต่ละวิธีมีจุดแข็งและจุดอ่อนของตัวเองที่เหมาะกับสถานการณ์ที่แตกต่างกัน ด้วยการแม็ปความต้องการทางธุรกิจเข้ากับความสามารถของ AI โดยใช้กรอบงานที่มีโครงสร้าง องค์กรต่างๆ จึงสามารถเอาชนะอุปสรรคในการนำไปปฏิบัติ และเริ่มตระหนักถึงผลประโยชน์จาก FM ในขณะเดียวกันก็สร้างรั้วเพื่อจัดการความเสี่ยงด้วย ด้วยการวางแผนอย่างรอบคอบซึ่งมีพื้นฐานมาจากตัวอย่างจริง ธุรกิจในทุกอุตสาหกรรมยืนหยัดเพื่อปลดล็อกมูลค่ามหาศาลจากคลื่นลูกใหม่ของ AI เชิงสร้างสรรค์ เรียนรู้เกี่ยวกับ AI เชิงกำเนิดบน AWS.

เกี่ยวกับผู้เขียน

เจ ราว เป็น Principal Solutions Architect ที่ AWS เขามุ่งเน้นไปที่เทคโนโลยี AI/ML โดยมีความสนใจอย่างมากใน Generative AI และ Computer Vision ที่ AWS เขาสนุกกับการให้คำแนะนำด้านเทคนิคและกลยุทธ์แก่ลูกค้า และช่วยพวกเขาออกแบบและใช้งานโซลูชันที่ขับเคลื่อนผลลัพธ์ทางธุรกิจ เขาเป็นผู้เขียนหนังสือ (Computer Vision บน AWS) เผยแพร่บล็อกและตัวอย่างโค้ดเป็นประจำ และได้บรรยายในการประชุมด้านเทคนิค เช่น AWS re:Invent

บาบู คาริยาเด่น ปรรัมพัท เป็นผู้เชี่ยวชาญด้าน AI/ML อาวุโสที่ AWS ที่ AWS เขาสนุกกับการทำงานร่วมกับลูกค้าในการช่วยพวกเขาระบุกรณีการใช้งานทางธุรกิจที่เหมาะสมพร้อมมูลค่าทางธุรกิจ และแก้ไขปัญหาโดยใช้โซลูชันและบริการของ AWS AI/ML ก่อนที่จะมาร่วมงานกับ AWS Babu เป็นผู้เผยแพร่ AI ที่มีประสบการณ์ในอุตสาหกรรมที่หลากหลายมาเป็นเวลา 20 ปีในการส่งมอบคุณค่าทางธุรกิจที่ขับเคลื่อนด้วย AI ให้กับลูกค้า

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
ที่มา: https://aws.amazon.com/blogs/machine-learning/best-practices-to-build-generative-ai-applications-on-aws/

เพลโต ดาต้า อินเทลลิเจนซ์
ค้นหาแนวตั้ง & Ai

แนวปฏิบัติที่ดีที่สุดในการสร้างแอปพลิเคชัน AI เชิงสร้างสรรค์บน AWS | อเมซอนเว็บเซอร์วิส

AI สร้างสรรค์ด้วย AWS

แนวทาง AI ทั่วไป