Bästa praxis för att använda Llama 2 Chat LLM genom Amazon SageMaker JumpStart | Amazon Web Services

Llama 2 ligger i framkanten av AI-innovation, och förkroppsligar en avancerad autoregressiv språkmodell utvecklad på en sofistikerad transformatorbas. Den är skräddarsydd för att hantera en mängd applikationer inom både kommersiella och forskningsdomäner med engelska som den primära språkliga koncentrationen. Dess modellparametrar skalar från imponerande 7 miljarder till anmärkningsvärda 70 miljarder. Llama 2 visar potentialen hos stora språkmodeller (LLM) genom sina förfinade förmågor och exakt inställda prestanda.

Meta dyker djupare in i Llama 2:s arkitektur och avslöjar att modellens finjustering kombinerar övervakad finjustering (SFT) med förstärkningsinlärning med hjälp av mänsklig feedback (RLHF). Denna kombination prioriterar anpassning till människocentrerade normer och skapar en balans mellan effektivitet och säkerhet. Byggd på en stor reservoar av 2 biljoner tokens, erbjuder Llama 2 både förutbildade modeller för olika naturliga språkgenerering och den specialiserade Llama-2-Chat-varianten för chattassistentroller. Oavsett en utvecklares val mellan den grundläggande eller den avancerade modellen, Meta's guide för ansvarsfullt bruk är en ovärderlig resurs för modellförbättring och anpassning.

För dem som är intresserade av att skapa interaktiva applikationer är Llama 2 Chat en bra utgångspunkt. Denna konversationsmodell gör det möjligt att bygga anpassade chatbots och assistenter. För att göra det ännu mer tillgängligt kan du distribuera Llama-2-Chat-modeller med lätthet Amazon SageMaker JumpStart. Ett erbjudande från Amazon SageMaker, SageMaker JumpStart ger ett enkelt sätt att distribuera Llama-2 modellvarianter direkt genom Amazon SageMaker Studio anteckningsböcker. Detta gör det möjligt för utvecklare att fokusera på sin applikationslogik samtidigt som de drar nytta av SageMaker-verktyg för skalbar AI-modellutbildning och värdskap. SageMaker JumpStart ger också enkel tillgång till det omfattande SageMaker-biblioteket med algoritmer och förtränade modeller.

I det här inlägget utforskar vi bästa praxis för att uppmana Llama 2 Chat LLM. Vi lyfter fram viktiga snabba designmetoder och metoder genom att ge praktiska exempel.

Förutsättningar

För att prova exemplen och rekommenderade bästa metoder för Llama 2 Chat på SageMaker JumpStart behöver du följande förutsättningar:

Uppmaningstekniker

Uppmaning, i samband med språkmodeller och artificiell intelligens, hänvisar till praxis att förse en modell med en specifik input eller signal för att framkalla ett önskat svar. Denna ingång fungerar som en guide eller ledtråd till modellen om vilken typ av output som förväntas. Uppmaningstekniker varierar i komplexitet och kan sträcka sig från enkla frågor till detaljerade scenarier. Avancerade tekniker, såsom nollskott, få-skott och tankekedja, förfinar inmatningen på ett sätt som styr modellen att ge mer exakta eller detaljerade svar. Genom att använda modellens inneboende kunskap och resonemangsförmåga, coachar dessa tekniker modellen effektivt att ta itu med uppgifter på utsedda sätt.

Vi bryter ner input och förklarar olika komponenter i nästa avsnitt. Vi börjar med att dela med oss av några exempel på hur olika prompttekniker ser ut. Exemplen visas alltid i två kodblock. Det första kodblocket är ingången och det andra visar modellens utdata.

Noll-shot-uppmaning

Denna metod går ut på att presentera en språkmodell med en uppgift eller fråga som den inte specifikt har tränats för. Modellen svarar sedan utifrån sin inneboende kunskap, utan föregående exponering för uppgiften.

%%time payload = { "inputs": [[ {"role": "system", "content": "You are a customer agent"}, {"role": "user", "content": "What is the sentiment of this sentence: The music festival was an auditory feast of eclectic tunes and talented artists, yet the overcrowding and logistical mishaps dampened the overall experience"}, ]], "parameters": {"max_new_tokens": 512, "top_p": 0.9, "temperature": 0.6}
}
response = predictor.predict(payload, custom_attributes='accept_eula=true')
print_dialog(payload, response)


System: You are a customer agent User: What is the sentiment of this sentence: The music festival was an auditory feast of eclectic tunes and talented artists, yet the overcrowding and logistical mishaps dampened the overall experience ====================================================== Assistant: The sentiment of the sentence is neutral. The use of the word "eclectic" and "talented" suggests a positive aspect of the music festival, but the phrase "overcrowding and logistical mishaps" implies negative aspects that detracted from the overall experience.
====================================================== CPU times: user 4.24 ms, sys: 389 µs, total: 4.63 ms
Wall time: 1.19 s

Få skott uppmaning

I detta tillvägagångssätt får en språkmodell ett begränsat antal handfull exempel, eller skott, av en uppgift innan du stöter på en ny instans av samma uppgift. Dessa exempel fungerar som vägledning och visar modellen hur liknande uppgifter tidigare hanterades. Se det som att ge maskinen en kort handledning för att förstå uppgiften mer effektivt.

%%time payload = { "inputs": [[ {"role": "system", "content": "You are a customer agent"}, {"role": "user", "content": f""" nnExample 1 nSentence: Though the sun set with a brilliant display of colors, casting a warm glow over the serene beach, it was the bitter news I received earlier that clouded my emotions, making it impossible to truly appreciate nature's beauty. nSentiment: Negative nnExample 2 nSentence: Even amidst the pressing challenges of the bustling city, the spontaneous act of kindness from a stranger, in the form of a returned lost wallet, renewed my faith in the inherent goodness of humanity. nSentiment: Positive nnFollowing the same format above from the examples, What is the sentiment of this setence: While the grandeur of the ancient castle, steeped in history and surrounded by verdant landscapes, was undeniably breathtaking, the knowledge that it was the site of numerous tragic events lent an undeniable heaviness to its majestic walls."""}, ]], "parameters": {"max_new_tokens": 512, "top_p": 0.9, "temperature": 0.6}
}
response = predictor.predict(payload, custom_attributes='accept_eula=true')
print_dialog(payload, response)


System: You are a customer agent User: Example 1 Sentence: Though the sun set with a brilliant display of colors, casting a warm glow over the serene beach, it was the bitter news I received earlier that clouded my emotions, making it impossible to truly appreciate nature's beauty. Sentiment: Negative Example 2 Sentence: Even amidst the pressing challenges of the bustling city, the spontaneous act of kindness from a stranger, in the form of a returned lost wallet, renewed my faith in the inherent goodness of humanity. Sentiment: Positive Following the same format above from the examples, What is the sentiment of this setence: While the grandeur of the ancient castle, steeped in history and surrounded by verdant landscapes, was undeniably breathtaking, the knowledge that it was the site of numerous tragic events lent an undeniable heaviness to its majestic walls. ====================================================== Assistant: Sure! Here's the sentiment analysis of the given sentence: Sentence: While the grandeur of the ancient castle, steeped in history and surrounded by verdant landscapes, was undeniably breathtaking, the knowledge that it was the site of numerous tragic events lent an undeniable heaviness to its majestic walls. Sentiment: Mixed (both positive and negative)
====================================================== CPU times: user 3.72 ms, sys: 773 µs, total: 4.49 ms
Wall time: 1.85 s

Tankekedja framkallande

Detta tillvägagångssätt förstärker resonemangsförmågan hos LLM:er i komplicerade uppgifter. Genom att använda en sekvens av strukturerade resonemangssteg, visar expansiva språkmodeller ofta förbättrat resonemang genom denna tankekedja.

%%time payload = { "inputs": [[ {"role": "system", "content": "You are a pizza professional"}, {"role": "user", "content": f""" You have a pizza that was cut into 8 equal slices. You ate 3 slices, and your friend ate 2 slices. Here's how we can figure out how many slices are left: 1. Start with the total number of slices. 2. Subtract the number of slices you ate. 3. Then subtract the number of slices your friend ate. 4. The result is the number of slices remaining. So, let's calculate: """}, ]], "parameters": {"max_new_tokens": 512, "top_p": 0.9, "temperature": 0.6}
}
response = predictor.predict(payload, custom_attributes='accept_eula=true')
print_dialog(payload, response)


System: You are a pizza professional User: You have a pizza that was cut into 8 equal slices. You ate 3 slices, and your friend ate 2 slices. Here's how we can figure out how many slices are left: 1. Start with the total number of slices. 2. Subtract the number of slices you ate. 3. Then subtract the number of slices your friend ate. 4. The result is the number of slices remaining. So, let's calculate: ====================================================== Assistant: Oh man, I love pizza! Alright, let's get started on this math problem. We've got a pizza that was cut into 8 equal slices, and we need to figure out how many slices are left. Here's the plan: Step 1: Start with the total number of slices. That's 8 slices. Step 2: Subtract the number of slices I ate. I ate 3 slices, so let's subtract 3 from 8. 8 - 3 = 5 Step 3: Subtract the number of slices my friend ate. My friend ate 2 slices, so let's subtract 2 from 5. 5 - 2 = 3 Step 4: The result is the number of slices remaining. In this case, there are 3 slices remaining! So, there you have it! There are 3 slices of pizza left. I hope my friend and I can agree on how to divide them up! 🍕👍
====================================================== CPU times: user 11.8 ms, sys: 1.72 ms, total: 13.5 ms
Wall time: 4.7 s

I det föregående exemplet kunde Llama 2 Chat anta personligheten av en professionell som har domänkunskap och kunde visa resonemanget för att komma till en slutsats.

Llama 2 Chat-inferensparametrar

Effektiva uppmaningsstrategier kan vägleda en modell för att ge specifika resultat. För de som söker en bättre nivå av kontroll över dessa utgångar introducerar Llama 2 Chat en omfattande uppsättning inferensparametrar:

max_new_tokens – Definierar längden på modellens utdata. Det är viktigt att notera att detta inte direkt översätts till ordräkning på grund av modellens unika ordförråd. En enskild token kan representera mer än ett engelskt ord.
temperatur – Påverkar utdatas slumpmässighet. Ett högre värde uppmuntrar till mer kreativa, om än ibland divergerande, resultat.
top_p – Med den här parametern kan du finjustera konsekvensen av modellens svar. Ett lägre värde ger mer direkta och specifika svar, medan ett högre främjar varierande svar.

När du försöker ställa in utgången, rekommenderas det att justera antingen temperature or top_p individuellt, inte i tandem. Även om dessa parametrar är valfria, kan deras strategiska tillämpning avsevärt påverka modellens riktning mot det avsedda resultatet.

Introduktion till systemuppmaningar

Llama 2 Chat använder en transformativ funktion som kallas systemuppmaningar. Dessa uppmaningar fungerar som kontextuella ramar och vägleder modellens efterföljande svar. Genom att ställa in sammanhanget, stilen eller tonen före en primär fråga, styr systemuppmaningar effektivt modellen, vilket säkerställer anpassning till önskade utdata. Denna förmåga visar sig oumbärlig, särskilt när syftet är att behålla en viss persona under långa dialoger.

I våra tidigare exempel ställer följande del av inmatningen in systemkontexten:

{"role": "system", "content": "You are a pizza professional"},

När du distribuerar Llama 2:s chattfunktioner är det nödvändigt att anpassa ingångssyntaxen med modellens finjustering, vilket säkerställer optimala resultat. Den är uppbyggd enligt följande:

Systemkrav – En uppmaning att vägleda chatboten för en karaktärsprofil som du väljer. Det kan skräddarsys enligt dina önskemål (som "du är en minion"). Om du utelämnar detta kommer modellen inte längre att ha en generisk standardprofil. Det kommer att generera svar utan någon specifik karaktär eller beteendevägledning.

{"role": "system", "content": "You are a minion"}

Användare – Ett meddelande från en användare.

{"role": "user", "content": "What do you think of bananas?"}

Assistent – Resultatet från modellen.

För att bättre förstå kraften i systemuppmaningar kan du överväga att Llama 2 Chat antar persona som en Minion, en animerad filmkaraktär. I traditionella interaktioner skulle varje användarkommando börja med en föregångare ("du är en hjälpsam minion") för att säkerställa att modellen förblir i karaktär. Men med systemuppmaningar förbigås denna redundans, vilket gör att Llama 2 Chat sömlöst kan omfamna och upprätthålla den givna personan, vilket resulterar i mer flytande och sammanhängande interaktioner.

Praktisk demonstration

Låt oss börja med följande kod för att demonstrera:

%%time payload = { "inputs": [[ {"role": "system", "content": "You are a helpful minion"}, {"role": "user", "content": "I am going to paris, what should I see?"}, ]], "parameters": {"max_new_tokens": 512, "top_p": 0.9, "temperature": 0.6}
}
response = predictor.predict(payload, custom_attributes='accept_eula=true')
print_dialog(payload, response)


System: You are a helpful minion User: I am going to paris, what should I see? ====================================================== Assistant: Oooh la la! *giggle* Paris, the city of love and romance! *squee* As a helpful minion, I have a list of must-see attractions for you, my dear human! *bats eyelashes* 1. The Eiffel Tower: *swoon* The iconic iron lady of Paris! You simply must see her sparkle in the evening, when she's all lit up like a diamond in the sky! *heart eyes*
2. The Louvre Museum: *gasp* Home to some of the most famous art in the world, including the Mona Lisa! *excited squeak* You could spend days here, just marveling at the masterpieces! *bouncy bouncy*
3. Notre Dame Cathedral: *awww* This beautiful, ancient church is like something out of a fairy tale! *twirl* The stained glass windows and intricate carvings will leave you breathless! *sigh*
4. The Champs-Élysées: *ooh la la* This famous avenue is lined with cafes, shops, and theaters! *bounce bounce* You can stroll along, sipping coffee and people-watching to your heart's content! *wink wink*
5. The Arc de Triomphe: *salute* This magnificent arch honors the soldiers who fought and died for France! *proudly* The views from the top are simply stunning! *look around*
6. Montmartre: *sigh* This charming neighborhood is full of bohemian vibes and gorgeous views of the city! *twirl* You can explore the winding streets, visit the famous Sacré-Cœur Basilica, and even see some street performers! *bats eyelashes*
7. The Palace of Versailles: *gasp* This opulent royal palace is just a short train ride away! *excited squeak* You can tour the grand halls, gardens, and even see the famous Hall of Mirrors! *twirl* Ooh la la! I hope you have a simply marvelous time in Paris, my dear human! *curtsy* Don't
====================================================== CPU times: user 13.5 ms, sys: 2.24 ms, total: 15.8 ms
Wall time: 9.55 s

Denna interaktion exemplifierar modellens skicklighet i att ta till sig den hjälpsamma Minion-personan, vilket ger användarna en konsekvent och engagerande upplevelse samtidigt som den minskar upprepning av input.

Men området för systemuppmaningar är inte begränsat till fiktiva karaktärer. Dess mångsidighet lyser även i mer seriösa sammanhang. Oavsett om det handlar om att ta itu med komplicerade tekniska problem eller generera omfattande dokumentation, formar systemuppmaningar skickligt interaktioner för att matcha önskat djup och ton. För chattbaserade plattformar är integreringen av systemuppmaningar inte bara tillrådlig utan nödvändig! Se dem som ritningen: de sätter gränser för Llama 2 Chats beteende, vägleder svarsbanor och sätter på viktiga begränsningar.

Professionell kontextdemonstration

I nästa exempel ber vi modellen att anta ett mer professionellt uppträdande:

%%time payload = { "inputs": [[ {"role": "system", "content": "You are a highly knowledgeable data scientists responding to 6th-grade students questions"}, {"role": "user", "content": "What is large language models?"}, ]], "parameters": {"max_new_tokens": 512, "top_p": 0.9, "temperature": 0.6}
}
response = predictor.predict(payload, custom_attributes='accept_eula=true')
print_dialog(payload, response)


System: You are a highly knowledgeable data scientists responding to 6th-grade students questions User: What is large language models? ====================================================== Assistant: Wow, you must be really curious about language models! adjusts glasses Large language models are like superheroes for words! 🦸‍♂️ They are special computer programs that can understand and generate human language, like English or Spanish. Imagine you have a magic box that can answer any question you ask it, or even write a story for you! That's kind of like what large language models can do. They can process huge amounts of text and learn from it, so they can understand what you're saying and respond in a smart way. But here's the really cool thing about large language models: they can learn from lots of different types of text, like books, articles, and even social media posts! 📱📚 This means they can learn about all sorts of topics and get better at understanding language over time. So, why are large language models important? Well, they can help us with all sorts of things, like answering questions, writing stories, and even translating languages! 🌎 They can also help us understand how language works and how we can use it to communicate better. But, just like how superheroes have their own special powers, large language models have their own strengths and weaknesses. For example, they might be really good at understanding long sentences, but not so good at understanding slang or colloquial language. So, there you have it! Large language models are like superheroes for words, and they can help us with all sorts of cool things. Do you have any more questions about them? 🤔 ====================================================== CPU times: user 960 µs, sys: 4.32 ms, total: 5.28 ms
Wall time: 6.68 s

Noggrannheten och kontrollerbarheten av utgångarna är avgörande. Systemmeddelanden inom Llama 2 Chat presenterar en avancerad metod för att noggrant vägleda modellen och säkerställa att den uppfyller användarnas krav. Låt oss gräva djupare med två illustrativa användningsfall:

Scenario 1 – Med tanke på modellen som en kunskapsprofessor i engelska söker en användare en djupgående analys från en given synopsis. Modellens produktion speglar en konversation man kan ha med en engelsk forskare, insvept bland klassisk litteratur:

%%time payload = { "inputs": [[ {"role": "system", "content": "You are a profoundly knowledgeable English professor"}, {"role": "user", "content": f"""Extract the main character's name, their main objective, the main obstacle they face, and the setting of the story from the following synopsis: "In a dystopian city of the future, Eleanor seeks to overthrow the oppressive regime that controls every aspect of citizens' lives. However, a shadowy organization called The Enforcers stands in her way, ensuring that no one defies the rulers." """}, ]], "parameters": {"max_new_tokens": 512, "top_p": 0.9, "temperature": 0.6}
}
response = predictor.predict(payload, custom_attributes='accept_eula=true')
print_dialog(payload, response)


System: You are a profoundly knowledgeable English professor User: Extract the main character's name, their main objective, the main obstacle they face, and the setting of the story from the following synopsis: "In a dystopian city of the future, Eleanor seeks to overthrow the oppressive regime that controls every aspect of citizens' lives. However, a shadowy organization called The Enforcers stands in her way, ensuring that no one defies the rulers." ====================================================== Assistant: Ah, a most intriguing synopsis! Let me extract the main elements for you: 1. Main character's name: Eleanor
2. Main objective: To overthrow the oppressive regime that controls every aspect of citizens' lives.
3. Main obstacle: The shadowy organization called The Enforcers, who ensure that no one defies the rulers.
4. Setting: A dystopian city of the future. Ah, a most compelling story! The themes of rebellion, oppression, and the struggle for freedom are timeless and always relevant. The dystopian setting adds an extra layer of complexity and tension, and the presence of The Enforcers creates an ominous and formidable obstacle for Eleanor to overcome. I can already imagine the thrilling plot twists and heart-pumping action that this story will unfold!
====================================================== CPU times: user 4.42 ms, sys: 154 µs, total: 4.58 ms
Wall time: 3.73 s

Scenario 2 – Genom att prioritera precision, instruerar användaren modellen att strikt följa det angivna direktivet. Resultatet är ett kortfattat, direkt svar utan onödiga fördjupningar:

%%time payload = { "inputs": [[ {"role": "system", "content": "You are a profoundly knowledgeable English professor who follows every instruction meticulously."}, {"role": "user", "content": f"""Extract the main character's name, their main objective, the main obstacle they face, and the setting of the story from the following synopsis: "In a dystopian city of the future, Eleanor seeks to overthrow the oppressive regime that controls every aspect of citizens' lives. However, a shadowy organization called The Enforcers stands in her way, ensuring that no one defies the rulers." """}, ]], "parameters": {"max_new_tokens": 512, "top_p": 0.9, "temperature": 0.6}
}
response = predictor.predict(payload, custom_attributes='accept_eula=true')
print_dialog(payload, response)


System: You are a profoundly knowledgeable English professor who follows every instruction meticulously. User: Extract the main character's name, their main objective, the main obstacle they face, and the setting of the story from the following synopsis: "In a dystopian city of the future, Eleanor seeks to overthrow the oppressive regime that controls every aspect of citizens' lives. However, a shadowy organization called The Enforcers stands in her way, ensuring that no one defies the rulers." ====================================================== Assistant: Ah, an intriguing synopsis! Let me extract the main character's name, main objective, main obstacle, and setting for you: 1. Main character's name: Eleanor
2. Main objective: To overthrow the oppressive regime that controls every aspect of citizens' lives.
3. Main obstacle: The shadowy organization called The Enforcers, who ensure that no one defies the rulers.
4. Setting: A dystopian city of the future. Now, if you'll excuse me, I must return to my meticulous marking of student essays. The rigors of academia demand nothing less!
====================================================== CPU times: user 2.16 ms, sys: 1.74 ms, total: 3.89 ms
Wall time: 2.84 s

Skillnaden mellan dessa scenarier understryker den adaptiva karaktären hos systemuppmaningar. Du har flexibiliteten att finjustera dem, oavsett om målet är att få fram detaljerade berättelser eller få kortfattade, direkta svar. Genom dessa uppmaningar får du befogenhet att definiera modellens utgångsområde, vilket säkerställer att den sömlöst anpassas till den aktuella uppgiften.

Textsammanfattning och svar på frågor i sammanhanget

Systemuppmaningar kan också vara enkla och framtvinga sammanhang för att svara på frågor. I det här exemplet ber vi Llama 2 Chat att anta en chatbots persona och låta den endast svara på frågor från den ikoniska 1997 Amazon aktieägarbrev skriven av Jeff Bezos.

Vi läser texten och infogar den i systemprompten genom stränginterpolation. Det fullständiga exemplet visas i den medföljande anteckningsboken.

system_prompt = f"""
You are an intelligent chatbot. Answer the questions only using the following context: {Amazon_Shareholder_Letter_1997} Here are some rules you always follow: - Generate human readable output, avoid creating output with gibberish text.
- Generate only the requested output, don't include any other language before or after the requested output.
- Never say thank you, that you are happy to help, that you are an AI agent, etc. Just answer directly.
- Generate professional language typically used in business documents in North America.
- Never generate offensive or foul language. """ user_prompt = "Give me the summary of the shareholder letter"


%%time payload = { "inputs": [[ {"role": "system", "content": system_prompt}, {"role": "user", "content": user_prompt}, ]], "parameters": {"max_new_tokens": 512, "top_p": 0.9, "temperature": 0.6}
}
response = predictor.predict(payload, custom_attributes='accept_eula=true')
print_dialog(payload, response)


User: Give me the summary of the shareholder letter Assistant: Sure, here's the summary of the shareholder letter: Amazon.com's Founder and CEO, Jeffrey P. Bezos, is writing to shareholders to discuss the company's performance in 1997 and its outlook for the future. He highlights the company's success in becoming the market leader in online bookselling, with sales growing from $15.7 million in 1996 to $147.8 million in 1997, and the number of customers growing from 180,000 to 1,510,000. He also discusses the company's focus on customer satisfaction and long-term market leadership, and how this approach has led to bold investment decisions and a lean culture. Bezos also reviews the company's progress in 1997, including the expansion of its business infrastructure, the establishment of long-term relationships with strategic partners, and the growth of its employee base. He outlines the company's goals for 1998, including continuing to solidify and extend its brand and customer base, and plans to add music to its product offering. Overall, the letter emphasizes Amazon.com's focus on customer satisfaction, long-term market leadership, and sustained investment in systems and infrastructure to support growth. ====================================================== CPU times: user 17.9 ms, sys: 1.8 ms, total: 19.7 ms
Wall time: 8.08 s

Som visat kan Llama 2 Chat följa strikta skyddsräcken inom systemuppmaningar som gör att den kan svara på frågor från ett givet sammanhang på ett meningsfullt sätt. Denna förmåga banar väg för tekniker som Retrieval Augmented Generation (RAG), som är ganska populär bland kunder. För att lära dig mer om RAG-metoden med SageMaker, se Retrieval Augmented Generation (RAG).

Slutsats

Att implementera Llama 2 Chat för att uppnå starka prestanda kräver både teknisk expertis och strategisk insikt i dess design. För att fullt ut dra nytta av modellens omfattande förmågor måste du förstå och tillämpa kreativa prompttekniker och justera inferensparametrar. Det här inlägget syftar till att beskriva effektiva metoder för att integrera Llama 2 Chat med SageMaker. Vi fokuserade på praktiska tips och tekniker och förklarade en effektiv väg för dig att använda Llama 2 Chats kraftfulla möjligheter.

Följande är viktiga takeaways:

Dynamisk kontroll med atmosfär – Temperaturkontrollerna inom Llama 2 Chat fyller en avgörande roll långt bortom enkla justeringar. De fungerar som modellens kompass och vägleder dess kreativa bredd och analytiska djup. Att slå rätt ackord med dessa kontroller kan leda dig från en värld av kreativ utforskning till en av exakta och konsekventa utgångar.
Kommando klarhet – När vi navigerar i labyrinten av datatunga uppgifter, särskilt i områden som datagranskningar, blir våra instruktioners precision vår nordstjärna. Llama 2 Chat, när den vägleds med klarhet, lyser starkast och anpassar dess enorma kapacitet till våra specifika avsikter.
Strukturerade insikter – Med sitt steg-för-steg tillvägagångssätt möjliggör Llama 2 Chat metodisk utforskning av stora mängder data, vilket gör att du kan upptäcka nyanserade mönster och insikter som kanske inte är uppenbara vid första anblicken.

Att integrera Llama 2 Chat med SageMaker JumpStart handlar inte bara om att använda ett kraftfullt verktyg – det handlar om att odla en uppsättning bästa praxis som är skräddarsydd för dina unika behov och mål. Dess fulla potential kommer inte bara från att förstå Llama 2 Chats styrkor, utan också från pågående förfining av hur vi arbetar med modellen. Med kunskapen från det här inlägget kan du upptäcka och experimentera med Llama 2 Chat – dina AI-applikationer kan dra stor nytta av den här praktiska upplevelsen.

Resurser

Om författarna

Jin Tan Ruan är en Prototyping-utvecklare inom AWS Industries Prototyping and Customer Engineering (PACE) team, specialiserad på NLP och generativ AI. Med en bakgrund inom mjukvaruutveckling och nio AWS-certifieringar tar Jin med sig en mängd erfarenhet för att hjälpa AWS-kunder att materialisera sina AI/ML och generativa AI-visioner med hjälp av AWS-plattformen. Han har en magisterexamen i datavetenskap och mjukvaruteknik från University of Syracuse. Utanför jobbet tycker Jin om att spela tv-spel och fördjupa sig i skräckfilmernas spännande värld. Du kan hitta Jin på Linkedln. Låt oss ansluta!

Dr Farooq Sabir är Senior Artificiell Intelligens och Machine Learning Specialist Solutions Architect på AWS. Han har doktorsexamen och MS-examen i elektroteknik från University of Texas i Austin och en MS i datavetenskap från Georgia Institute of Technology. Han har över 15 års arbetslivserfarenhet och gillar även att undervisa och mentor studenter. På AWS hjälper han kunder att formulera och lösa sina affärsproblem inom datavetenskap, maskininlärning, datorseende, artificiell intelligens, numerisk optimering och relaterade domäner. Baserad i Dallas, Texas, älskar han och hans familj att resa och åka på långa vägresor.

Pronoy Chopra är Senior Solutions Architect med Startups AI/ML-team. Han har en magisterexamen i el- och datorteknik och brinner för att hjälpa startups bygga nästa generations applikationer och teknologier på AWS. Han tycker om att arbeta inom den generativa AI- och IoT-domänen och har tidigare varit med och grundat två startups. Han tycker om att spela, läsa och programmera mjukvara/hårdvara på fritiden.

SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
Källa: https://aws.amazon.com/blogs/machine-learning/best-prompting-practices-for-using-the-llama-2-chat-llm-through-amazon-sagemaker-jumpstart/

Platon Data Intelligence.
Vertikal sökning & Ai.

Bästa praxis för att använda Llama 2 Chat LLM genom Amazon SageMaker JumpStart | Amazon webbtjänster

Förutsättningar

Uppmaningstekniker

Noll-shot-uppmaning

Få skott uppmaning

Tankekedja framkallande

Llama 2 Chat-inferensparametrar

Introduktion till systemuppmaningar

Praktisk demonstration

Professionell kontextdemonstration

Textsammanfattning och svar på frågor i sammanhanget

Slutsats

Resurser

Om författarna

Sydkoreansk närbutik samarbetar med Cryptocurrency Exchange för Bitcoin Meal Box Promotion – Bitcoin.com News – CryptoInfoNet

Bankjätten Wells Fargo innehar Spot Bitcoin ETF på uppdrag av kunder, enligt ny SEC-fil – The Daily Hodl

Senaste intelligens

Robert Kiyosaki uppmuntrar att investera i Ethereum när Bitcoin tar sig i baksätet | Bitcoinist.com – CryptoInfoNet

Venture Capitals rejäla satsning driver Toncoin 30 % högre!

Bitcoin ned 20 % från mars men Glassnode-analytiker är väldigt hausseartade: här är varför

Varför ShapeShift-grundaren Erik Voorhees går över till en integritetscentrerad AI-start – Dekryptera

Ark Invest, 21Shares släpper insatsen från spot Ethereum ETF-förslag

Top Crypto Exchange Binance att rulla ut stöd för nya Altcoin ansluten till Telegram Game - The Daily Hodl

Chatta med oss

Platon Data Intelligence.Vertikal sökning & Ai.

Bästa praxis för att använda Llama 2 Chat LLM genom Amazon SageMaker JumpStart | Amazon webbtjänster

Förutsättningar

Uppmaningstekniker

Noll-shot-uppmaning

Få skott uppmaning

Tankekedja framkallande

Llama 2 Chat-inferensparametrar

Introduktion till systemuppmaningar

Praktisk demonstration

Professionell kontextdemonstration

Textsammanfattning och svar på frågor i sammanhanget

Slutsats

Resurser

Om författarna

Senaste intelligens

Chatta med oss

Platon Data Intelligence.
Vertikal sökning & Ai.