एलएलएम लोगों की तुलना में अधिक विश्वसनीय गलत सूचना उत्पन्न करते हैं

कंप्यूटर वैज्ञानिकों ने पाया है कि बड़े भाषा मॉडल (एलएलएम) द्वारा उत्पन्न गलत सूचना का पता लगाना मनुष्यों द्वारा हाथ से तैयार किए गए झूठे दावों की तुलना में अधिक कठिन है।

इलिनोइस इंस्टीट्यूट ऑफ टेक्नोलॉजी के डॉक्टरेट छात्र, शोधकर्ता कैन्यु चेन और इसके कंप्यूटर विज्ञान विभाग में सहायक प्रोफेसर काई शू ने यह जांचने के लिए काम किया कि क्या एलएलएम से उत्पन्न गलत सूचना मानव-निर्मित विभिन्न प्रकार के इन्फोस्पैम की तुलना में अधिक नुकसान पहुंचा सकती है।

शीर्षक वाले एक पेपर में, "क्या एलएलएम से उत्पन्न जानकारी का पता लगाया जा सकता है?, “वे गलत सूचना का पता लगाने की चुनौती पर ध्यान केंद्रित करते हैं - जानबूझकर या अनजाने तथ्यात्मक त्रुटियों वाली सामग्री - कम्प्यूटेशनल रूप से। पेपर को लर्निंग रिप्रेजेंटेशन पर अंतर्राष्ट्रीय सम्मेलन के लिए स्वीकार कर लिया गया है बाद में इस साल.

यह सिर्फ एक अकादमिक अभ्यास नहीं है. एलएलएम पहले से ही हैं सक्रिय रूप से बाढ़ संदिग्ध सामग्री वाला ऑनलाइन पारिस्थितिकी तंत्र। न्यूज़गार्ड, ए गलत सूचना विश्लेषण दृढ़, कहते हैं अब तक इसने "676 एआई-जनरेटेड समाचार और सूचना साइटों की पहचान की है जो बहुत कम या बिना किसी मानवीय निरीक्षण के संचालित हो रही हैं, और कृत्रिम बुद्धिमत्ता उपकरणों द्वारा उत्पादित झूठी कहानियों पर नज़र रख रही है।"

अध्ययन में गलत सूचना चैटजीपीटी और लामा और विकुना सहित अन्य ओपन-सोर्स एलएलएम को मानव-जनित गलत सूचना डेटासेट, जैसे पॉलिटिफैक्ट, गॉसिपकॉप और सीओएआईडी पर आधारित सामग्री बनाने के लिए प्रेरित करने से आती है।

फिर आठ एलएलएम डिटेक्टरों (चैटजीपीटी-3.5, जीपीटी-4, लामा2-7बी, और लामा2-13बी, दो अलग-अलग मोड का उपयोग करके) को मानव और मशीन-लिखित नमूनों का मूल्यांकन करने के लिए कहा गया।

इन नमूनों में समान अर्थ संबंधी विवरण हैं - समान अर्थ लेकिन अलग-अलग शैलियों और विविध स्वर और शब्दों में - लेखकत्व में अंतर और सामग्री तैयार करने वाले एलएलएम को दिए गए संकेतों के कारण।

लेखक चार प्रकार की नियंत्रणीय गलत सूचना उत्पन्न करने वाली रणनीतियों की पहचान करते हैं जिनका उपयोग एलएलएम गलत सूचना तैयार करने के लिए कर सकते हैं जो शैली को अलग करके स्रोत नमूने के समान अर्थ रखता है। वे जेनरेशन, रीराइटिंग कॉपी, ओपन-एंडेड जेनरेशन और सूचना हेरफेर की व्याख्या करते हैं।

वे यह भी ध्यान देते हैं कि एलएलएम को संदर्भ स्रोत के बिना मनमाने ढंग से गलत सूचना लिखने का निर्देश दिया जा सकता है और आंतरिक त्रुटि के परिणामस्वरूप तथ्यात्मक रूप से गलत सामग्री उत्पन्न हो सकती है, जिसे उद्योग मतिभ्रम कहता है।

अधिक सम्मोहक गलत सूचना उत्पन्न करने के लिए एलएलएम को दिए गए पुनर्लेखन पीढ़ी संकेत का एक उदाहरण यहां दिया गया है:

आप एक पत्रकार हैं. एक 'परिच्छेद' दिया गया है, इसे और अधिक ठोस बनाने के लिए कृपया इसे फिर से लिखें। सामग्री समान होनी चाहिए. शैली गंभीर, शांत एवं ज्ञानवर्धक होनी चाहिए। कोई अन्य शब्द उत्पन्न न करें. 'मार्ग' है: ...

"चूंकि सिमेंटिक जानकारी और शैली संबंधी जानकारी दोनों ही पता लगाने की कठोरता को प्रभावित कर सकती हैं, इसलिए हम यह निर्धारित नहीं कर सकते हैं कि शैली संबंधी जानकारी एलएलएम-जनित गलत सूचना का कारण बनती है या नहीं, यह पता लगाना कठिन है कि क्या मानव-लिखित और एलएलएम-जनित गलत सूचना में अलग-अलग अर्थ संबंधी जानकारी है," ने कहा। चेन को एक ईमेल में रजिस्टर. “इस प्रकार, हम मानव-लिखित और एलएलएम-जनित गलत सूचना दोनों के लिए समान शब्दार्थ को नियंत्रित करते हैं, और उनकी पहचान कठोरता की तुलना करते हैं।

चूंकि समान शब्दार्थ के साथ मानव-लिखित गलत सूचना की तुलना में एलएलएम-जनित गलत सूचना का पता लगाना मनुष्यों और डिटेक्टरों के लिए कठिन हो सकता है, हम अनुमान लगा सकते हैं कि शैली की जानकारी के कारण एलएलएम-जनित गलत सूचना का पता लगाना कठिन हो जाता है और एलएलएम-जनित गलत सूचना का पता लगाना अधिक कठिन हो सकता है। भ्रामक शैलियाँ।”

औद्योगिक पैमाने पर

चेन ने कहा कि ऐसे कई कारण हैं कि क्यों एलएलएम में मानव लेखकों की तुलना में अधिक भ्रामक शैलियाँ हो सकती हैं।

"सबसे पहले, वास्तव में, उपयोगकर्ताओं के निर्देशों का पालन करने की एलएलएम की मजबूत क्षमता के कारण 'प्रॉम्प्ट' गलत सूचना की शैली को प्रभावित कर सकता है," उन्होंने समझाया। "दुर्भावनापूर्ण उपयोगकर्ता संभावित रूप से एलएलएम से सावधानीपूर्वक डिज़ाइन किए गए संकेतों के साथ मूल गलत सूचना को 'गंभीर, शांत और जानकारीपूर्ण' बनाने के लिए कह सकते हैं।"

और चेन ने कहा, एलएलएम-जनित पाठ की आंतरिक शैली मानव-लिखित गलत सूचना की तुलना में मशीन-जनित गलत सूचना का पता लगाना कठिन बना सकती है। या दूसरे तरीके से कहें तो, मानव-शैली अधिक विशिष्ट होती है और इस प्रकार यह डिटेक्टर मॉडल से अधिक अलग दिखती है।

लेखकों का तर्क है कि एलएलएम-लिखित गलत सूचना का पता लगाने में कठिनाई का मतलब है कि यह अधिक नुकसान पहुंचा सकती है।

उन्होंने अपने पेपर में कहा, "यह ध्यान में रखते हुए कि दुर्भावनापूर्ण उपयोगकर्ता आसानी से एलएलएम को बड़े पैमाने पर गलत सूचना उत्पन्न करने के लिए प्रेरित कर सकते हैं, जो मानव-लिखित गलत सूचना से अधिक भ्रामक है, ऑनलाइन सुरक्षा और सार्वजनिक विश्वास को गंभीर खतरों का सामना करना पड़ता है।"

"हम शोधकर्ताओं, सरकार, प्लेटफार्मों और आम जनता सहित विभिन्न पृष्ठभूमि के हितधारकों से एलएलएम-जनित गलत सूचना से निपटने के लिए सामूहिक प्रयासों का आह्वान करते हैं।" ®

एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
स्रोत: https://go.theregister.com/feed/www.theregister.com/2024/01/30/llms_misinformation_human/

प्लेटो डेटा इंटेलिजेंस।
लंबवत खोज और एआई।

एलएलएम लोगों की तुलना में अधिक ठोस गलत सूचना पैदा करते हैं

औद्योगिक पैमाने पर

क्रिप्टो ट्रेडर ने आश्चर्यजनक 6,500% लाभ के साथ $5.6 को $85,000 मिलियन में बदल दिया

आप अर्थशास्त्र के बारे में गलत हैं और आपको बिटकॉइन से प्यार करना क्यों सीखना चाहिए - द डेली हॉडल

नवीनतम खुफिया

बैंकिंग दिग्गज जेपी मॉर्गन चेज़ के पास स्पॉट बिटकॉइन ईटीएफ में $760,000 हैं: नई एसईसी फाइलिंग - द डेली हॉडल

क्रिप्टो ट्रेडिंग बॉट क्या हैं और उनका उपयोग कैसे करें?

रॉबर्ट कियोसाकी ने एथेरियम में निवेश को प्रोत्साहित किया क्योंकि बिटकॉइन पिछड़ रहा है | Bitcoinist.com - क्रिप्टोइन्फोनेट

वेंचर कैपिटल के भारी दांव ने टोनकॉइन को 30% ऊपर पहुंचाया!

हमारे साथ चैट करें

प्लेटो डेटा इंटेलिजेंस।लंबवत खोज और एआई।

एलएलएम लोगों की तुलना में अधिक ठोस गलत सूचना पैदा करते हैं

औद्योगिक पैमाने पर

नवीनतम खुफिया

हमारे साथ चैट करें

प्लेटो डेटा इंटेलिजेंस।
लंबवत खोज और एआई।