מודיעין נתונים של אפלטון.
חיפוש אנכי ו-Ai.

גלה קשרים נסתרים בנתונים פיננסיים לא מובנים עם Amazon Bedrock ו- Amazon Neptune | שירותי האינטרנט של אמזון

תאריך:

בניהול נכסים, מנהלי תיקים צריכים לעקוב מקרוב אחר חברות ביקום ההשקעות שלהם כדי לזהות סיכונים והזדמנויות ולהנחות החלטות השקעה. מעקב אחר אירועים ישירים כמו דוחות רווחים או הורדות אשראי הוא פשוט - אתה יכול להגדיר התראות כדי להודיע ​​למנהלים על חדשות המכילות שמות של חברות. עם זאת, זיהוי השפעות מסדר שני ושלישי הנובעות מאירועים אצל ספקים, לקוחות, שותפים או גורמים אחרים באקוסיסטם של החברה הוא מאתגר.

לדוגמה, שיבוש בשרשרת האספקה ​​אצל ספק מפתח עשוי להשפיע לרעה על יצרנים במורד הזרם. או אובדן לקוח מוביל עבור לקוח גדול מהווה סיכון ביקוש עבור הספק. לעתים קרובות מאוד, אירועים כאלה לא מצליחים להגיע לכותרות עם החברה המושפעת ישירות, אבל עדיין חשוב לשים לב אליהם. בפוסט זה, אנו מדגימים פתרון אוטומטי המשלב גרפי ידע ו בינה מלאכותית גנרטיבית (AI) להציף סיכונים כאלה על ידי הצלבת מפות יחסים עם חדשות בזמן אמת.

בגדול, זה כרוך בשני שלבים: ראשית, בניית הקשרים המורכבים בין חברות (לקוחות, ספקים, דירקטורים) לכדי גרף ידע. שנית, שימוש במסד נתונים גרפים זה יחד עם בינה מלאכותית גנרטיבית כדי לזהות השפעות מסדר שני ושלישי מאירועי חדשות. לדוגמה, פתרון זה יכול להדגיש כי עיכובים אצל ספק חלקים עלולים לשבש את הייצור עבור יצרני רכב במורד הזרם בפורטפוליו, למרות שאף אחד מהם אינו מוזכר ישירות.

עם AWS, אתה יכול לפרוס את הפתרון הזה בארכיטקטורה נטולת שרת, מדרגית ומונעת אירועים באופן מלא. פוסט זה מדגים הוכחת קונספט הבנויה על שני שירותי AWS מרכזיים המתאימים היטב לייצוג ידע גרפים ועיבוד שפה טבעית: אמזון נפטון ו סלע אמזון. Neptune הוא שירות מסד נתונים גרפים מהיר, אמין ומנוהל במלואו, המאפשר לבנות ולהפעיל יישומים שעובדים עם מערכי נתונים מחוברים מאוד. Amazon Bedrock הוא שירות מנוהל במלואו המציע מבחר של דגמי יסוד (FM) בעלי ביצועים גבוהים מחברות בינה מלאכותית מובילות כמו AI21 Labs, Anthropic, Cohere, Meta, Stability AI ואמזון באמצעות API יחיד, יחד עם מערך רחב של יכולות לבנות יישומי AI גנרטיביים עם אבטחה, פרטיות ו-AI אחראי.

בסך הכל, אב הטיפוס הזה מדגים את אמנות האפשר עם גרפי ידע ו-AI מחולל - גזירת אותות על ידי חיבור נקודות שונות. ההטבה עבור אנשי מקצוע בתחום ההשקעות היא היכולת להתעדכן בפיתוחים קרובים יותר לאות תוך הימנעות מרעש.

בנה את גרף הידע

הצעד הראשון בפתרון זה הוא בניית גרף ידע, ומקור נתונים רב ערך אך לעתים קרובות מתעלמים ממנו עבור גרפי ידע הוא דוחות שנתיים של החברה. מכיוון שפרסומים תאגידיים רשמיים עוברים בדיקה לפני הפרסום, המידע שהם מכילים צפוי להיות מדויק ואמין. עם זאת, דוחות שנתיים נכתבים בפורמט לא מובנה המיועד לקריאה אנושית ולא לצריכת מכונות. כדי לנצל את הפוטנציאל שלהם, אתה צריך דרך לחלץ ולבנות באופן שיטתי את שפע העובדות והיחסים שהם מכילים.

עם שירותי בינה מלאכותית כמו Amazon Bedrock, כעת יש לך את היכולת להפוך את התהליך הזה לאוטומטי. אתה יכול לקחת דוח שנתי ולהפעיל צינור עיבוד כדי להטמיע את הדוח, לפרק אותו לחלקים קטנים יותר, ולהחיל הבנת שפה טבעית כדי להוציא ישויות ומערכות יחסים בולטים.

לדוגמה, משפט הקובע כי "[חברה A] הרחיבה את צי המשלוחים החשמליים שלה באירופה עם הזמנה של 1,800 טנדרים חשמליים מ[חברה B]" יאפשר לאמזון Bedrock לזהות את הדברים הבאים:

  • [חברה א'] כלקוח
  • [חברה ב'] כספק
  • יחסי ספק בין [חברה A] ו-[חברה B]
  • פרטי הקשר של "ספק טנדרים חשמליים"

חילוץ נתונים מובנים כאלה ממסמכים לא מובנים מחייב לספק הנחיות מעוצבות בקפידה למודלים של שפה גדולה (LLMs) כדי שיוכלו לנתח טקסט כדי לשלוף ישויות כמו חברות ואנשים, כמו גם קשרים כגון לקוחות, ספקים ועוד. ההנחיות מכילות הנחיות ברורות ממה להיזהר והמבנה שבו יש להחזיר את הנתונים. על ידי חזרה על תהליך זה על פני כל הדוח השנתי, תוכל לחלץ את הישויות והקשרים הרלוונטיים כדי לבנות גרף ידע עשיר.

עם זאת, לפני העברת המידע שחולץ לגרף הידע, עליך לבחון תחילה את הישויות. לדוגמה, ייתכן שכבר יש ישות אחרת '[חברה A]' בגרף הידע, אבל היא יכולה לייצג ארגון אחר עם אותו שם. Amazon Bedrock יכולה לנמק ולהשוות בין תכונות כמו אזור מיקוד עסקי, תעשייה ותעשיות מניבות הכנסות וקשרים עם ישויות אחרות כדי לקבוע אם שתי הישויות באמת נבדלות. זה מונע מיזוג לא מדויק של חברות לא קשורות לישות אחת.

לאחר השלמת הבליעה, תוכל להוסיף באופן מהימן ישויות וקשרים חדשים לתוך גרף הידע של נפטון שלך, ולהעשיר אותו בעובדות שחולצו מדוחות שנתיים. לאורך זמן, הטמעת נתונים אמינים ושילוב של מקורות נתונים אמינים יותר יסייעו בבניית גרף ידע מקיף שיכול לתמוך בתובנות חושפניות באמצעות שאילתות גרפים וניתוח.

אוטומציה זו המתאפשרת על ידי AI יצירתי מאפשרת לעבד אלפי דוחות שנתיים ופותחת נכס שלא יסולא בפז לאיסוף גרפי ידע, שאחרת לא היה מנוצל בשל המאמץ הידני הגבוה ביותר הנדרש.

צילום המסך הבא מציג דוגמה לחקירה החזותית האפשרית במסד נתונים של גרפים של נפטון באמצעות ה סייר גרפים כלי.

עיבוד מאמרי חדשות

השלב הבא של הפתרון הוא העשרה אוטומטית של עדכוני החדשות של מנהלי תיקים והדגשת מאמרים הרלוונטיים לתחומי העניין וההשקעות שלהם. עבור עדכון החדשות, מנהלי תיקים יכולים להירשם לכל ספק חדשות של צד שלישי דרך חילופי נתונים AWS או ממשק API אחר לפי בחירתם.

כאשר כתבה חדשותית נכנסת למערכת, מופעל צינור הטמעה לעיבוד התוכן. באמצעות טכניקות דומות לעיבוד של דוחות שנתיים, Amazon Bedrock משמש לחילוץ ישויות, תכונות וקשרים מהמאמר החדשותי, אשר משמשים לאחר מכן כדי להבדיל מול גרף הידע כדי לזהות את הישות המקבילה בגרף הידע.

גרף הידע מכיל חיבורים בין חברות ואנשים, ועל ידי קישור ישויות מאמר לצמתים קיימים, ניתן לזהות אם נושאים כלשהם נמצאים בטווח של שני קפיצות מהחברות שמנהל התיקים השקיע בהן או מתעניין בהן. מציאת קשר כזה מעידה על המאמר עשוי להיות רלוונטי למנהל התיקים, ומכיוון שהנתונים הבסיסיים מיוצגים בגרף ידע, ניתן להמחיש אותו כדי לעזור למנהל התיקים להבין מדוע וכיצד הקשר זה רלוונטי. בנוסף לזיהוי קשרים לתיק, אתה יכול גם להשתמש ב- Amazon Bedrock כדי לבצע ניתוח סנטימנטים על הישויות שאליהם מתייחסים.

הפלט הסופי הוא עדכון חדשות מועשר שמציג מאמרים שעשויים להשפיע על תחומי העניין וההשקעות של מנהל התיקים.

סקירת פתרונות

הארכיטקטורה הכוללת של הפתרון נראית כמו התרשים הבא.

זרימת העבודה מורכבת מהשלבים הבאים:

  1. משתמש מעלה דוחות רשמיים (בפורמט PDF) ל- an שירות אחסון פשוט של אמזון דלי (Amazon S3). הדוחות צריכים להיות דוחות שפורסמו באופן רשמי כדי למזער את הכללת נתונים לא מדויקים בתרשים הידע שלך (בניגוד לחדשות ולצהובונים).
  2. הודעת אירוע S3 מעוררת AWS למבדה פונקציה, ששולחת את דלי S3 ואת שם הקובץ ל- an שירות תורים פשוט של אמזון (Amazon SQS) תור. תור First-In-First-Out (FIFO) מוודא שתהליך הטמעת הדוח מבוצע ברצף כדי להפחית את הסבירות להכנסת נתונים כפולים לתוך גרף הידע שלך.
  3. An אמזון EventBridge אירוע מבוסס זמן פועל כל דקה כדי להתחיל את הריצה של פונקציות שלב AWS מכונת מצב באופן אסינכרוני.
  4. מכונת המצב של Step Functions עוברת סדרה של משימות כדי לעבד את המסמך שהועלה על ידי חילוץ מידע מפתח והכנסתו לתוך גרף הידע שלך:
    1. קבל את הודעת התור מאמזון SQS.
    2. הורד את קובץ דוח ה-PDF מאמזון S3, פצל אותו למספר נתחי טקסט קטנים יותר (כ-1,000 מילים) לעיבוד, ואחסן את נתחי הטקסט ב אמזון דינמו.
    3. השתמש ב-Claude v3 Sonnet של Anthropic על Amazon Bedrock כדי לעבד את חלקי הטקסט הראשונים כדי לקבוע את הישות העיקרית שאליה מתייחס הדו"ח, יחד עם תכונות רלוונטיות (כגון תעשייה).
    4. אחזר את נתחי הטקסט מ-DynamoDB ועבור כל נתח טקסט, הפעל פונקציית Lambda כדי לחלץ ישויות (כגון חברה או אדם), והקשר שלה (לקוח, ספק, שותף, מתחרה או מנהל) לישות הראשית באמצעות Amazon Bedrock .
    5. איחוד כל המידע שחולץ.
    6. סנן רעש וישויות לא רלוונטיות (לדוגמה, מונחים גנריים כגון "צרכנים") באמצעות Amazon Bedrock.
    7. השתמש ב-Amazon Bedrock כדי לבצע ביעור על ידי נימוקים באמצעות המידע שחולץ כנגד רשימת הישויות הדומות מגרף הידע. אם הישות לא קיימת, הכנס אותה. אחרת, השתמש בישות שכבר קיימת בגרף הידע. הכנס את כל מערכות היחסים שחולצו.
    8. נקה על ידי מחיקת הודעת תור SQS וקובץ S3.
  5. משתמש ניגש לאפליקציית אינטרנט מבוססת React כדי לצפות במאמרי החדשות שמוסיפים לישות, סנטימנט ונתיב חיבור.
  6. באמצעות אפליקציית האינטרנט, המשתמש מציין את מספר הקפיצות (ברירת מחדל N=2) בנתיב החיבור לניטור.
  7. באמצעות יישום האינטרנט, המשתמש מציין את רשימת הישויות למעקב.
  8. כדי להפיק חדשות בדיוניות, המשתמש בוחר הפק חדשות לדוגמה ליצור 10 מאמרי חדשות פיננסיים לדוגמה עם תוכן אקראי שיוכנסו לתהליך קליטת החדשות. התוכן נוצר באמצעות Amazon Bedrock והוא בדיוני בלבד.
  9. כדי להוריד חדשות ממשיות, המשתמש בוחר הורד את החדשות האחרונות כדי להוריד את החדשות המובילות המתרחשות היום (מופעל על ידי NewsAPI.org).
  10. קובץ החדשות (פורמט TXT) מועלה לדלי S3. שלבים 8 ו-9 מעלים חדשות לדלי S3 באופן אוטומטי, אבל אתה יכול גם לבנות אינטגרציות לספק החדשות המועדף עליך כגון AWS Data Exchange או כל ספק חדשות של צד שלישי כדי לשחרר כתבות חדשות כקבצים לדלי S3. תוכן קובץ נתוני חדשות צריך להיות בפורמט כ <date>{dd mmm yyyy}</date><title>{title}</title><text>{news content}</text>.
  11. הודעת אירוע S3 שולחת את דלי ה-S3 או את שם הקובץ לאמזון SQS (סטנדרטי), אשר מפעילה מספר פונקציות Lambda כדי לעבד את נתוני החדשות במקביל:
    1. השתמש ב-Amazon Bedrock כדי לחלץ ישויות המוזכרות בחדשות יחד עם כל מידע קשור, מערכות יחסים וסנטימנט של הישות המוזכרת.
    2. בדוק מול גרף הידע והשתמש ב-Amazon Bedrock כדי לבצע ביעור על ידי נימוקים באמצעות המידע הזמין מהחדשות ומתוך גרף הידע כדי לזהות את הישות המתאימה.
    3. לאחר איתור הישות, חפש והחזר נתיבי חיבור המתחברים לישויות המסומנות ב INTERESTED=YES בגרף הידע שנמצאים במרחק N=2 קפיצות.
  12. יישום האינטרנט מתרענן אוטומטית כל שנייה אחת כדי לשלוף את הסט העדכני ביותר של חדשות מעובדות להצגה ביישום האינטרנט.

פרוס את אב הטיפוס

אתה יכול לפרוס את פתרון האב-טיפוס ולהתחיל להתנסות בעצמך. אב הטיפוס זמין מ GitHub וכולל פרטים על הדברים הבאים:

  • תנאים מוקדמים לפריסה
  • שלבי פריסה
  • שלבי ניקוי

<br> סיכום

הפוסט הזה הדגים פתרון הוכחה לקונספט כדי לעזור למנהלי תיקים לזהות סיכונים מסדר שני ושלישי מאירועי חדשות, ללא התייחסות ישירה לחברות אחריהם הם עוקבים. על ידי שילוב של גרף ידע של קשרי חברה מורכבים עם ניתוח חדשות בזמן אמת באמצעות AI גנרטיבי, ניתן להדגיש השפעות במורד הזרם, כגון עיכובים בייצור עקב שיהוק ספקים.

למרות שזה רק אב טיפוס, פתרון זה מראה את ההבטחה של גרפי ידע ומודלים של שפה לחיבור נקודות ולהפיק אותות מרעש. טכנולוגיות אלו יכולות לסייע לאנשי מקצוע בתחום ההשקעות על ידי חשיפת סיכונים מהר יותר באמצעות מיפוי מערכות יחסים והיגיון. בסך הכל, זהו יישום מבטיח של מסדי נתונים גרפים ובינה מלאכותית שמצדיק חקירה כדי להגביר את ניתוח ההשקעות וקבלת ההחלטות.

אם הדוגמה הזו של AI יצירתי בשירותים פיננסיים מעניינת את העסק שלך, או שיש לך רעיון דומה, פנה למנהל החשבון שלך ב-AWS, ונשמח להמשיך ולחקור איתך.


על המחבר

Xan Huang הוא אדריכל פתרונות בכיר עם AWS ובסיסה בסינגפור. הוא עובד עם מוסדות פיננסיים גדולים כדי לתכנן ולבנות פתרונות מאובטחים, ניתנים להרחבה וזמינים מאוד בענן. מחוץ לעבודה, Xan מבלה את רוב זמנו הפנוי עם משפחתו ובהתמודדות עם בתו בת ה-3. אתה יכול למצוא את Xan על לינקדין.

ספוט_ימג

המודיעין האחרון

ספוט_ימג

דבר איתנו

שלום שם! איך אני יכול לעזור לך?