Platon Data Intelligence.
Pystyhaku ja Ai.

Löydä piilotetut yhteydet rakenteettomasta taloustiedosta Amazon Bedrockin ja Amazon Neptunen | Amazon Web Services

Treffi:

Varallisuudenhoidossa salkunhoitajien on seurattava tarkasti sijoitusuniversuminsa yrityksiä tunnistaakseen riskit ja mahdollisuudet sekä ohjatakseen sijoituspäätöksiä. Suorien tapahtumien, kuten tulosraporttien tai luottoluokituksen alentamisen, seuranta on yksinkertaista – voit määrittää hälytyksiä ilmoittamaan esimiehille yritysten nimiä sisältävistä uutisista. Tavarantoimittajien, asiakkaiden, kumppaneiden tai muiden yrityksen ekosysteemin tahojen tapahtumista aiheutuvien toisen ja kolmannen asteen vaikutusten havaitseminen on kuitenkin haastavaa.

Esimerkiksi toimitusketjun häiriö avaintoimittajalla vaikuttaisi todennäköisesti kielteisesti loppupään valmistajiin. Tai huippuasiakkaan menettäminen suurelle asiakkaalle aiheuttaa kysyntäriskin toimittajalle. Hyvin usein tällaiset tapahtumat eivät pääse otsikoihin, joissa käsitellään suoraan yritystä, johon vaikutus kohdistuu, mutta niihin on silti syytä kiinnittää huomiota. Tässä viestissä esittelemme automatisoidun ratkaisun, jossa yhdistyvät tietokaaviot ja generatiivinen tekoäly (AI) nostaa tällaiset riskit esiin vertaamalla suhdekarttoja reaaliaikaisiin uutisiin.

Yleisesti ottaen tämä sisältää kaksi vaihetta: Ensinnäkin yritysten (asiakkaat, toimittajat, johtajat) välisten monimutkaisten suhteiden rakentaminen tietokaavioksi. Toiseksi tämän kaaviotietokannan käyttäminen generatiivisen tekoälyn kanssa havaitaksesi uutistapahtumien toisen ja kolmannen asteen vaikutukset. Tämä ratkaisu voi esimerkiksi korostaa, että osien toimittajan viiveet voivat häiritä tuotantoketjun loppupään autonvalmistajien tuotantoa, vaikka mihinkään ei viitata suoraan.

AWS:n avulla voit ottaa tämän ratkaisun käyttöön palvelimettomassa, skaalautuvassa ja täysin tapahtumaohjatussa arkkitehtuurissa. Tämä viesti osoittaa konseptin todisteen, joka perustuu kahteen keskeiseen AWS-palveluun, jotka sopivat hyvin graafisen tiedon esittämiseen ja luonnollisen kielen käsittelyyn: Amazonin Neptuuni ja Amazonin kallioperä. Neptune on nopea, luotettava, täysin hallittu graafinen tietokantapalvelu, jonka avulla on helppoa rakentaa ja ajaa sovelluksia, jotka toimivat hyvin yhdistettyjen tietojoukkojen kanssa. Amazon Bedrock on täysin hallittu palvelu, joka tarjoaa valikoiman tehokkaita perusmalleja (FM) johtavilta tekoälyyrityksiltä, ​​kuten AI21 Labs, Anthropic, Cohere, Meta, Stability AI ja Amazon, yhden API:n kautta sekä laajan valikoiman kyky rakentaa luovia tekoälysovelluksia turvallisin, yksityisyyden ja vastuullisen tekoälyn avulla.

Kaiken kaikkiaan tämä prototyyppi esittelee tietokaavioiden ja generatiivisten tekoälyjen mahdollistamaa taitoa – signaalien johtamista yhdistämällä eri pisteitä. Sijoitusammattilaisten ominaisuus on kyky pysyä kehityksen kärjessä lähempänä signaalia ja välttää melua.

Rakenna tietokaavio

Ensimmäinen askel tässä ratkaisussa on tietokaavion rakentaminen, ja arvokas mutta usein huomiotta jäänyt tietolähde tietokaavioille ovat yritysten vuosiraportit. Koska viralliset yritysjulkaisut käydään läpi ennen julkaisua, niiden sisältämät tiedot ovat todennäköisesti tarkkoja ja luotettavia. Vuosiraportit kirjoitetaan kuitenkin jäsentämättömässä muodossa, joka on tarkoitettu ihmisten luettavaksi eikä konekäyttöön. Vapauttaaksesi heidän potentiaalinsa, tarvitset tavan poimia ja jäsentää systemaattisesti niiden sisältämiä tosiasioita ja suhteita.

Generatiivisten tekoälypalvelujen, kuten Amazon Bedrockin, avulla sinulla on nyt mahdollisuus automatisoida tämä prosessi. Voit ottaa vuosiraportin ja käynnistää prosessointiputken, joka käsittelee raportin, jakaa sen pienempiin osiin ja soveltaa luonnollisen kielen ymmärtämistä erottaaksesi tärkeimmät kokonaisuudet ja suhteet.

Esimerkiksi lause, jossa todetaan, että "[Yritys A] laajensi Euroopan sähkötoimituskalustoa tilaamalla 1,800 XNUMX sähköpakettiautoa [yritykseltä B]", antaisi Amazon Bedrockille mahdollisuuden tunnistaa seuraavat asiat:

  • [Yritys A] asiakkaana
  • [Yritys B] toimittajana
  • Toimittajasuhde [Yritys A] ja [Yritys B]
  • Suhdetiedot henkilöstä "sähkökuljetuspakettiautojen toimittaja"

Tällaisten jäsenneltyjen tietojen purkaminen jäsentelemättömistä asiakirjoista edellyttää huolellisesti laadittujen kehotteiden tarjoamista suurille kielimalleille (LLM), jotta ne voivat analysoida tekstiä ja vetää esiin entiteettejä, kuten yrityksiä ja ihmisiä, sekä suhteita, kuten asiakkaita, toimittajia ja paljon muuta. Kehotteet sisältävät selkeät ohjeet siitä, mitä on huomioitava ja mihin rakenteeseen tiedot palautetaan. Toistamalla tämä prosessi koko vuosiraportin ajan voit poimia asiaankuuluvat entiteetit ja suhteet rakentaaksesi rikkaan tietograafin.

Ennen kuin siirrät poimitut tiedot tietograafiin, sinun on ensin tehtävä yksiselitteiset kokonaisuudet. Esimerkiksi tietokaaviossa voi jo olla toinen [Yritys A] -entiteetti, mutta se voi edustaa eri organisaatiota samalla nimellä. Amazon Bedrock voi perustella ja verrata attribuutteja, kuten liiketoiminnan painopistealuetta, toimialaa ja tuloja tuottavia toimialoja ja suhteita muihin kokonaisuuksiin määrittääkseen, ovatko nämä kaksi kokonaisuutta todella erillisiä. Tämä estää etuyhteydettömien yritysten epätarkan yhdistämisen yhdeksi kokonaisuudeksi.

Kun yksiselitteisyys on valmis, voit luotettavasti lisätä uusia kokonaisuuksia ja suhteita Neptune-tietokaavioosi rikastamalla sitä vuosikertomuksista poimituilla faktoilla. Ajan mittaan luotettavan tiedon kerääminen ja luotettavampien tietolähteiden integrointi auttaa rakentamaan kattavan tietokaavion, joka voi tukea paljastavia oivalluksia kaaviokyselyjen ja analytiikan avulla.

Tämä generatiivisen tekoälyn mahdollistama automaatio mahdollistaa tuhansien vuosiraporttien käsittelyn ja avaa arvokkaan resurssin tietograafin kuratointiin, joka muuten jääisi käyttämättä, koska manuaalinen työ vaatii kohtuuttoman paljon.

Seuraava kuvakaappaus näyttää esimerkin visuaalisesta tutkimisesta, joka on mahdollista Neptune-graafitietokannassa käyttämällä Graph Explorer työkalu.

Käsittele uutisartikkeleita

Ratkaisun seuraava askel on automaattisesti rikastuttaa salkunhoitajien uutissyötteitä ja korostaa heidän kiinnostuksen kohteidensa ja sijoituskohteidensa kannalta tärkeitä artikkeleita. Salkunhoitajat voivat tilata uutissyötteen minkä tahansa kolmannen osapuolen uutispalvelun kautta AWS-tiedonvaihto tai jokin muu valitsemansa uutissovellusliittymä.

Kun uutisartikkeli saapuu järjestelmään, sisällön käsittelyyn vedetään käsittelyputki. Amazon Bedrockia käytetään vuosiraporttien käsittelyn kaltaisia ​​tekniikoita käyttäen poimimaan uutisartikkelista entiteetit, attribuutit ja suhteet, joita sitten käytetään erottamaan tietokaaviosta vastaava kokonaisuus tietokaaviossa.

Tietograafi sisältää yritysten ja ihmisten välisiä yhteyksiä, ja linkittämällä artikkelikokonaisuudet olemassa oleviin solmuihin voit tunnistaa, onko aiheita kahden hypyn päässä niistä yrityksistä, joihin salkunhoitaja on sijoittanut tai joista salkunhoitaja on kiinnostunut. Tällaisen yhteyden löytäminen osoittaa Artikkeli voi olla merkityksellinen salkunhoitajalle, ja koska taustalla olevat tiedot esitetään tietokaaviossa, se voidaan visualisoida auttamaan salkunhoitajaa ymmärtämään, miksi ja miten tämä konteksti on merkityksellinen. Portfolioon liittyvien yhteyksien tunnistamisen lisäksi voit käyttää Amazon Bedrockia myös mielipideanalyysin tekemiseen viitatuille kokonaisuuksille.

Lopputuloksena on rikastettu uutissyöte, joka tuo esiin artikkeleita, jotka todennäköisesti vaikuttavat salkunhoitajan kiinnostusalueisiin ja sijoituksiin.

Ratkaisun yleiskatsaus

Ratkaisun kokonaisarkkitehtuuri näyttää seuraavalta kaaviolta.

Työnkulku koostuu seuraavista vaiheista:

  1. Käyttäjä lataa viralliset raportit (PDF-muodossa) osoitteeseen Amazonin yksinkertainen tallennuspalvelu (Amazon S3) ämpäri. Raporttien tulee olla virallisesti julkaistuja raportteja, jotta minimoidaan virheellisten tietojen sisällyttäminen tietokaavioosi (toisin kuin uutiset ja tabloidit).
  2. S3-tapahtumailmoitus kutsuu AWS Lambda -toiminto, joka lähettää S3-säihön ja tiedoston nimen an Amazonin yksinkertainen jonopalvelu (Amazon SQS) -jonossa. FIFO (First-In-First-Out) -jono varmistaa, että raporttien käsittelyprosessi suoritetaan peräkkäin, mikä vähentää todennäköisyyttä, että tietokaavioon lisätään päällekkäisiä tietoja.
  3. An Amazon EventBridge aikaperusteinen tapahtuma suoritetaan joka minuutti käynnistääkseen ajon AWS-vaihetoiminnot tilakone asynkronisesti.
  4. Step Functions -tilakone suorittaa joukon tehtäviä käsitelläkseen ladatun asiakirjan poimimalla keskeiset tiedot ja lisäämällä ne tietokaavioosi:
    1. Vastaanota jonoviesti Amazon SQS:ltä.
    2. Lataa PDF-raporttitiedosto Amazon S3:sta, jaa se useiksi pienemmiksi tekstikappaleiksi (noin 1,000 XNUMX sanaa) käsittelyä varten ja tallenna tekstikappaleet Amazon DynamoDB.
    3. Käytä Anthropicin Claude v3 Sonnettia Amazon Bedrockissa käsitelläksesi muutaman ensimmäisen tekstikappaleen määrittääksesi pääkokonaisuuden, johon raportti viittaa, sekä asiaankuuluvat attribuutit (kuten toimiala).
    4. Hae tekstipalat DynamoDB:stä ja kutsu jokaiselle tekstipalalle Lambda-funktio poimimaan kokonaisuudet (kuten yritys tai henkilö) ja sen suhteen (asiakas, toimittaja, kumppani, kilpailija tai johtaja) pääkokonaisuuteen Amazon Bedrockin avulla. .
    5. Yhdistä kaikki poimitut tiedot.
    6. Suodata melu ja asiaankuulumattomat kokonaisuudet (esimerkiksi yleistermit, kuten "kuluttajat") käyttämällä Amazon Bedrockia.
    7. Käytä Amazon Bedrockia yksiselitteisyyden tekemiseen perustelemalla poimittuja tietoja tietokaavion samankaltaisten entiteettien luetteloa vastaan. Jos entiteettiä ei ole olemassa, lisää se. Muussa tapauksessa käytä tietokaaviossa jo olevaa entiteettiä. Lisää kaikki puretut suhteet.
    8. Puhdista poistamalla SQS-jonoviesti ja S3-tiedosto.
  5. Käyttäjä käyttää React-pohjaista verkkosovellusta tarkastellakseen uutisartikkeleita, jotka on täydennetty entiteetti-, mielipide- ja yhteyspolkutiedoilla.
  6. Web-sovellusta käyttämällä käyttäjä määrittää hyppyjen määrän (oletus N=2) valvottavalla yhteyspolulla.
  7. Verkkosovelluksen avulla käyttäjä määrittää luettelon seurattavista entiteeteista.
  8. Luodakseen fiktiivisiä uutisia käyttäjä valitsee Luo esimerkkiuutisia luoda 10 esimerkkiä talousuutisten artikkelista satunnaisella sisällöllä syötettäväksi uutisten käsittelyprosessiin. Sisältö on luotu Amazon Bedrockin avulla ja se on puhtaasti kuvitteellista.
  9. Käyttäjä valitsee todellisten uutisten lataamisen Lataa viimeisimmät uutiset ladataksesi tämän päivän tärkeimmät uutiset (NewsAPI.org:n avulla).
  10. Uutistiedosto (TXT-muoto) ladataan S3-ämpäriin. Vaiheet 8 ja 9 lataavat uutiset S3-säilöön automaattisesti, mutta voit myös rakentaa integraatioita haluamaasi uutistoimittajaan, kuten AWS Data Exchange -palveluun tai mihin tahansa kolmannen osapuolen uutispalveluntarjoajaan pudottaaksesi uutisartikkeleita tiedostoina S3-säilöön. Uutisdatatiedoston sisältö tulee muotoilla muotoon <date>{dd mmm yyyy}</date><title>{title}</title><text>{news content}</text>.
  11. S3-tapahtumailmoitus lähettää S3-säihön tai tiedostonimen Amazon SQS:lle (standardi), joka kutsuu useita Lambda-toimintoja käsittelemään uutistietoja rinnakkain:
    1. Käytä Amazon Bedrockia poimiaksesi uutisissa mainitut entiteetit sekä kaikki mainittuun kokonaisuuteen liittyvät tiedot, suhteet ja tunteet.
    2. Vertaa tietoja tietokaavioon ja käytä Amazon Bedrockia tehdäksesi yksiselitteisyyden perustelemalla uutisista ja tietokaaviosta saatavilla olevaa tietoa vastaavan kokonaisuuden tunnistamiseksi.
    3. Kun entiteetti on paikannettu, etsi ja palauta kaikki yhteyspolut, jotka muodostavat yhteyden merkillä merkittyihin entiteeteihin INTERESTED=YES tietokaaviossa, jotka ovat N=2 hypyn päässä.
  12. Verkkosovellus päivittyy automaattisesti sekunnin välein, jotta se hakee uusimmat käsitellyt uutiset näytettäväksi verkkosovelluksessa.

Ota prototyyppi käyttöön

Voit ottaa prototyyppiratkaisun käyttöön ja aloittaa kokeilun itse. Prototyyppi on saatavilla osoitteesta GitHub ja sisältää tiedot seuraavista:

  • Käyttöönoton edellytykset
  • Käyttöönottovaiheet
  • Puhdistusvaiheet

Yhteenveto

Tämä viesti osoitti proof of concept -ratkaisun, joka auttaa salkunhoitajia havaitsemaan uutistapahtumien toisen ja kolmannen asteen riskit ilman suoria viittauksia seuraamiinsa yrityksiin. Yhdistämällä monimutkaisten yrityssuhteiden tietokaavion reaaliaikaiseen uutisanalyysiin generatiivisen tekoälyn avulla voidaan korostaa loppupään vaikutuksia, kuten toimittajan hikoilun aiheuttamia tuotantoviiveitä.

Vaikka se on vain prototyyppi, tämä ratkaisu näyttää lupauksen tietokaavioista ja kielimalleista pisteiden yhdistämiseksi ja signaalien johtamiseksi kohinasta. Nämä tekniikat voivat auttaa sijoitusammattilaisia ​​paljastamalla riskit nopeammin suhteiden kartoittamisen ja perustelun avulla. Kaiken kaikkiaan tämä on lupaava graafitietokantojen ja tekoälyn sovellus, joka ansaitsee tutkimisen investointianalyysin ja päätöksenteon lisäämiseksi.

Jos tämä esimerkki generatiivisesta tekoälystä rahoituspalveluissa kiinnostaa yritystäsi tai sinulla on samanlainen idea, ota yhteyttä AWS-asiakasvastaavaasi, niin tutkimme mielellämme lisää kanssasi.


kirjailijasta

Xan Huang on AWS:n vanhempi ratkaisuarkkitehti ja sijaitsee Singaporessa. Hän työskentelee suurten rahoituslaitosten kanssa suunnitella ja rakentaa turvallisia, skaalautuvia ja erittäin saatavilla olevia ratkaisuja pilveen. Työn ulkopuolella Xan viettää suurimman osan vapaa-ajastaan ​​perheensä kanssa ja 3-vuotiaan tyttärensä ohjaamana. Löydät Xanin osoitteesta LinkedIn.

spot_img

Uusin älykkyys

spot_img

Keskustele kanssamme

Hei siellä! Kuinka voin olla avuksi?