Platon Data Intelligence.
Pystyhaku ja Ai.

Rakenna hyvin suunniteltuja IDP-ratkaisuja mukautetulla linssillä – Osa 6: Kestävä kehitys | Amazon Web Services

Treffi:

Älykäs asiakirjankäsittelyprojekti (IDP) yhdistää tyypillisesti optisen merkintunnistuksen (OCR) ja luonnollisen kielen käsittelyn (NLP) asiakirjojen automaattiseen lukemiseen ja ymmärtämiseen. Asiakkaat kaikilla toimialoilla suorittavat IDP-työkuormia AWS:ssä tuottaakseen liikearvoa automatisoimalla käyttötapauksia, kuten KYC-lomakkeita, veroasiakirjoja, laskuja, vakuutuskorvauksia, toimitusraportteja, varastoraportteja ja paljon muuta. IDP-työnkulut AWS:ssä voivat auttaa sinua poimimaan liiketoimintatietoja asiakirjoistasi, vähentämään manuaalista työtä ja käsittelemään asiakirjoja nopeammin ja tarkemmin.

Tuotantovalmis IDP-ratkaisun rakentaminen pilveen vaatii joukon kompromisseja kustannusten, saatavuuden, käsittelynopeuden ja kestävyyden välillä. Tämä viesti tarjoaa ohjeita ja parhaita käytäntöjä IDP-työnkulun kestävyyden parantamiseen käyttämällä Amazonin teksti, Amazonin käsitys, ja IDP hyvin suunniteltu mukautettu linssi.

- Hyvin suunniteltu AWS-kehys auttaa sinua ymmärtämään AWS-työkuormien rakentamisen aikana tehtyjen päätösten hyödyt ja riskit. The Hyvin suunnitellut AWS-objektiivit täydentää hyvin suunniteltua viitekehystä toimiala-, toimialue- tai työnkulkukohtaisemmalla sisällöllä. Käyttämällä Well-Architected Frameworkia ja IDP Well-Architected Custom Lens -objektiivia opit toiminnallisista ja arkkitehtonisista parhaista käytännöistä luotettavien, turvallisten, tehokkaiden, kustannustehokkaiden ja kestävien työkuormien suunnittelussa ja käyttämisessä pilvessä.

IDP:n hyvin suunniteltu mukautettu linssi antaa sinulle ohjeita siitä, miten voit vastata yleisiin haasteisiin IDP-työnkuluissa, joita näemme kentällä. Vastaamalla joukkoon kysymyksiä Hyvin suunniteltu työkalu, voit tunnistaa mahdolliset riskit ja puuttua niihin noudattamalla parannus suunnitelma.

Tämä viesti keskittyy IDP:n mukautetun linssin kestävän kehityksen pilariin. Kestävän kehityksen pilari keskittyy ratkaisun suunnitteluun ja toteuttamiseen työtaakan ympäristövaikutusten minimoimiseksi ja jätteen minimoimiseksi noudattamalla seuraavia suunnitteluperiaatteita: ymmärrä vaikutuksesi, maksimoi resurssien käyttö ja käytä hallittuja palveluita sekä ennakoi muutosta ja valmistaudu parannuksiin. Nämä periaatteet auttavat sinua pysymään keskittyneenä, kun sukellat painopistealueille: liiketulosten saavuttamiseen kestävää kehitystä silmällä pitäen, tietojesi ja sen elinkaarien tehokkaaseen hallintaan sekä jatkuvaan parantamiseen ja jatkuvaan parantamiseen.

Pääperiaatteemme

Kestävän kehityksen pilari keskittyy ratkaisun suunnitteluun ja toteuttamiseen seuraavien suunnitteluperiaatteiden mukaisesti:

  • Ymmärrä vaikutuksesi – Mittaa IDP-työkuormasi kestävyysvaikutuksia ja mallinna työkuormasi tuleva vaikutus. Sisällytä kaikki vaikutuslähteet, mukaan lukien tuotteidesi asiakkaiden käytön vaikutukset. Tämä sisältää myös IDP:n vaikutuksen, joka mahdollistaa digitalisoinnin ja antaa yrityksellesi tai asiakkaille mahdollisuuden suorittaa paperittomia prosesseja. Luo keskeisiä suorituskykyindikaattoreita (KPI) IDP-työkuormituksellesi arvioidaksesi tapoja parantaa tuottavuutta ja tehokkuutta samalla kun vähennät ympäristövaikutuksia.
  • Maksimoi resurssien käyttö ja käytä hallittuja palveluita – Minimoi käyttämättömät resurssit, käsittely ja tallennus vähentääksesi IDP-työkuorman suorittamiseen tarvittavaa kokonaisenergiaa. AWS toimii mittakaavassa, joten palvelujen jakaminen laajalle asiakaskunnalle auttaa maksimoimaan resurssien käytön, mikä maksimoi energiatehokkuuden ja vähentää IDP-työkuormien tukemiseen tarvittavan infrastruktuurin määrää. AWS-hallittujen palveluiden avulla voit minimoida IDP-työkuormasi vaikutukset laskemiseen, verkkoon ja tallennustilaan.
  • Ennakoi muutos ja valmistaudu parannuksiin – Ennakoi muutoksia ja tue kumppanisi ja toimittajasi tekemiä alkuvaiheen parannuksia auttaakseen sinua vähentämään IDP-työkuormien vaikutusta. Seuraa ja arvioi jatkuvasti uusia, tehokkaampia laitteisto- ja ohjelmistotarjontaa. Suunnittelu on joustavaa, mikä pienentää muutosten käyttöönoton esteitä ja mahdollistaa uusien tehokkaiden teknologioiden nopean käyttöönoton.

Kohdennusalueet

Kestävän kehityksen pilarin suunnitteluperiaatteet ja parhaat käytännöt perustuvat asiakkailtamme ja IDP:n teknisiltä asiantuntijayhteisöiltämme kerättyihin oivalluksiin. Voit käyttää niitä ohjeena suunnittelupäätösten tueksi ja sovittaa IDP-ratkaisusi liiketoiminta- ja kestävän kehityksen vaatimuksiin.

Seuraavat ovat IDP-ratkaisujen kestävyyden painopistealueita pilvessä: saavuta liiketoimintatuloksia kestävää kehitystä silmällä pitäen, hallitse tehokkaasti tietojasi ja sen elinkaaria sekä ole valmis jatkuvaan parantamiseen ja aja sitä eteenpäin.

Saavuta liiketoimintatuloksia kestävää kehitystä ajatellen

Suosittelemme seuraavia vaiheita määrittääksesi parhaat alueet yrityksesi tarpeisiin ja kestävyystavoitteisiin:

  • Arvioi ja listaa mahdollisia alueita – Aloita valitsemalla potentiaaliset alueet työkuormituksellesi yrityksesi vaatimusten mukaan, mukaan lukien vaatimustenmukaisuus, maksaa, ja latenssi. Uudemmat palvelut ja ominaisuudet otetaan käyttöön alueilla vähitellen. Viitata Luettelo saatavilla olevista AWS-palveluista alueittain tarkistaaksesi, millä alueilla on IDP-työkuormasi suorittamiseen tarvittavat palvelut ja ominaisuudet.
  • Valitse alue, joka käyttää 100 % uusiutuvaa energiaa – Valitse suosikkilistastasi alueet, jotka ovat lähellä Amazonin uusiutuvan energian hankkeita ja Alueet, joissa vuonna 2022 sähkönkulutus oli 100 % uusiutuvaa energiaa. Perustuu Kasvihuonekaasuja (GHG) koskeva pöytäkirja, on kaksi tapaa seurata sähköntuotannon päästöjä: markkina- ja sijaintiperusteinen. Yritykset voivat valita jonkin näistä menetelmistä kestävän kehityksen politiikkansa perusteella seuratakseen ja vertaillakseen päästöjään vuodesta toiseen. Amazon käyttää markkinapohjainen malli päästöjemme raportoimiseksi. Pienennä hiilijalanjälkeäsi valitsemalla Alue, jossa vuonna 2022 sähkönkulutus oli 100 % uusiutuvaa energiaa.

Hallitse tehokkaasti tietojasi ja niiden elinkaaria

Datalla on keskeinen rooli koko IDP-ratkaisussasi. Alkaen ensimmäisestä tiedonkeruusta, tiedot viedään käsittelyn eri vaiheiden läpi ja lopulta palautetaan ulostulona loppukäyttäjille. On tärkeää ymmärtää, miten tiedonhallinnan valinnat vaikuttavat IDP-ratkaisuun ja sen kestävyyteen. Tietojen tehokas tallentaminen ja käyttäminen sekä käyttämättömien tallennusresurssien vähentäminen johtaa tehokkaampaan ja kestävämpään arkkitehtuuriin. Kun harkitset erilaisia ​​tallennusmekanismeja, muista, että teet kompromisseja resurssitehokkuuden, käyttöviiveen ja luotettavuuden välillä. Tämä tarkoittaa, että sinun on valittava hallintamallisi vastaavasti. Tässä osiossa käsittelemme joitakin tiedonhallinnan parhaita käytäntöjä.

Luo ja käytä vain olennaista dataa

Optimoi tallennustilan jalanjälkesi kestävän kehityksen vuoksi arvioimalla, mitä tietoja tarvitaan liiketoimintatavoitteidesi saavuttamiseksi, ja luomalla ja käsittelemällä vain olennaista dataa IDP-työnkulussasi.

Tallenna vain asiaankuuluvat tiedot

Kun suunnittelet IDP-työnkulkua, harkitse jokaisessa työnkulun vaiheessa, mitkä välitiedot on tallennettava. Useimmissa IDP-työnkuluissa ei ole tarpeen tallentaa jokaisessa välivaiheessa käytettyjä tai luotuja tietoja, koska ne voidaan toistaa helposti. Kestävyyden parantamiseksi tallenna vain sellaisia ​​tietoja, jotka eivät ole helposti toistettavissa. Jos sinun on tallennettava välituloksia, harkitse, täyttävätkö ne elinkaarisäännöt, jotka arkistoivat ja poistavat ne nopeammin kuin tiedot, joilla on tiukemmat säilytysvaatimukset.

Säilytä tietoja eri laskentaympäristöissä, kuten kehitys- ja vaiheistusympäristöissä. Ota käyttöön mekanismeja tietojen elinkaaren hallintaprosessin toteuttamiseksi, mukaan lukien arkistointi ja poistaminen, sekä jatkuvasti tunnistamaan ja poistamaan käyttämättömät tiedot.

Tietojen keräämisen ja tallennuksen optimoimiseksi harkitse optimaalista datan resoluutiota, joka tyydyttää käyttötarkoituksen. Amazon Textract vaatii vähintään 150 DPI. Jos asiakirjasi ei ole tuetussa Amazon Textract -muodossa (PDF, TIFF, JPEG ja PNG) ja sinun on muutettava se, kokeile löytääksesi optimaalinen resoluutio parhaan tuloksen saavuttamiseksi sen sijaan, että valitset enimmäisresoluutioa.

Käytä oikeaa tekniikkaa tietojen tallentamiseen

IDP-työnkuluissa suurin osa tiedoista on todennäköisesti asiakirjoja. Amazonin yksinkertainen tallennuspalvelu (Amazon S3) on objektitallennus, joka on suunniteltu tallentamaan ja hakemaan minkä tahansa määrän tietoa mistä tahansa, joten se sopii hyvin IDP-työnkulkuihin. Erilaisten Amazon S3 -tallennustasojen käyttäminen on keskeinen osa varastoinnin optimointi kestävää kehitystä varten.

Kun harkitset erilaisia ​​tallennusmekanismeja, muista, että teet kompromisseja resurssitehokkuuden, käyttöviiveen ja luotettavuuden välillä. Tämä tarkoittaa, että sinun on valittava hallintamallisi vastaavasti. Tallentamalla vähemmän haihtuvaa tietoa teknologioihin, jotka on suunniteltu tehokkaaseen pitkäaikaiseen varastointiin, voit optimoida tallennustilan jalanjälkesi. Jos haluat arkistoida tietoja tai tallentaa hitaasti muuttuvia tietoja, Amazon S3 -jäätikkö ja Amazon S3 Glacier Deep Archive ovat saatavilla. Tietojen luokittelusta ja työnkulusta riippuen voit valita Amazon S3 One Zone-IA:n, joka vähentää tehoa ja palvelimen kapasiteettia tallentamalla tietoja yhdelle Saatavuusalueelle.

Hallitse aktiivisesti datasi elinkaaria kestävän kehityksen tavoitteidesi mukaisesti

Tietojesi elinkaaren hallinta tarkoittaa tallennustilan optimointia. IDP-työnkuluissa määritä ensin tietojen säilytysvaatimukset. Luo säilytysvaatimustesi perusteella Amazon S3 Lifecycle -kokoonpanot joka siirtää objektit automaattisesti eri tallennusluokkaan ennalta määritettyjen sääntöjen perusteella. Käytä tiedoilla, joilla ei ole säilytysvaatimuksia ja joiden käyttötavat ovat tuntemattomia tai muuttuvia Amazon S3 Intelligent-Tiering valvoa pääsymalleja ja siirtää objekteja automaattisesti tasojen välillä.

Optimoi tallennustilaa jatkuvasti käyttämällä oikeita työkaluja

Ajan myötä IDP-työnkulun datankäyttö ja pääsymalli voivat muuttua. Työkalut kuten Amazon S3 -linssi antaa näkyvyyttä tallennustilan käyttö- ja aktiviteettitrendeistä ja jopa tehdä parannussuosituksia. Voit käyttää näitä tietoja vähentämään edelleen tietojen tallentamisen ympäristövaikutuksia.

Ota data käyttöön ja laske läheisyys

Kun saat IDP-työnkulkusi useammille asiakkaille, verkon yli kulkevan tiedon määrä kasvaa. Vastaavasti mitä suurempi data on ja mitä pitempi matka paketin täytyy kulkea, sitä enemmän resursseja tarvitaan sen lähettämiseen.

Verkon kautta lähetettävän tiedon määrän vähentäminen ja paketin kulkeman polun optimointi tehostaa tiedonsiirtoa. Tietojen tallennuksen asettaminen lähelle tietojenkäsittelyä auttaa optimoimaan kestävyyden verkkokerroksessa. Varmista, että tietojen tallentamiseen käytetty alue on sama alue, jossa IDP-työnkulku on otettu käyttöön. Tämä lähestymistapa auttaa minimoimaan tietojen siirtämiseen laskentaympäristöön kuluvan ajan ja kustannukset.

Ole valmis jatkuvaan parantamiseen ja aja siihen

IDP-työnkulun kestävyyden parantaminen on jatkuva prosessi, joka vaatii joustavia arkkitehtuureja ja automaatiota pienempien, toistuvien parannusten tukemiseen. Kun arkkitehtuurisi on löyhästi kytketty ja käyttää palvelimettomia ja hallittuja palveluita, voit ottaa uudet ominaisuudet käyttöön vaikeuksitta ja vaihtaa komponentteja parantaaksesi kestävyyttä ja tehostaaksesi suorituskykyä. Tässä osiossa jaamme joitain parhaita käytäntöjä.

Paranna turvallisesti ja jatkuvasti automaation avulla

Automatisoinnin käyttäminen kaikkien muutosten käyttöönotossa vähentää inhimillisten virheiden mahdollisuutta ja antaa sinun testata ennen tuotantomuutosten tekemistä varmistaaksesi, että suunnitelmasi ovat valmiit. Automatisoi ohjelmistojen toimitusprosessi käyttämällä jatkuvaa integrointia ja jatkuvaa toimitusta (CI/CD) testataksesi ja ottaaksesi käyttöön mahdollisia parannuksia vähentääksesi vaivaa ja rajoittaaksesi manuaalisten prosessien aiheuttamia virheitä. Määrittele muutokset käyttämällä infrastruktuuria koodina (IaC): kaikki konfiguraatiot tulee määrittää deklaratiivisesti ja tallentaa lähteen ohjausjärjestelmään, kuten AWS CodeCommit, aivan kuten sovelluskoodi. Infrastruktuurin käyttöönoton, organisoinnin ja käyttöönoton pitäisi myös tukea IaC:tä.

Käytä palvelimettomia palveluita työnkulun järjestämiseen

IDP-työnkuluille on tyypillistä korkeat huiput ja toimettomuusjaksot (kuten työajan ulkopuolella), ja niitä ohjaavat enimmäkseen tapahtumat (esimerkiksi kun uusi asiakirja ladataan). Tämä tekee niistä sopivan palvelimettomiin ratkaisuihin. AWS-palvelimettomat palvelut voivat auttaa sinua rakentamaan skaalautuvan ratkaisun IDP-työnkulkuihin nopeasti ja kestävästi. Palvelut, kuten AWS Lambda, AWS-vaihetoiminnotja Amazon EventBridge auttaa järjestämään tapahtumien ohjaamaa työnkulkuasi ja minimoimaan käyttämättömät resurssit kestävän kehityksen parantamiseksi.

Käytä tapahtumalähtöistä arkkitehtuuria

Käyttämällä AWS-palvelimettomia palveluita tapahtumalähtöisen lähestymistavan toteuttamiseen voit rakentaa skaalautuvat, vikasietoiset IDP-työnkulut ja minimoi käyttämättömät resurssit.

Voit esimerkiksi määrittää Amazon S3:n aloittamaan uuden työnkulun, kun uusi asiakirja ladataan. Amazon S3 voi laukaista EventBridgen tai kutsua Lambda-toiminnon käynnistääkseen Amazon Textract -tunnistustyön. Voit käyttää Amazonin yksinkertainen ilmoituspalvelu (Amazon SNS) aiheita tapahtumien fanoutiin tai työn valmistumisviestien lähettämiseen. Voit käyttää Amazonin yksinkertainen jonopalvelu (Amazon SQS) luotettavaa ja kestävää tiedonsiirtoa varten mikropalvelujen välillä, kuten Lambda-toiminnon kutsuminen Amazon Textract -tulosteen lukemiseen ja sitten mukautetun Amazon Comprehend -luokittimen kutsuminen asiakirjan luokittamiseksi.

Käytä hallinnoituja palveluita, kuten Amazon Textract ja Amazon Comprehend

Voit suorittaa IDP:n käyttämällä itseisännöityä mukautettua mallia tai hallinnoituja palveluita, kuten Amazon Textract ja Amazon Comprehend. Käyttämällä hallittuja palveluita mukautetun mallisi sijaan voit vähentää mukautetun mallisi kehittämiseen, kouluttamiseen ja uudelleenkouluttamiseen tarvittavaa vaivaa. Hallitut palvelut käyttävät yhteisiä resursseja, mikä vähentää IDP-ratkaisun rakentamiseen ja ylläpitoon tarvittavaa energiaa ja parantaa kestävyyttä.

Tarkista AWS-blogiviestit pysyäksesi ajan tasalla ominaisuuspäivityksistä

Saatavilla on useita blogikirjoituksia ja resursseja, joiden avulla pysyt ajan tasalla AWS-ilmoituksista ja saat tietoa uusista ominaisuuksista, jotka voivat parantaa IDP-työkuormaa.
AWS re:Post on yhteisölähtöinen Q&A-palvelu, joka on suunniteltu auttamaan AWS-asiakkaita poistamaan teknisiä tiesulkuja, nopeuttamaan innovaatioita ja tehostamaan toimintaa. AWS re:Postissa on yli 40 aihetta, mukaan lukien AWS Well-Architectedille omistautunut yhteisö. AWS:llä on myös palvelukohtaisia ​​blogeja, jotka auttavat sinua pysy ajan tasalla Amazon Textractista ja Amazonin käsitys.

Yhteenveto

Tässä viestissä jaoimme suunnitteluperiaatteet, painopistealueet ja parhaat käytännöt kestävyyden optimoimiseksi IDP-työnkulussasi. Lisätietoja kestävyydestä pilvessä on seuraavassa sarjassa AWS-infrastruktuurin optimointi kestävää kehitystä varten, osa I: Laske, Osa II: Varastointija Osa III: Verkottuminen.

AWS on sitoutunut IDP Well-Architected Lens -objektiiviin elävänä työkaluna. IDP-ratkaisujen ja niihin liittyvien AWS-AI-palveluiden kehittyessä ja kun uusia AWS-palveluita tulee saataville, päivitämme IDP:n hyvin arkkitehtuurin linssin vastaavasti.

Jos haluat aloittaa IDP:n käytön AWS:ssä, katso Ohjeet älykkääseen asiakirjojen käsittelyyn AWS:ssä suunnitella ja rakentaa IDP-sovelluksesi. Jos haluat sukeltaa syvemmälle päästä päähän -ratkaisuihin, jotka kattavat tietojen vastaanottamisen, luokittelun, poiminnan, rikastamisen, todentamisen ja validoinnin sekä kulutuksen, katso Älykäs asiakirjojen käsittely AWS AI -palveluilla: Osa 1 ja Osa 2. Lisäksi, Älykäs asiakirjojen käsittely Amazon Textractin, Amazon Bedrockin ja LangChainin avulla kattaa uuden tai olemassa olevan IDP-arkkitehtuurin laajentamisen suurilla kielimalleilla (LLM). Opit kuinka voit integroida Amazon Textractin kanssa LangChain käytä asiakirjanlataajana Amazonin kallioperä poimia tietoja asiakirjoista ja käyttää generatiivisia tekoälyominaisuuksia IDP-vaiheissa.

Jos tarvitset asiantuntija-apua, ota yhteyttä AWS-tilitiimiisi IDP Specialist Solutions Architectin ottamiseksi.


kirjailijasta

Christian Denich on AWS:n globaali asiakasratkaisupäällikkö. Hän on intohimoinen autoteollisuudesta, AI/ML:stä ja kehittäjien tuottavuudesta. Hän tukee joitakin maailman suurimpia autobrändejä heidän pilvimatkalla, joka kattaa pilvi- ja liiketoimintastrategian sekä teknologian. Ennen AWS:lle tuloaan Christian työskenteli BMW Groupissa sekä laitteisto- että ohjelmistokehityksessä erilaisissa projekteissa, mukaan lukien yhdistetty navigointi.

spot_img

Uusin älykkyys

spot_img

Keskustele kanssamme

Hei siellä! Kuinka voin olla avuksi?