Ευφυής Επεξεργασία Εγγράφων με Υπηρεσίες AWS AI και Analytics στον ασφαλιστικό κλάδο: Μέρος 2

In Μέρος 1 αυτής της σειράς, συζητήσαμε την έξυπνη επεξεργασία εγγράφων (IDP) και πώς το IDP μπορεί να επιταχύνει τις περιπτώσεις χρήσης διεκπεραίωσης αξιώσεων στον ασφαλιστικό κλάδο. Συζητήσαμε πώς μπορούμε να χρησιμοποιήσουμε τις υπηρεσίες AWS AI για την ακριβή κατηγοριοποίηση των εγγράφων αξιώσεων μαζί με τα δικαιολογητικά. Συζητήσαμε επίσης τον τρόπο εξαγωγής διαφόρων τύπων εγγράφων σε ένα πακέτο ασφαλιστικών αποζημιώσεων, όπως έντυπα, πίνακες ή εξειδικευμένα έγγραφα όπως τιμολόγια, αποδείξεις ή έγγραφα ταυτότητας. Εξετάσαμε τις προκλήσεις στις διαδικασίες εγγράφων παλαιού τύπου, οι οποίες είναι χρονοβόρες, επιρρεπείς σε σφάλματα, δαπανηρές και δύσκολες στην επεξεργασία σε κλίμακα, και πώς μπορείτε να χρησιμοποιήσετε τις υπηρεσίες AWS AI για να βοηθήσετε στην υλοποίηση του αγωγού IDP σας.

Σε αυτήν την ανάρτηση, σας καθοδηγούμε σε προηγμένες δυνατότητες IDP για εξαγωγή εγγράφων, ερωτήματα και εμπλουτισμό. Εξετάζουμε επίσης πώς να χρησιμοποιήσουμε περαιτέρω τις εξαγόμενες δομημένες πληροφορίες από τα δεδομένα αξιώσεων για να λάβουμε insights χρησιμοποιώντας το AWS Analytics και τις υπηρεσίες οπτικοποίησης. Τονίζουμε πώς τα εξαγόμενα δομημένα δεδομένα από το IDP μπορούν να βοηθήσουν ενάντια σε δόλιες αξιώσεις που χρησιμοποιούν υπηρεσίες AWS Analytics.

Επισκόπηση λύσεων

Το παρακάτω διάγραμμα απεικονίζει τις φάσεις εάν ο IDP χρησιμοποιεί υπηρεσίες AWS AI. Στο Μέρος 1, συζητήσαμε τις τρεις πρώτες φάσεις της ροής εργασιών IDP. Σε αυτήν την ανάρτηση, επεκτείνουμε το βήμα εξαγωγής και τις υπόλοιπες φάσεις, οι οποίες περιλαμβάνουν την ενοποίηση του IDP με τις υπηρεσίες AWS Analytics.

Χρησιμοποιούμε αυτές τις υπηρεσίες αναλυτικών στοιχείων για περαιτέρω πληροφορίες και οπτικοποιήσεις και για τον εντοπισμό δόλιων αξιώσεων χρησιμοποιώντας δομημένα, κανονικοποιημένα δεδομένα από το IDP. Το παρακάτω διάγραμμα απεικονίζει την αρχιτεκτονική λύσης.

Διάγραμμα αρχιτεκτονικής IDP

Οι φάσεις που συζητάμε σε αυτήν την ανάρτηση χρησιμοποιούν τις ακόλουθες βασικές υπηρεσίες:

Amazon Comprehend Medical είναι μια υπηρεσία επεξεργασίας φυσικής γλώσσας (NLP) που είναι κατάλληλη για HIPAA που χρησιμοποιεί μοντέλα μηχανικής εκμάθησης (ML) που έχουν προεκπαιδευτεί για την κατανόηση και εξαγωγή δεδομένων υγείας από ιατρικό κείμενο, όπως συνταγές, διαδικασίες ή διαγνώσεις.
Κόλλα AWS αποτελεί μέρος της στοίβας υπηρεσιών AWS Analytics και είναι μια υπηρεσία ενοποίησης δεδομένων χωρίς διακομιστή που διευκολύνει τον εντοπισμό, την προετοιμασία και το συνδυασμό δεδομένων για αναλυτικά στοιχεία, ML και ανάπτυξη εφαρμογών.
Amazon RedShift είναι μια άλλη υπηρεσία στη στοίβα του Analytics. Το Amazon Redshift είναι μια πλήρως διαχειριζόμενη υπηρεσία αποθήκης δεδομένων σε κλίμακα petabyte στο cloud.

Προϋποθέσεις

Πριν ξεκινήσετε, ανατρέξτε στο Μέρος 1 για μια επισκόπηση υψηλού επιπέδου της περίπτωσης χρήσης ασφάλισης με IDP και λεπτομέρειες σχετικά με τα στάδια συλλογής και ταξινόμησης δεδομένων.

Για περισσότερες πληροφορίες σχετικά με τα δείγματα κωδικών, ανατρέξτε στο δικό μας Repo GitHub.

Φάση εκχύλισης

Στο Μέρος 1, είδαμε πώς να χρησιμοποιούμε τα Amazon Textract API για την εξαγωγή πληροφοριών όπως φόρμες και πίνακες από έγγραφα και πώς να αναλύουμε τιμολόγια και έγγραφα ταυτότητας. Σε αυτήν την ανάρτηση, βελτιώνουμε τη φάση εξαγωγής με το Amazon Comprehend για να εξαγάγουμε προεπιλεγμένες και προσαρμοσμένες οντότητες ειδικά για περιπτώσεις προσαρμοσμένης χρήσης.

Οι ασφαλιστικοί φορείς συχνά συναντούν πυκνό κείμενο σε αιτήσεις ασφαλιστικών απαιτήσεων, όπως μια συνοπτική επιστολή εξιτηρίου ασθενούς (δείτε την παρακάτω εικόνα παραδείγματος). Μπορεί να είναι δύσκολο να εξαχθούν αυτόματα πληροφορίες από τέτοιους τύπους εγγράφων όπου δεν υπάρχει συγκεκριμένη δομή. Για να το αντιμετωπίσουμε, μπορούμε να χρησιμοποιήσουμε τις ακόλουθες μεθόδους για να εξαγάγουμε βασικές επιχειρηματικές πληροφορίες από το έγγραφο:

Συνοπτικό δείγμα απαλλαγής

Εξαγωγή προεπιλεγμένων οντοτήτων με το Amazon Comprehend DetectEntities API

Εκτελούμε τον ακόλουθο κώδικα στο δείγμα εγγράφου ιατρικής μεταγραφής:

comprehend = boto3.client('comprehend') 

response = comprehend.detect_entities( Text=text, LanguageCode='en')

#print enitities from the response JSON

for entity in response['Entities']:
    print(f'{entity["Type"]} : {entity["Text"]}')

Το ακόλουθο στιγμιότυπο οθόνης δείχνει μια συλλογή οντοτήτων που προσδιορίζονται στο κείμενο εισαγωγής. Η έξοδος συντομεύτηκε για τους σκοπούς αυτής της ανάρτησης. Αναφέρομαι στο GitHub repo για λεπτομερή κατάλογο οντοτήτων.

Εξαγωγή προσαρμοσμένων οντοτήτων με την αναγνώριση προσαρμοσμένων οντοτήτων Amazon Comprehend

Η απάντηση από το DetectEntities Το API περιλαμβάνει τις προεπιλεγμένες οντότητες. Ωστόσο, μας ενδιαφέρει να γνωρίζουμε συγκεκριμένες τιμές οντοτήτων, όπως το όνομα του ασθενούς (που υποδηλώνεται με την προεπιλεγμένη οντότητα PERSON), ή το αναγνωριστικό του ασθενούς (που υποδηλώνεται από την προεπιλεγμένη οντότητα OTHER). Για να αναγνωρίσουμε αυτές τις προσαρμοσμένες οντότητες, εκπαιδεύουμε ένα μοντέλο αναγνώρισης προσαρμοσμένων οντοτήτων Amazon Comprehend. Συνιστούμε να ακολουθήσετε τα αναλυτικά βήματα σχετικά με τον τρόπο εκπαίδευσης και ανάπτυξης ενός προσαρμοσμένου μοντέλου αναγνώρισης οντοτήτων στο Repo GitHub.

Αφού αναπτύξουμε το προσαρμοσμένο μοντέλο, μπορούμε να χρησιμοποιήσουμε τη συνάρτηση βοηθού get_entities() για να ανακτήσετε προσαρμοσμένες οντότητες όπως PATIENT_NAME και PATIENT_D από την απάντηση API:

def get_entities(text):
try:
    #detect entities
    entities_custom = comprehend.detect_entities(LanguageCode="en",
                      Text=text, EndpointArn=ER_ENDPOINT_ARN) 
    df_custom = pd.DataFrame(entities_custom["Entities"], columns = ['Text',  
                'Type', 'Score'])
    df_custom = df_custom.drop_duplicates(subset=['Text']).reset_index()
    return df_custom
except Exception as e:
    print(e)

# call the get_entities() function 
response = get_entities(text) 
#print the response from the get_entities() function
print(response)

Το παρακάτω στιγμιότυπο οθόνης δείχνει τα αποτελέσματά μας.

Φάση εμπλουτισμού

Στη φάση εμπλουτισμού εγγράφων, εκτελούμε λειτουργίες εμπλουτισμού σε έγγραφα που σχετίζονται με την υγειονομική περίθαλψη για να αντλήσουμε πολύτιμες πληροφορίες. Εξετάζουμε τους ακόλουθους τύπους εμπλουτισμού:

Εξαγωγή γλώσσας για συγκεκριμένο τομέα – Χρησιμοποιούμε το Amazon Comprehend Medical για να εξαγάγουμε οντολογίες ιατρικών ειδικών όπως το ICD-10-CM, το RxNorm και το SNOMED CT
Διορθώστε ευαίσθητες πληροφορίες – Χρησιμοποιούμε το Amazon Comprehend για τη διόρθωση στοιχείων προσωπικής ταυτοποίησης (PII) και την έκδοση του Amazon Comprehend Medical για προστατευμένες πληροφορίες υγείας (PHI)

Εξαγωγή ιατρικών πληροφοριών από μη δομημένο ιατρικό κείμενο

Έγγραφα όπως σημειώσεις ιατρικών παρόχων και αναφορές κλινικών δοκιμών περιλαμβάνουν πυκνό ιατρικό κείμενο. Οι φορείς ασφαλιστικών αξιώσεων πρέπει να προσδιορίσουν τις σχέσεις μεταξύ των εξαγόμενων πληροφοριών υγείας από αυτό το πυκνό κείμενο και να τις συνδέσουν με ιατρικές οντολογίες όπως οι κωδικοί ICD-10-CM, RxNorm και SNOMED CT. Αυτό είναι πολύ πολύτιμο για την αυτοματοποίηση των ροών εργασιών καταγραφής, επικύρωσης και έγκρισης απαιτήσεων για τις ασφαλιστικές εταιρείες, προκειμένου να επιταχυνθεί και να απλοποιηθεί η επεξεργασία των απαιτήσεων. Ας δούμε πώς μπορούμε να χρησιμοποιήσουμε το Amazon Comprehend Medical InferICD10CM API για τον εντοπισμό πιθανών ιατρικών παθήσεων ως οντότητες και τη σύνδεσή τους με τους κωδικούς τους:

cm_json_data = comprehend_med.infer_icd10_cm(Text=text)

print("nMedical codingn========")

for entity in cm_json_data["Entities"]:
      for icd in entity["ICD10CMConcepts"]:
           description = icd['Description']
           code = icd["Code"]
           print(f'{description}: {code}')

Για το κείμενο εισαγωγής, το οποίο μπορούμε να περάσουμε από το Amazon Textract DetectDocumentText API, το InferICD10CM Το API επιστρέφει την ακόλουθη έξοδο (η έξοδος έχει συντομευτεί για συντομία).

Εξαγωγή ιατρικών πληροφοριών από μη δομημένο ιατρικό κείμενο

Ομοίως, μπορούμε να χρησιμοποιήσουμε το Amazon Comprehend Medical InferRxNorm API για τον προσδιορισμό των φαρμάκων και του InferSNOMEDCT API για τον εντοπισμό ιατρικών οντοτήτων στα ασφαλιστικά έγγραφα που σχετίζονται με την υγειονομική περίθαλψη.

Εκτελέστε αναγραφή PII και PHI

Τα πακέτα ασφαλιστικών απαιτήσεων απαιτούν μεγάλη συμμόρφωση με το απόρρητο και κανονισμούς, επειδή περιέχουν δεδομένα PII και PHI. Οι ασφαλιστικοί φορείς μπορούν να μειώσουν τον κίνδυνο συμμόρφωσης με την επεξεργασία πληροφοριών όπως αριθμούς συμβολαίου ή το όνομα του ασθενούς.

Ας δούμε ένα παράδειγμα περίληψης εξιτηρίου ασθενούς. Χρησιμοποιούμε το Amazon Comprehend DetectPiiEntities API για τον εντοπισμό οντοτήτων PII εντός του εγγράφου και την προστασία του απορρήτου του ασθενούς με τη διόρθωση αυτών των οντοτήτων:

resp = call_textract(input_document = f's3://{data_bucket}/idp/textract/dr-note-sample.png')
text = get_string(textract_json=resp, output_type=[Textract_Pretty_Print.LINES])

# call Amazon Comprehend Detect PII Entities API
entity_resp = comprehend.detect_pii_entities(Text=text, LanguageCode="en") 

pii = []
for entity in entity_resp['Entities']:
      pii_entity={}
      pii_entity['Type'] = entity['Type']
      pii_entity['Text'] = text[entity['BeginOffset']:entity['EndOffset']]
      pii.append(pii_entity)
print(pii)

Λαμβάνουμε τις ακόλουθες οντότητες PII στην απάντηση από το detect_pii_entities() API :

απάντηση από το API detect_pii_entities().

Στη συνέχεια, μπορούμε να διαγράψουμε τις οντότητες PII που εντοπίστηκαν από τα έγγραφα χρησιμοποιώντας τη γεωμετρία του πλαισίου οριοθέτησης των οντοτήτων από το έγγραφο. Για αυτό, χρησιμοποιούμε ένα βοηθητικό εργαλείο που ονομάζεται amazon-textract-overlayer. Για περισσότερες πληροφορίες, ανατρέξτε στο Κείμενο-Επικάλυψη. Τα ακόλουθα στιγμιότυπα οθόνης συγκρίνουν ένα έγγραφο πριν και μετά τη σύνταξη.

Παρόμοιο με το Amazon Comprehend DetectPiiEntities API, μπορούμε επίσης να χρησιμοποιήσουμε το DetectPHI API για την ανίχνευση δεδομένων PHI στο κλινικό κείμενο που εξετάζεται. Για περισσότερες πληροφορίες, ανατρέξτε στο Ανίχνευση PHI.

Φάση αναθεώρησης και επικύρωσης

Στη φάση ελέγχου και επικύρωσης εγγράφων, μπορούμε πλέον να επαληθεύσουμε εάν το πακέτο αξιώσεων πληροί τις απαιτήσεις της επιχείρησης, επειδή έχουμε όλες τις πληροφορίες που συλλέγονται από τα έγγραφα του πακέτου από προηγούμενα στάδια. Μπορούμε να το κάνουμε αυτό εισάγοντας έναν άνθρωπο στον βρόχο που μπορεί να ελέγξει και να επικυρώσει όλα τα πεδία ή απλώς μια διαδικασία αυτόματης έγκρισης για αξιώσεις χαμηλών δολαρίων πριν στείλει το πακέτο σε μεταγενέστερες εφαρμογές. Μπορούμε να χρησιμοποιήσουμε Amazon Augmented AI (Amazon A2I) για την αυτοματοποίηση της διαδικασίας ανθρώπινης αναθεώρησης για την επεξεργασία ασφαλιστικών απαιτήσεων.

Τώρα που έχουμε εξαχθεί και κανονικοποιήσει όλα τα απαιτούμενα δεδομένα από την επεξεργασία αξιώσεων με χρήση υπηρεσιών AI για IDP, μπορούμε να επεκτείνουμε τη λύση ώστε να ενσωματωθεί με υπηρεσίες AWS Analytics όπως το AWS Glue και το Amazon Redshift για την επίλυση επιπλέον περιπτώσεων χρήσης και την παροχή περαιτέρω αναλυτικών στοιχείων και απεικονίσεων.

Εντοπίστε δόλιες αξιώσεις ασφάλισης

Σε αυτήν την ανάρτηση, εφαρμόζουμε μια αρχιτεκτονική χωρίς διακομιστή όπου τα εξαγόμενα και επεξεργασμένα δεδομένα αποθηκεύονται σε μια λίμνη δεδομένων και χρησιμοποιούνται για τον εντοπισμό δόλιων ασφαλιστικών αξιώσεων με χρήση ML. Χρησιμοποιούμε Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3) για την αποθήκευση των επεξεργασμένων δεδομένων. Στη συνέχεια μπορούμε να χρησιμοποιήσουμε Κόλλα AWS or EMR Αμαζονίου για να καθαρίσετε τα δεδομένα και να προσθέσετε πρόσθετα πεδία για να τα καταστήσετε αναλώσιμα για αναφορές και ML. Μετά από αυτό, χρησιμοποιούμε Amazon Redshift ML για τη δημιουργία ενός μοντέλου ML ανίχνευσης απάτης. Τέλος, χτίζουμε αναφορές χρησιμοποιώντας Amazon QuickSight για να λάβετε πληροφορίες για τα δεδομένα.

Ρύθμιση εξωτερικού σχήματος Amazon Redshift

Για τους σκοπούς αυτού του παραδείγματος, δημιουργήσαμε ένα δείγμα συνόλου δεδομένων το εξομοιώνει την έξοδο μιας διεργασίας ETL (εξαγωγή, μετασχηματισμός και φόρτωση) και χρησιμοποιεί τον κατάλογο δεδομένων AWS Glue ως κατάλογο μεταδεδομένων. Αρχικά, δημιουργούμε μια βάση δεδομένων με το όνομα idp_demo στον Κατάλογο Δεδομένων και καλείται ένα εξωτερικό σχήμα στο Amazon Redshift idp_insurance_demo (δείτε τον παρακάτω κώδικα). Χρησιμοποιούμε ένα Διαχείριση ταυτότητας και πρόσβασης AWS ρόλος (IAM) για τη χορήγηση αδειών στο σύμπλεγμα Amazon Redshift για πρόσβαση στο Amazon S3 και Amazon Sage Maker. Για περισσότερες πληροφορίες σχετικά με τον τρόπο ρύθμισης αυτού του ρόλου IAM με τα λιγότερα προνόμια, ανατρέξτε στο Συγκεντρώστε και διαμορφώστε τη ρύθμιση για τη διαχείριση Amazon Redshift ML.

CREATE EXTERNAL SCHEMA idp_insurance_demo
FROM DATA CATALOG
DATABASE 'idp_demo' 
IAM_ROLE '<<>>'
CREATE EXTERNAL DATABASE IF NOT EXISTS;

Δημιουργία εξωτερικού πίνακα Amazon Redshift

Το επόμενο βήμα είναι να δημιουργήσετε έναν εξωτερικό πίνακα στο Amazon Redshift που θα αναφέρεται στη θέση S3 όπου βρίσκεται το αρχείο. Σε αυτήν την περίπτωση, το αρχείο μας είναι ένα αρχείο κειμένου διαχωρισμένο με κόμματα. Θέλουμε επίσης να παραλείψουμε τη σειρά κεφαλίδας από το αρχείο, η οποία μπορεί να διαμορφωθεί στην ενότητα ιδιότητες πίνακα. Δείτε τον παρακάτω κώδικα:

create external table idp_insurance_demo.claims(id INTEGER,
date_of_service date,
patients_address_city VARCHAR,
patients_address_state VARCHAR,
patients_address_zip VARCHAR,
patient_status VARCHAR,
insured_address_state VARCHAR,
insured_address_zip VARCHAR,
insured_date_of_birth date,
insurance_plan_name VARCHAR,
total_charges DECIMAL(14,4),
fraud VARCHAR,
duplicate varchar,
invalid_claim VARCHAR
)
row format delimited
fields terminated by ','
stored as textfile
location '<<>>'
table properties ( 'skip.header.line.count'='1');

Δημιουργία συνόλων δεδομένων εκπαίδευσης και δοκιμής

Αφού δημιουργήσουμε τον εξωτερικό πίνακα, προετοιμάζουμε το σύνολο δεδομένων μας για ML χωρίζοντάς το σε σετ εκπαίδευσης και σε σύνολο δοκιμών. Δημιουργούμε έναν νέο εξωτερικό πίνακα που ονομάζεται claim_train, που αποτελείται από όλες τις εγγραφές με αναγνωριστικό <= 85000 από τον πίνακα αξιώσεων. Αυτό είναι το σετ εκπαίδευσης στο οποίο εκπαιδεύουμε το μοντέλο ML μας.

CREATE EXTERNAL TABLE
idp_insurance_demo.claims_train
row format delimited
fields terminated by ','
stored as textfile
location '<<>>/train'
table properties ( 'skip.header.line.count'='1')
AS select * from idp_insurance_demo.claims where id <= 850000

Δημιουργούμε έναν άλλο εξωτερικό πίνακα που ονομάζεται claim_test που αποτελείται από όλες τις εγγραφές με αναγνωριστικό >85000 ως το δοκιμαστικό σύνολο στο οποίο δοκιμάζουμε το μοντέλο ML:

CREATE EXTERNAL TABLE
idp_insurance_demo.claims_test
row format delimited
fields terminated by ','
stored as textfile
location '<<>>/test'
table properties ( 'skip.header.line.count'='1')
AS select * from idp_insurance_demo.claims where id > 850000

Δημιουργήστε ένα μοντέλο ML με το Amazon Redshift ML

Τώρα δημιουργούμε το μοντέλο χρησιμοποιώντας το ΔΗΜΙΟΥΡΓΙΑ ΜΟΝΤΕΛΟΥ εντολή (δείτε τον παρακάτω κώδικα). Επιλέγουμε τις σχετικές στήλες από το claims_train πίνακα που μπορεί να καθορίσει μια δόλια συναλλαγή. Ο στόχος αυτού του μοντέλου είναι να προβλέψει την τιμή του fraud στήλη; επομένως, fraud προστίθεται ως στόχος πρόβλεψης. Αφού το μοντέλο εκπαιδευτεί, δημιουργεί μια συνάρτηση με το όνομα insurance_fraud_model. Αυτή η συνάρτηση χρησιμοποιείται για συμπέρασμα κατά την εκτέλεση εντολών SQL για την πρόβλεψη της τιμής του fraud στήλη για νέες εγγραφές.

CREATE MODEL idp_insurance_demo.insurance_fraud_model
FROM (SELECT 
total_charges ,
fraud ,
duplicate,
invalid_claim
FROM idp_insurance_demo.claims_train
)
TARGET fraud
FUNCTION insurance_fraud_model
IAM_ROLE '<<>>'
SETTINGS (
S3_BUCKET '<<>>'
);

Αξιολογήστε τις μετρήσεις του μοντέλου ML

Αφού δημιουργήσουμε το μοντέλο, μπορούμε να εκτελέσουμε ερωτήματα για να ελέγξουμε την ακρίβεια του μοντέλου. Χρησιμοποιούμε το insurance_fraud_model συνάρτηση για την πρόβλεψη της τιμής του fraud στήλη για νέες εγγραφές. Εκτελέστε το ακόλουθο ερώτημα στο claims_test πίνακα για να δημιουργήσετε έναν πίνακα σύγχυσης:

SELECT 
fraud,
idp_insurance_demo.insurance_fraud_model (total_charges ,duplicate,invalid_claim ) as fraud_calculcated,
count(1)
FROM idp_insurance_demo.claims_test
GROUP BY fraud , fraud_calculcated;

Εντοπισμός απάτης χρησιμοποιώντας το μοντέλο ML

Αφού δημιουργήσουμε το νέο μοντέλο, καθώς εισάγονται νέα δεδομένα αξιώσεων στην αποθήκη δεδομένων ή στη λίμνη δεδομένων, μπορούμε να χρησιμοποιήσουμε το insurance_fraud_model λειτουργία για τον υπολογισμό των δόλιων συναλλαγών. Αυτό το κάνουμε φορτώνοντας πρώτα τα νέα δεδομένα σε έναν προσωρινό πίνακα. Στη συνέχεια χρησιμοποιούμε το insurance_fraud_model συνάρτηση για τον υπολογισμό του fraud επισημάνετε για κάθε νέα συναλλαγή και εισαγάγετε τα δεδομένα μαζί με τη σημαία στον τελικό πίνακα, που σε αυτήν την περίπτωση είναι το claims πίνακα.

Οπτικοποιήστε τα δεδομένα αξιώσεων

Όταν τα δεδομένα είναι διαθέσιμα στο Amazon Redshift, μπορούμε να δημιουργήσουμε οπτικοποιήσεις χρησιμοποιώντας το QuickSight. Στη συνέχεια, μπορούμε να μοιραστούμε τους πίνακες εργαλείων QuickSight με επαγγελματίες χρήστες και αναλυτές. Για να δημιουργήσετε τον πίνακα εργαλείων QuickSight, πρέπει πρώτα να δημιουργήσετε ένα σύνολο δεδομένων Amazon Redshift στο QuickSight. Για οδηγίες, ανατρέξτε στο Δημιουργία συνόλου δεδομένων από βάση δεδομένων.

Αφού δημιουργήσετε το σύνολο δεδομένων, μπορείτε να δημιουργήσετε μια νέα ανάλυση στο QuickSight χρησιμοποιώντας το σύνολο δεδομένων. Ακολουθούν μερικά δείγματα αναφορών που δημιουργήσαμε:

Συνολικός αριθμός αξιώσεων ανά πολιτεία, ομαδοποιημένοι κατά το fraud πεδίο – Αυτό το γράφημα μας δείχνει το ποσοστό των δόλιων συναλλαγών σε σύγκριση με τον συνολικό αριθμό συναλλαγών σε μια συγκεκριμένη πολιτεία.
Άθροισμα της συνολικής αξίας σε δολάρια των απαιτήσεων, ομαδοποιημένο κατά το fraud πεδίο – Αυτό το γράφημα μας δείχνει την αναλογία του ποσού των δόλιων συναλλαγών σε δολάρια σε σύγκριση με το συνολικό ποσό των συναλλαγών σε δολάρια σε μια συγκεκριμένη πολιτεία.
Συνολικός αριθμός συναλλαγών ανά ασφαλιστική εταιρεία, ομαδοποιημένος κατά την fraud πεδίο – Αυτό το γράφημα μας δείχνει πόσες αξιώσεις κατατέθηκαν για κάθε ασφαλιστική εταιρεία και πόσες από αυτές είναι δόλιες.

• Συνολικός αριθμός συναλλαγών ανά ασφαλιστική εταιρεία, ομαδοποιημένος με βάση το πεδίο απάτης

Συνολικό άθροισμα δόλιων συναλλαγών ανά πολιτεία που εμφανίζεται σε χάρτη των ΗΠΑ – Αυτό το γράφημα δείχνει απλώς τις δόλιες συναλλαγές και εμφανίζει τις συνολικές χρεώσεις για αυτές τις συναλλαγές ανά κράτος στον χάρτη. Η πιο σκούρα απόχρωση του μπλε υποδηλώνει υψηλότερες συνολικές χρεώσεις. Μπορούμε να το αναλύσουμε περαιτέρω ανά πόλη εντός αυτής της πολιτείας και ταχυδρομικούς κώδικες με την πόλη για να κατανοήσουμε καλύτερα τις τάσεις.

εκκαθάριση

Για να αποφύγετε μελλοντικές χρεώσεις στον λογαριασμό σας AWS, διαγράψτε τους πόρους που παρείχατε στη ρύθμιση ακολουθώντας τις οδηγίες στο Ενότητα καθαρισμού στο αποθετήριο μας.

Συμπέρασμα

Σε αυτή τη σειρά δύο μερών, είδαμε πώς να δημιουργήσουμε έναν αγωγό IDP από άκρο σε άκρο με λίγη ή καθόλου εμπειρία ML. Εξερευνήσαμε μια περίπτωση χρήσης επεξεργασίας αξιώσεων στον ασφαλιστικό κλάδο και πώς το IDP μπορεί να βοηθήσει στην αυτοματοποίηση αυτής της περίπτωσης χρήσης χρησιμοποιώντας υπηρεσίες όπως το Amazon Textract, το Amazon Comprehend, το Amazon Comprehend Medical και το Amazon A2I. Στο Μέρος 1, δείξαμε πώς να χρησιμοποιείτε υπηρεσίες AWS AI για εξαγωγή εγγράφων. Στο Μέρος 2, επεκτείναμε τη φάση εξαγωγής και πραγματοποιήσαμε εμπλουτισμό δεδομένων. Τέλος, επεκτείναμε τα δομημένα δεδομένα που εξήχθησαν από το IDP για περαιτέρω αναλύσεις και δημιουργήσαμε οπτικοποιήσεις για τον εντοπισμό δόλιων αξιώσεων χρησιμοποιώντας υπηρεσίες AWS Analytics.

Συνιστούμε να διαβάσετε τις ενότητες ασφαλείας του Textract Amazon, Κατανοήστε το Amazon, να Amazon A2I τεκμηρίωση και ακολουθώντας τις παρεχόμενες οδηγίες. Για να μάθετε περισσότερα σχετικά με την τιμολόγηση της λύσης, ανατρέξτε στις λεπτομέρειες τιμολόγησης του Textract Amazon, Κατανοήστε το Amazon, να Amazon A2I.

Σχετικά με τους Συγγραφείς

Τσινμέι Ρέιν είναι Αρχιτέκτονας Ειδικών Λύσεων AI/ML στην Amazon Web Services. Είναι παθιασμένη με τα εφαρμοσμένα μαθηματικά και τη μηχανική μάθηση. Επικεντρώνεται στο σχεδιασμό έξυπνων λύσεων επεξεργασίας εγγράφων για πελάτες AWS. Εκτός δουλειάς, της αρέσει να χορεύει salsa και bachata.

Uday Narayanan είναι Αρχιτέκτονας Ειδικών Λύσεων Analytics στην AWS. Του αρέσει να βοηθά τους πελάτες να βρίσκουν καινοτόμες λύσεις σε πολύπλοκες επιχειρηματικές προκλήσεις. Οι βασικοί τομείς εστίασής του είναι η ανάλυση δεδομένων, τα συστήματα μεγάλων δεδομένων και η μηχανική μάθηση. Στον ελεύθερο χρόνο του, του αρέσει να παίζει αθλήματα, να παρακολουθεί τηλεοπτικές εκπομπές και να ταξιδεύει.

Σονάλι Σάχου ηγείται της ομάδας Intelligent Document Processing AI/ML Solutions Architect της Amazon Web Services. Είναι παθιασμένη τεχνόφιλη και της αρέσει να εργάζεται με πελάτες για την επίλυση σύνθετων προβλημάτων χρησιμοποιώντας την καινοτομία. Ο βασικός τομέας εστίασής της είναι η τεχνητή νοημοσύνη και η μηχανική μάθηση για έξυπνη επεξεργασία εγγράφων.

Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Έξυπνη επεξεργασία εγγράφων με υπηρεσίες AWS AI και Analytics στον ασφαλιστικό κλάδο: Μέρος 2

Επισκόπηση λύσεων

Προϋποθέσεις

Φάση εκχύλισης

Εξαγωγή προεπιλεγμένων οντοτήτων με το Amazon Comprehend DetectEntities API

Εξαγωγή προσαρμοσμένων οντοτήτων με την αναγνώριση προσαρμοσμένων οντοτήτων Amazon Comprehend

Φάση εμπλουτισμού

Εξαγωγή ιατρικών πληροφοριών από μη δομημένο ιατρικό κείμενο

Εκτελέστε αναγραφή PII και PHI

Φάση αναθεώρησης και επικύρωσης

Εντοπίστε δόλιες αξιώσεις ασφάλισης

Ρύθμιση εξωτερικού σχήματος Amazon Redshift

Δημιουργία εξωτερικού πίνακα Amazon Redshift

Δημιουργία συνόλων δεδομένων εκπαίδευσης και δοκιμής

Δημιουργήστε ένα μοντέλο ML με το Amazon Redshift ML

Αξιολογήστε τις μετρήσεις του μοντέλου ML

Εντοπισμός απάτης χρησιμοποιώντας το μοντέλο ML

Οπτικοποιήστε τα δεδομένα αξιώσεων

εκκαθάριση

Συμπέρασμα

Σχετικά με τους Συγγραφείς

Ο Drake απειλείται με μήνυση για τα φωνητικά Tupac AI

Το Bitcoin μόλις εισήλθε σε μια «δεύτερη επικίνδυνη ζώνη», προειδοποιεί ο Crypto Analyst – Εδώ είναι οι στόχοι του – The Daily Hodl

Τελευταία Νοημοσύνη

Η BDAG ηγείται των κορυφαίων 5 υποσχόμενων προπωλήσεων κρυπτογράφησης του 2024

Περίοδος ρευστότητας και κατοχύρωσης 100 εκατομμυρίων $ BlockDAG εν μέσω ζητημάτων δικτύου SOL και προβλέψεων τιμών DOT

Ο έμπορος έφτιαξε 23 εκατ. $ Flipping Solana Meme Coins: Λεπτομέρειες

Το Forbes κατατάσσει τα XRP, ADA, LTC, ETC μεταξύ των κορυφαίων διακριτικών «ζόμπι».

Περίπου το 87% των εκατομμυριούχων κρυπτογράφησης δεν πιστεύουν ότι μπορεί να χάσουν το κρυπτογράφηση τους για πάντα - The Daily Hodl

Το Forbes αποκαλύπτει 20 Crypto «Zombies», ανακηρύσσει το Ripple και το XRP μεταξύ των νεκρών

Συνομιλία με μας

Νοημοσύνη δεδομένων Πλάτωνα.Κάθετη Αναζήτηση & Αι.

Έξυπνη επεξεργασία εγγράφων με υπηρεσίες AWS AI και Analytics στον ασφαλιστικό κλάδο: Μέρος 2

Επισκόπηση λύσεων

Προϋποθέσεις

Φάση εκχύλισης

Εξαγωγή προεπιλεγμένων οντοτήτων με το Amazon Comprehend DetectEntities API

Εξαγωγή προσαρμοσμένων οντοτήτων με την αναγνώριση προσαρμοσμένων οντοτήτων Amazon Comprehend

Φάση εμπλουτισμού

Εξαγωγή ιατρικών πληροφοριών από μη δομημένο ιατρικό κείμενο

Εκτελέστε αναγραφή PII και PHI

Φάση αναθεώρησης και επικύρωσης

Εντοπίστε δόλιες αξιώσεις ασφάλισης

Ρύθμιση εξωτερικού σχήματος Amazon Redshift

Δημιουργία εξωτερικού πίνακα Amazon Redshift

Δημιουργία συνόλων δεδομένων εκπαίδευσης και δοκιμής

Δημιουργήστε ένα μοντέλο ML με το Amazon Redshift ML

Αξιολογήστε τις μετρήσεις του μοντέλου ML

Εντοπισμός απάτης χρησιμοποιώντας το μοντέλο ML

Οπτικοποιήστε τα δεδομένα αξιώσεων

εκκαθάριση

Συμπέρασμα

Σχετικά με τους Συγγραφείς

Τελευταία Νοημοσύνη

Συνομιλία με μας

Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.