Ευφυής Επεξεργασία Εγγράφων με Υπηρεσίες AWS AI: Μέρος 1

Οργανισμοί σε κλάδους όπως η υγειονομική περίθαλψη, η χρηματοδότηση και ο δανεισμός, η νομική, η λιανική και η μεταποίηση συχνά πρέπει να αντιμετωπίσουν πολλά έγγραφα στις καθημερινές επιχειρηματικές τους διαδικασίες. Αυτά τα έγγραφα περιέχουν κρίσιμες πληροφορίες που είναι βασικές για τη λήψη αποφάσεων έγκαιρα, προκειμένου να διατηρηθούν τα υψηλότερα επίπεδα ικανοποίησης πελατών, ταχύτερη ενσωμάτωση πελατών και χαμηλότερη απόκλιση πελατών. Στις περισσότερες περιπτώσεις, τα έγγραφα υποβάλλονται σε χειροκίνητη επεξεργασία για την εξαγωγή πληροφοριών και πληροφοριών, κάτι που είναι χρονοβόρο, επιρρεπές σε σφάλματα, ακριβό και δύσκολο να κλιμακωθεί. Υπάρχει περιορισμένος διαθέσιμος αυτοματισμός σήμερα για την επεξεργασία και την εξαγωγή πληροφοριών από αυτά τα έγγραφα. Η έξυπνη επεξεργασία εγγράφων (IDP) με υπηρεσίες τεχνητής νοημοσύνης (AI) AWS βοηθά στην αυτοματοποίηση της εξαγωγής πληροφοριών από έγγραφα διαφορετικών τύπων και μορφών, γρήγορα και με υψηλή ακρίβεια, χωρίς την ανάγκη δεξιοτήτων μηχανικής μάθησης (ML). Η ταχύτερη εξαγωγή πληροφοριών με υψηλή ακρίβεια βοηθά στην έγκαιρη λήψη ποιοτικών επιχειρηματικών αποφάσεων, ενώ μειώνει το συνολικό κόστος.

Αν και τα στάδια σε μια ροή εργασιών IDP μπορεί να διαφέρουν και να επηρεάζονται από τις περιπτώσεις χρήσης και τις επιχειρηματικές απαιτήσεις, το ακόλουθο σχήμα δείχνει τα στάδια που αποτελούν συνήθως μέρος μιας ροής εργασίας IDP. Η επεξεργασία εγγράφων όπως φορολογικά έντυπα, αξιώσεις, ιατρικά σημειώματα, έντυπα νέων πελατών, τιμολόγια, νομικές συμβάσεις και άλλα είναι μερικές μόνο από τις περιπτώσεις χρήσης για IDP.

Σε αυτήν τη σειρά δύο μερών, συζητάμε πώς μπορείτε να αυτοματοποιήσετε και να επεξεργάζεστε έξυπνα έγγραφα σε κλίμακα χρησιμοποιώντας υπηρεσίες AWS AI. Σε αυτήν την ανάρτηση, συζητάμε τις τρεις πρώτες φάσεις της ροής εργασιών IDP. Σε μέρος 2, συζητάμε τις υπόλοιπες φάσεις ροής εργασίας.

Επισκόπηση λύσεων

Το ακόλουθο διάγραμμα αρχιτεκτονικής δείχνει τα στάδια μιας ροής εργασίας IDP. Ξεκινά με ένα στάδιο λήψης δεδομένων για την ασφαλή αποθήκευση και συγκέντρωση διαφορετικών μορφών αρχείων (PDF, JPEG, PNG, TIFF) και διατάξεων εγγράφων. Το επόμενο στάδιο είναι η ταξινόμηση, όπου ταξινομείτε τα έγγραφά σας (όπως συμβόλαια, έντυπα αξίωσης, τιμολόγια ή αποδείξεις), ακολουθούμενη από εξαγωγή εγγράφων. Στο στάδιο της εξαγωγής, μπορείτε να εξαγάγετε σημαντικές επιχειρηματικές πληροφορίες από τα έγγραφά σας. Αυτά τα εξαγόμενα δεδομένα χρησιμοποιούνται συχνά για τη συλλογή πληροφοριών μέσω ανάλυσης δεδομένων ή αποστέλλονται σε μεταγενέστερα συστήματα, όπως βάσεις δεδομένων ή συστήματα συναλλαγών. Το επόμενο στάδιο είναι ο εμπλουτισμός, όπου τα έγγραφα μπορούν να εμπλουτιστούν με επεξεργασία προστατευμένων πληροφοριών υγείας (PHI) ή δεδομένων προσωπικής ταυτοποίησης (PII), εξαγωγή προσαρμοσμένων επιχειρηματικών όρων κ.λπ. Τέλος, στο στάδιο της αναθεώρησης και της επικύρωσης, μπορείτε να συμπεριλάβετε ένα ανθρώπινο δυναμικό για έλεγχο εγγράφων για να διασφαλίσετε ότι το αποτέλεσμα είναι ακριβές.

Για τους σκοπούς αυτής της ανάρτησης, εξετάζουμε ένα σύνολο δειγμάτων εγγράφων, όπως αντίγραφα κίνησης τραπεζικών κινήσεων, τιμολόγια και αποδείξεις καταστήματος. Τα δείγματα εγγράφων, μαζί με το δείγμα κώδικα, μπορείτε να τα βρείτε στη σελίδα μας Αποθετήριο GitHub. Στις επόμενες ενότητες, σας καθοδηγούμε σε αυτά τα δείγματα κώδικα μαζί με πραγματική πρακτική εφαρμογή. Δείχνουμε πώς μπορείτε να χρησιμοποιήσετε τις δυνατότητες ML με Textract Amazon, Κατανοήστε το Amazon, να Amazon Augmented AI (Amazon A2I) για την επεξεργασία εγγράφων και την επικύρωση των δεδομένων που εξάγονται από αυτά.

Το Amazon Textract είναι μια υπηρεσία ML που εξάγει αυτόματα κείμενο, χειρόγραφο και δεδομένα από σαρωμένα έγγραφα. Η αναγνώριση, η κατανόηση και η εξαγωγή δεδομένων από φόρμες και πίνακες υπερβαίνει την απλή οπτική αναγνώριση χαρακτήρων (OCR). Το Amazon Textract χρησιμοποιεί ML για την ανάγνωση και επεξεργασία οποιουδήποτε τύπου εγγράφου, εξάγοντας με ακρίβεια κείμενο, χειρόγραφο, πίνακες και άλλα δεδομένα χωρίς χειροκίνητη προσπάθεια.

Το Amazon Comprehend είναι μια υπηρεσία επεξεργασίας φυσικής γλώσσας (NLP) που χρησιμοποιεί ML για την εξαγωγή πληροφοριών σχετικά με το περιεχόμενο των εγγράφων. Το Amazon Comprehend μπορεί να εντοπίσει κρίσιμα στοιχεία σε έγγραφα, συμπεριλαμβανομένων των αναφορών σε γλώσσα, ανθρώπους και μέρη, και να τα ταξινομήσει σε σχετικά θέματα ή συμπλέγματα. Μπορεί να εκτελέσει ανάλυση συναισθήματος για να προσδιορίσει το συναίσθημα ενός εγγράφου σε πραγματικό χρόνο χρησιμοποιώντας μεμονωμένο έγγραφο ή ανίχνευση παρτίδας. Για παράδειγμα, μπορεί να αναλύσει τα σχόλια σε μια ανάρτηση ιστολογίου για να γνωρίζει εάν η ανάρτηση αρέσει ή όχι στους αναγνώστες σας. Το Amazon Comprehend ανιχνεύει επίσης PII όπως διευθύνσεις, αριθμούς τραπεζικών λογαριασμών και αριθμούς τηλεφώνου σε έγγραφα κειμένου σε πραγματικό χρόνο και ασύγχρονες ομαδικές εργασίες. Μπορεί επίσης να επεξεργαστεί οντότητες PII σε ασύγχρονες εργασίες παρτίδας.

Το Amazon A2I είναι μια υπηρεσία ML που διευκολύνει τη δημιουργία των ροών εργασιών που απαιτούνται για τον ανθρώπινο έλεγχο. Το Amazon A2I φέρνει ανθρώπινη αναθεώρηση σε όλους τους προγραμματιστές, καταργώντας την αδιαφοροποίητη βαρύτητα που σχετίζεται με τη δημιουργία συστημάτων ανθρώπινης αξιολόγησης ή με τη διαχείριση μεγάλου αριθμού ανθρώπινων αναθεωρητών, είτε εκτελείται σε AWS είτε όχι. Το Amazon A2I ενσωματώνει και τα δύο Textract Amazon και Κατανοήστε το Amazon για να σας παρέχει τη δυνατότητα να εισάγετε βήματα ανθρώπινης αναθεώρησης μέσα στην έξυπνη ροή εργασιών επεξεργασίας εγγράφων σας.

Φάση λήψης δεδομένων

Μπορείτε να αποθηκεύσετε έγγραφα σε μια εξαιρετικά επεκτάσιμη και ανθεκτική αποθήκευση όπως Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3). Το Amazon S3 είναι μια υπηρεσία αποθήκευσης αντικειμένων που προσφέρει κορυφαία επεκτασιμότητα, διαθεσιμότητα δεδομένων, ασφάλεια και απόδοση. Το Amazon S3 έχει σχεδιαστεί για 11 9's αντοχής και αποθηκεύει δεδομένα για εκατομμύρια πελάτες σε όλο τον κόσμο. Τα έγγραφα μπορούν να διατίθενται σε διάφορες μορφές και διατάξεις και μπορεί να προέρχονται από διαφορετικά κανάλια, όπως πύλες ιστού ή συνημμένα email.

Φάση ταξινόμησης

Στο προηγούμενο βήμα, συλλέξαμε έγγραφα διαφόρων τύπων και μορφών. Σε αυτό το βήμα, πρέπει να κατηγοριοποιήσουμε τα έγγραφα για να μπορέσουμε να κάνουμε περαιτέρω εξαγωγή. Για αυτό, χρησιμοποιούμε το Amazon Comprehend προσαρμοσμένη ταξινόμηση. Η ταξινόμηση εγγράφων είναι μια διαδικασία δύο σταδίων. Αρχικά, εκπαιδεύετε έναν προσαρμοσμένο ταξινομητή Amazon Comprehend ώστε να αναγνωρίζει τις κλάσεις που σας ενδιαφέρουν. Στη συνέχεια, αναπτύσσετε το μοντέλο με a τελικό σημείο προσαρμοσμένου ταξινομητή σε πραγματικό χρόνο και να στείλετε έγγραφα χωρίς ετικέτα στο τελικό σημείο σε πραγματικό χρόνο για ταξινόμηση.

Το παρακάτω σχήμα αντιπροσωπεύει μια τυπική ροή εργασίας ταξινόμησης εγγράφων.

Φάση ταξινόμησης

Για να εκπαιδεύσετε τον ταξινομητή, προσδιορίστε τις τάξεις που σας ενδιαφέρουν και παρέχετε δείγματα εγγράφων για κάθε τάξη ως εκπαιδευτικό υλικό. Με βάση τις επιλογές που υποδείξατε, το Amazon Comprehend δημιουργεί ένα προσαρμοσμένο μοντέλο ML το οποίο εκπαιδεύει με βάση τα έγγραφα που παρείχατε. Αυτό το προσαρμοσμένο μοντέλο (ο ταξινομητής) εξετάζει κάθε έγγραφο που υποβάλλετε. Επιστρέφει είτε τη συγκεκριμένη κλάση που αντιπροσωπεύει καλύτερα το περιεχόμενο (εάν χρησιμοποιείτε λειτουργία πολλαπλών κλάσεων) είτε το σύνολο των κλάσεων που ισχύουν για αυτήν (εάν χρησιμοποιείτε τη λειτουργία πολλαπλών ετικετών).

Προετοιμάστε δεδομένα εκπαίδευσης

Το πρώτο βήμα είναι η εξαγωγή κειμένου από έγγραφα που απαιτούνται για τον προσαρμοσμένο ταξινομητή Amazon Comprehend. Για να εξαγάγουμε τις πληροφορίες ακατέργαστου κειμένου για όλα τα έγγραφα στο Amazon S3, χρησιμοποιούμε το Amazon Textract detect_document_text() API. Επίσης, επισημαίνουμε τα δεδομένα σύμφωνα με τον τύπο εγγράφου που θα χρησιμοποιηθεί για την εκπαίδευση ενός προσαρμοσμένου ταξινομητή Amazon Comprehend.

Ο παρακάτω κώδικας έχει περικοπεί για λόγους απλοποίησης. Για τον πλήρη κωδικό, ανατρέξτε στο GitHub δείγμα κώδικα for textract_extract_text(). Η λειτουργία call_textract() είναι μια συνάρτηση wr4apper που καλεί το Ανάλυση εγγράφου API εσωτερικά και οι παράμετροι που μεταβιβάζονται στη μέθοδο αφαιρούν ορισμένες από τις διαμορφώσεις που χρειάζεται το API για να εκτελέσει την εργασία εξαγωγής.

def textract_extract_text(document, bucket=data_bucket):        
    try:
        print(f'Processing document: {document}')
        lines = ""
        row = []
        
        # using amazon-textract-caller
        response = call_textract(input_document=f's3://{bucket}/{document}') 
        # using pretty printer to get all the lines
        lines = get_string(textract_json=response, output_type=[Textract_Pretty_Print.LINES])
        
        label = [name for name in names if(name in document)]  
        row.append(label[0])
        row.append(lines)        
        return row
    except Exception as e:
        print (e)

Εκπαιδεύστε έναν προσαρμοσμένο ταξινομητή

Σε αυτό το βήμα, χρησιμοποιούμε την προσαρμοσμένη ταξινόμηση του Amazon Comprehend για να εκπαιδεύσουμε το μοντέλο μας για την ταξινόμηση των εγγράφων. Χρησιμοποιούμε το CreateDocumentClassifier API για τη δημιουργία ενός ταξινομητή που εκπαιδεύει ένα προσαρμοσμένο μοντέλο χρησιμοποιώντας τα δεδομένα μας με ετικέτα. Δείτε τον παρακάτω κώδικα:

create_response = comprehend.create_document_classifier(
        InputDataConfig={
            'DataFormat': 'COMPREHEND_CSV',
            'S3Uri': f's3://{data_bucket}/{key}'
        },
        DataAccessRoleArn=role,
        DocumentClassifierName=document_classifier_name,
        VersionName=document_classifier_version,
        LanguageCode='en',
        Mode='MULTI_CLASS'
    )

Αναπτύξτε ένα τελικό σημείο σε πραγματικό χρόνο

Για να χρησιμοποιήσουμε τον προσαρμοσμένο ταξινομητή Amazon Comprehend, δημιουργούμε ένα τελικό σημείο σε πραγματικό χρόνο χρησιμοποιώντας το CreateEndpoint API:

endpoint_response = comprehend.create_endpoint(
        EndpointName=ep_name,
        ModelArn=model_arn,
        DesiredInferenceUnits=1,    
        DataAccessRoleArn=role
    )
    ENDPOINT_ARN=endpoint_response['EndpointArn']
print(f'Endpoint created with ARN: {ENDPOINT_ARN}')

Ταξινόμηση εγγράφων με το τελικό σημείο σε πραγματικό χρόνο

Αφού δημιουργηθεί το τελικό σημείο Amazon Comprehend, μπορούμε να χρησιμοποιήσουμε το τελικό σημείο σε πραγματικό χρόνο για να ταξινομήσουμε έγγραφα. Χρησιμοποιούμε το comprehend.classify_document() λειτουργία με το εξαγόμενο κείμενο του εγγράφου και το τελικό σημείο συμπερασμάτων ως παραμέτρους εισόδου:

response = comprehend.classify_document(
      Text= document,
      EndpointArn=ENDPOINT_ARN
      )

Το Amazon Comprehend επιστρέφει όλες τις κατηγορίες εγγράφων με βαθμολογία εμπιστοσύνης που συνδέεται με κάθε τάξη σε μια σειρά ζευγών κλειδιών-τιμών (όνομα-βαθμολογία). Επιλέγουμε την κατηγορία εγγράφων με την υψηλότερη βαθμολογία εμπιστοσύνης. Το παρακάτω στιγμιότυπο οθόνης είναι ένα δείγμα απάντησης.

Ταξινόμηση εγγράφων με το τελικό σημείο σε πραγματικό χρόνο

Συνιστούμε να διαβάσετε το αναλυτικό δείγμα κώδικα ταξινόμησης εγγράφων GitHub.

Φάση εκχύλισης

Το Amazon Textract σάς επιτρέπει να εξάγετε κείμενο και πληροφορίες δομημένων δεδομένων χρησιμοποιώντας το Amazon Textract DetectDocumentText και Ανάλυση εγγράφου API, αντίστοιχα. Αυτά τα API αποκρίνονται με δεδομένα JSON, τα οποία περιέχουν ΛΕΞΕΙΣ, ΓΡΑΜΜΕΣ, ΦΟΡΜΕΣ, ΠΙΝΑΚΕΣ, πληροφορίες γεωμετρίας ή πλαισίου οριοθέτησης, σχέσεις και ούτω καθεξής. Και τα δυο DetectDocumentText και AnalyzeDocument είναι σύγχρονες πράξεις. Για να αναλύσετε έγγραφα ασύγχρονα, χρησιμοποιήστε StartDocumentText Detection.

Εξαγωγή δομημένων δεδομένων

Μπορείτε να εξαγάγετε δομημένα δεδομένα, όπως πίνακες από έγγραφα, διατηρώντας παράλληλα τη δομή δεδομένων και τις σχέσεις μεταξύ των στοιχείων που εντοπίστηκαν. Μπορείτε να χρησιμοποιήσετε το Ανάλυση εγγράφου API με το FeatureType as TABLE για να εντοπίσετε όλους τους πίνακες σε ένα έγγραφο. Το παρακάτω σχήμα απεικονίζει αυτή τη διαδικασία.

Εξαγωγή δομημένων δεδομένων

Δείτε τον ακόλουθο κώδικα:

response = textract.analyze_document(
    Document={
        'S3Object': {
            'Bucket': s3BucketName,
            'Name': documentName
        }
    },
    FeatureTypes=["TABLES"])

Τρέχουμε το analyze_document() μέθοδος με το FeatureType as TABLES στο έγγραφο ιστορικού εργαζομένων και αποκτήστε την εξαγωγή πίνακα στα ακόλουθα αποτελέσματα.

Αναλύστε την απόκριση API εγγράφου για εξαγωγή πινάκων

Ημιδομημένη εξαγωγή δεδομένων

Μπορείτε να εξαγάγετε ημι-δομημένα δεδομένα, όπως φόρμες ή ζεύγη κλειδιών-τιμών από έγγραφα, διατηρώντας παράλληλα τη δομή δεδομένων και τις σχέσεις μεταξύ των στοιχείων που εντοπίστηκαν. Μπορείτε να χρησιμοποιήσετε το Ανάλυση εγγράφου API με το FeatureType as FORMS για τον εντοπισμό όλων των μορφών σε ένα έγγραφο. Το παρακάτω διάγραμμα απεικονίζει αυτή τη διαδικασία.

Ημιδομημένη εξαγωγή δεδομένων

Δείτε τον ακόλουθο κώδικα:

response = textract.analyze_document(
    Document={
        'S3Object': {
            'Bucket': s3BucketName,
            'Name': documentName
        }
    },
    FeatureTypes=["FORMS"])

Εδώ, τρέχουμε το analyze_document() μέθοδος με το FeatureType as FORMS στο έγγραφο της αίτησης υπαλλήλου και λάβετε την εξαγωγή πίνακα στα αποτελέσματα.

Μη δομημένη εξαγωγή δεδομένων

Το Amazon Textract είναι βέλτιστο για εξαγωγή πυκνού κειμένου με κορυφαία στον κλάδο ακρίβεια OCR. Μπορείτε να χρησιμοποιήσετε το DetectDocumentText API για τον εντοπισμό γραμμών κειμένου και λέξεων που συνθέτουν μια γραμμή κειμένου, όπως φαίνεται στο παρακάτω σχήμα.

Μη δομημένη εξαγωγή δεδομένων

Δείτε τον ακόλουθο κώδικα:

response = textract.detect_document_text(Document={'Bytes': imageBytes})

# Print detected text
for item in response["Blocks"]:
	if item["BlockType"] == "LINE":
 		print (item["Text"])

Τώρα τρέχουμε το detect_document_text() μέθοδο στην εικόνα δείγματος και να λάβετε εξαγωγή ακατέργαστου κειμένου στα αποτελέσματα.

Τιμολόγια και αποδείξεις

Το Amazon Textract παρέχει εξειδικευμένη υποστήριξη για την επεξεργασία τιμολογίων και αποδείξεων σε κλίμακα. ο AnalyzeExpense Το API μπορεί να εξάγει ρητά επισημασμένα δεδομένα, σιωπηρά δεδομένα και στοιχεία γραμμής από μια αναλυτική λίστα αγαθών ή υπηρεσιών από σχεδόν οποιοδήποτε τιμολόγιο ή απόδειξη χωρίς πρότυπα ή διαμόρφωση. Το παρακάτω σχήμα απεικονίζει αυτή τη διαδικασία.

Εξαγωγή τιμολογίων και αποδείξεων

Δείτε τον ακόλουθο κώδικα:

response = textract.analyze_expense(
    Document={
        'S3Object': {
            'Bucket': s3BucketName,
            'Name': documentName
        }
    })

Το Amazon Textract μπορεί να βρει το όνομα του προμηθευτή σε μια απόδειξη, ακόμα κι αν αυτό υποδεικνύεται μόνο σε ένα λογότυπο στη σελίδα χωρίς ρητή ετικέτα που ονομάζεται "προμηθευτής". Μπορεί επίσης να βρει και να εξαγάγει στοιχεία εξόδων, ποσότητα και τιμές που δεν επισημαίνονται με κεφαλίδες στηλών για στοιχεία γραμμής.

Αναλύστε την απόκριση API εξόδων

Έγγραφα ταυτότητας

Το κείμενο του Amazon AnalyzeID Το API μπορεί να σας βοηθήσει να εξάγετε αυτόματα πληροφορίες από έγγραφα ταυτοποίησης, όπως άδειες οδήγησης και διαβατήρια, χωρίς να χρειάζεστε πρότυπα ή ρυθμίσεις παραμέτρων. Μπορούμε να εξαγάγουμε συγκεκριμένες πληροφορίες, όπως ημερομηνία λήξης και ημερομηνία γέννησης, καθώς και να εντοπίσουμε και να εξαγάγουμε έξυπνα σιωπηρές πληροφορίες, όπως όνομα και διεύθυνση. Το παρακάτω διάγραμμα απεικονίζει αυτή τη διαδικασία.

Εξαγωγή εγγράφων ταυτότητας

Δείτε τον ακόλουθο κώδικα:

textract_client = boto3.client('textract')
j = call_textract_analyzeid(document_pages=["s3://amazon-textract-public-content/analyzeid/driverlicense.png"],boto3_textract_client=textract_client)

Μπορούμε να χρησιμοποιήσουμε tabulate για να έχετε ένα όμορφο έντυπο αποτέλεσμα:

from tabulate import tabulate

print(tabulate([x[1:3] for x in result]))

Συνιστούμε να περάσετε από τη λεπτομερή εξαγωγή εγγράφων δείγμα κώδικα στο GitHub. Για περισσότερες πληροφορίες σχετικά με τα πλήρη δείγματα κώδικα σε αυτήν την ανάρτηση, ανατρέξτε στο GitHub repo.

Συμπέρασμα

Σε αυτήν την πρώτη ανάρτηση μιας σειράς δύο μερών, συζητήσαμε τα διάφορα στάδια του IDP και μια αρχιτεκτονική λύσης. Συζητήσαμε επίσης την ταξινόμηση εγγράφων χρησιμοποιώντας έναν προσαρμοσμένο ταξινομητή Amazon Comprehend. Στη συνέχεια, διερευνήσαμε τους τρόπους με τους οποίους μπορείτε να χρησιμοποιήσετε το Amazon Textract για να εξάγετε πληροφορίες από μη δομημένους, ημιδομημένους, δομημένους και εξειδικευμένους τύπους εγγράφων.

In μέρος 2 αυτής της σειράς, συνεχίζουμε τη συζήτηση με τα χαρακτηριστικά απόσπασμα και ερωτήματα του Amazon Textract. Εξετάζουμε τον τρόπο χρήσης προκαθορισμένων οντοτήτων και προσαρμοσμένων οντοτήτων του Amazon Comprehend για την εξαγωγή βασικών επιχειρηματικών όρων από έγγραφα με πυκνό κείμενο και πώς να ενσωματώσετε μια ανθρώπινη ανασκόπηση Amazon A2I στις διαδικασίες IDP σας.

Συνιστούμε να διαβάσετε τις ενότητες ασφαλείας του Textract Amazon, Κατανοήστε το Amazon, να Amazon A2I τεκμηρίωση και ακολουθώντας τις παρεχόμενες οδηγίες. Επίσης, αφιερώστε λίγο χρόνο για να ελέγξετε και να κατανοήσετε την τιμολόγηση Textract Amazon, Κατανοήστε το Amazon, να Amazon A2I.

Σχετικά με τους συγγραφείς

Suprakash Dutta είναι αρχιτέκτονας λύσεων στο Amazon Web Services. Επικεντρώνεται στη στρατηγική ψηφιακού μετασχηματισμού, τον εκσυγχρονισμό και τη μετανάστευση εφαρμογών, την ανάλυση δεδομένων και τη μηχανική μάθηση.

Σονάλι Σάχου είναι η ηγετική ομάδα του Intelligent Document Processing AI/ML Solutions Architect στην Amazon Web Services. Είναι παθιασμένη τεχνόφιλη και της αρέσει να εργάζεται με πελάτες για την επίλυση σύνθετων προβλημάτων χρησιμοποιώντας την καινοτομία. Ο βασικός τομέας εστίασής της είναι η τεχνητή νοημοσύνη και η μηχανική μάθηση για έξυπνη επεξεργασία εγγράφων.

Anjan Biswas είναι Ανώτερος Αρχιτέκτονας Λύσεων Υπηρεσιών AI με έμφαση στο AI/ML και στην ανάλυση δεδομένων. Ο Anjan είναι μέρος της παγκόσμιας ομάδας υπηρεσιών AI και συνεργάζεται με πελάτες για να τους βοηθήσει να κατανοήσουν και να αναπτύξουν λύσεις σε επιχειρηματικά προβλήματα με AI και ML. Η Anjan έχει πάνω από 14 χρόνια εμπειρίας σε συνεργασία με παγκόσμιους οργανισμούς εφοδιαστικής αλυσίδας, κατασκευής και λιανικής και βοηθά ενεργά τους πελάτες να ξεκινήσουν και να επεκτείνουν τις υπηρεσίες AWS AI.

Τσινμέι Ρέιν είναι Αρχιτέκτονας Ειδικών Λύσεων AI/ML στην Amazon Web Services. Είναι παθιασμένη με τα εφαρμοσμένα μαθηματικά και τη μηχανική μάθηση. Επικεντρώνεται στο σχεδιασμό έξυπνων λύσεων επεξεργασίας εγγράφων για πελάτες AWS. Εκτός δουλειάς, της αρέσει να χορεύει salsa και bachata.

Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Έξυπνη επεξεργασία εγγράφων με υπηρεσίες AWS AI: Μέρος 1

Επισκόπηση λύσεων

Φάση λήψης δεδομένων

Φάση ταξινόμησης

Προετοιμάστε δεδομένα εκπαίδευσης

Εκπαιδεύστε έναν προσαρμοσμένο ταξινομητή

Αναπτύξτε ένα τελικό σημείο σε πραγματικό χρόνο

Ταξινόμηση εγγράφων με το τελικό σημείο σε πραγματικό χρόνο

Φάση εκχύλισης

Εξαγωγή δομημένων δεδομένων

Ημιδομημένη εξαγωγή δεδομένων

Μη δομημένη εξαγωγή δεδομένων

Τιμολόγια και αποδείξεις

Έγγραφα ταυτότητας

Συμπέρασμα

Σχετικά με τους συγγραφείς

Η Meta βλέπει 30% τριμηνιαία αύξηση εσόδων VR για το 1ο τρίμηνο του 2024

Με την απόκτηση Run:ai, η Nvidia στοχεύει στη διαχείριση των AI K8 σας

Τελευταία Νοημοσύνη

Cold VR: Running On Instinct είναι πώς να παίξετε αυτό το δροσερό επίδειξη Steam

Η Apple κυκλοφορεί το OpenELM, ένα ελαφρώς πιο ακριβές LLM

SOL στο κατώφλι του «βίαιου» ανοδικού ξεσπάσματος, λέει ο δημοφιλής έμπορος καθώς ο Solana επιλύει ζητήματα συμφόρησης

Το Bitcoin συνεχίζει να διατηρείται στην κατοχή της Tesla: Δεν υπάρχουν σημάδια πώλησης παρά την αστάθεια στο χρηματιστήριο – CryptoInfoNet

Το τεράστιο πρόστιμο της Do Kwon δείχνει ότι η SEC αυξάνει τις κυρώσεις κατά των εταιρειών κρυπτογράφησης

SHIB στο χείλος των μεγάλων υψηλών όλων των εποχών καθώς η νέα αλυσίδα L3 της Shiba Inu αποδεικνύεται ότι αλλάζει το παιχνίδι

Συνομιλία με μας

Νοημοσύνη δεδομένων Πλάτωνα.Κάθετη Αναζήτηση & Αι.

Έξυπνη επεξεργασία εγγράφων με υπηρεσίες AWS AI: Μέρος 1

Επισκόπηση λύσεων

Φάση λήψης δεδομένων

Φάση ταξινόμησης

Προετοιμάστε δεδομένα εκπαίδευσης

Εκπαιδεύστε έναν προσαρμοσμένο ταξινομητή

Αναπτύξτε ένα τελικό σημείο σε πραγματικό χρόνο

Ταξινόμηση εγγράφων με το τελικό σημείο σε πραγματικό χρόνο

Φάση εκχύλισης

Εξαγωγή δομημένων δεδομένων

Ημιδομημένη εξαγωγή δεδομένων

Μη δομημένη εξαγωγή δεδομένων

Τιμολόγια και αποδείξεις

Έγγραφα ταυτότητας

Συμπέρασμα

Σχετικά με τους συγγραφείς

Τελευταία Νοημοσύνη

Συνομιλία με μας

Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.