Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Νέο και βελτιωμένο εργαλείο εποπτείας περιεχομένου

Ημερομηνία:

Παρουσιάζουμε ένα νέο-και-βελτιωμένο εργαλείο εποπτείας περιεχομένου: Το Τελικό σημείο εποπτείας βελτιώνει το προηγούμενο φίλτρο περιεχομένου μας και είναι διαθέσιμο σήμερα δωρεάν στους προγραμματιστές OpenAI API.

Για να βοηθήσουμε τους προγραμματιστές να προστατεύσουν τις εφαρμογές τους από πιθανή κακή χρήση, παρουσιάζουμε το ταχύτερο και πιο ακριβές Τελικό σημείο εποπτείας. Αυτό το τελικό σημείο παρέχει στους προγραμματιστές OpenAI API δωρεάν πρόσβαση σε Βασισμένο σε GPT ταξινομητές που ανιχνεύουν ανεπιθύμητο περιεχόμενο — ένα παράδειγμα χρησιμοποιώντας συστήματα AI να βοηθήσει με την ανθρώπινη επίβλεψη αυτών των συστημάτων. Έχουμε επίσης κυκλοφορήσει και τα δύο α τεχνικό χαρτί περιγράφοντας τη μεθοδολογία μας και την σύνολο δεδομένων χρησιμοποιείται για αξιολόγηση.

Όταν δίνεται μια εισαγωγή κειμένου, το τελικό σημείο Εποπτείας αξιολογεί εάν το περιεχόμενο είναι σεξουαλικό, μίσος, βίαιο ή προωθεί τον αυτοτραυματισμό — περιεχόμενο που απαγορεύεται από πολιτική περιεχομένου. Το τελικό σημείο έχει εκπαιδευτεί ώστε να είναι γρήγορο, ακριβές και να αποδίδει ισχυρά σε μια σειρά εφαρμογών. Είναι σημαντικό ότι αυτό μειώνει τις πιθανότητες τα προϊόντα να «λένε» το λάθος πράγμα, ακόμη και όταν αναπτύσσονται σε χρήστες σε κλίμακα. Κατά συνέπεια, η τεχνητή νοημοσύνη μπορεί να ξεκλειδώσει τα οφέλη σε ευαίσθητα περιβάλλοντα, όπως η εκπαίδευση, όπου διαφορετικά δεν θα μπορούσε να χρησιμοποιηθεί με σιγουριά.

εισαγωγή κειμένου

Βία

Αυτοτραυματισμός

Μισώ

Σεξουαλικός

Τελικό σημείο εποπτείας

Το τελικό σημείο Moderation βοηθά τους προγραμματιστές να επωφεληθούν από τις επενδύσεις μας σε υποδομές. Αντί να δημιουργούν και να διατηρούν τους δικούς τους ταξινομητές—μια εκτεταμένη διαδικασία, όπως τεκμηριώνουμε στο δικό μας χαρτί—αντ' αυτού μπορούν να έχουν πρόσβαση σε ακριβείς ταξινομητές μέσω μιας κλήσης API.

Ως μέρος του OpenAI δέσμευση προς την καθιστώντας το οικοσύστημα AI πιο ασφαλές, παρέχουμε αυτό το τελικό σημείο για να επιτρέψουμε τη δωρεάν εποπτεία όλου του περιεχομένου που δημιουργείται από το OpenAI API. Για παράδειγμα, Εσωτερικός κόσμος, ένας πελάτης του OpenAI API, χρησιμοποιεί το τελικό σημείο Moderation για να βοηθήσει τους εικονικούς χαρακτήρες του που βασίζονται σε AI να «παραμείνουν στο σενάριο». Αξιοποιώντας την τεχνολογία του OpenAI, η Inworld μπορεί να επικεντρωθεί στο βασικό προϊόν της – δημιουργώντας αξέχαστους χαρακτήρες.

Επιπλέον, καλωσορίζουμε τη χρήση του τελικού σημείου για μέτριο περιεχόμενο δεν που δημιουργήθηκε με το OpenAI API. Σε μια περίπτωση, η εταιρεία NGL – μια ανώνυμη πλατφόρμα ανταλλαγής μηνυμάτων, με έμφαση στην ασφάλεια – χρησιμοποιεί το τελικό σημείο Moderation για να ανιχνεύσει τη γλώσσα μίσους και τον εκφοβισμό στην εφαρμογή τους. Η NGL διαπιστώνει ότι αυτοί οι ταξινομητές είναι ικανοί να γενικεύονται στην πιο πρόσφατη αργκό, επιτρέποντάς τους να παραμένουν πιο σίγουροι με την πάροδο του χρόνου. Η χρήση του τερματικού σημείου εποπτείας για την παρακολούθηση της επισκεψιμότητας εκτός API είναι σε ιδιωτική έκδοση beta και θα υπόκειται σε χρέωση. Εάν ενδιαφέρεστε, επικοινωνήστε μαζί μας στο [προστασία μέσω email].


Ξεκινήστε με το τελικό σημείο Εποπτείας κάνοντας check out την τεκμηρίωση. Περισσότερες λεπτομέρειες σχετικά με τη διαδικασία εκπαίδευσης και την απόδοση του μοντέλου είναι διαθέσιμες στο μας χαρτί. Έχουμε κυκλοφορήσει επίσης ένα σύνολο δεδομένων αξιολόγησης, με δεδομένα Common Crawl με ετικέτα σε αυτές τις κατηγορίες, κάτι που ελπίζουμε να δώσει ώθηση σε περαιτέρω έρευνα σε αυτόν τον τομέα.

spot_img

Τελευταία Νοημοσύνη

spot_img