Η ανακοίνωση γύρω από την AI του διευθύνοντος συμβούλου της Meta, Mark Zuckerberg, έχει εγείρει μεγάλες ανησυχίες, αφού είπε ότι η εταιρεία είχε περισσότερα δεδομένα χρηστών από αυτά που χρησιμοποιήθηκαν για την εκπαίδευση του ChatGPT – και σύντομα θα τα χρησιμοποιούσε για να εκπαιδεύσει τα δικά της συστήματα AI.
Το σχέδιο της εταιρείας να χρησιμοποιήσει αναρτήσεις και σχόλια στο Facebook και το Instagram για να εκπαιδεύσει ένα ανταγωνιστικό chatbot εγείρει ανησυχίες τόσο για το απόρρητο όσο και για την τοξικότητα… Ο Zuckerberg ανακοίνωσε το σχέδιο της εταιρείας αφού δημοσίευσε την τελευταία έκθεση κερδών της εταιρείας, όπως αναφέρει το Bloomberg.
Για πολλούς ανθρώπους, το Facebook είναι το Διαδίκτυο και ο αριθμός των χρηστών του εξακολουθεί να αυξάνεται, σύμφωνα με τα τελευταία οικονομικά αποτελέσματα της Meta Platforms Inc. Αλλά ο Mark Zuckerberg δεν γιορτάζει μόνο αυτή τη συνεχή ανάπτυξη. Θέλει να το εκμεταλλευτεί χρησιμοποιώντας δεδομένα από το Facebook και το Instagram για να δημιουργήσει ισχυρή, γενικής χρήσης τεχνητή νοημοσύνη […] [Ο Zuckerberg είπε] «Το επόμενο βασικό μέρος του βιβλίου μας είναι η εκμάθηση από μοναδικά δεδομένα και βρόχους ανατροφοδότησης στα προϊόντα μας… Στο Facebook και το Instagram, υπάρχουν εκατοντάδες δισεκατομμύρια δημοσίως κοινοποιημένες εικόνες και δεκάδες δισεκατομμύρια δημόσια βίντεο, τα οποία υπολογίζουμε ότι είναι μεγαλύτερο από το σύνολο δεδομένων Common Crawl και οι άνθρωποι μοιράζονται μεγάλο αριθμό δημόσιων αναρτήσεων κειμένου σε σχόλια και στις υπηρεσίες μας.”
Το Common Crawl αναφέρεται σε ένα τεράστιο αρχείο 250 δισεκατομμυρίων ιστοσελίδων, που αντιπροσωπεύουν το μεγαλύτερο μέρος του κειμένου που χρησιμοποιείται για την εκπαίδευση του ChatGPT. Καλώντας ένα ακόμη μεγαλύτερο σύνολο δεδομένων, η Meta θα μπορούσε να είναι σε θέση να δημιουργήσει ένα πιο έξυπνο chatbot.
Όπως σημειώνει το Bloomberg, δεν είναι μόνο ο τεράστιος όγκος δεδομένων που μπορεί να δώσει πλεονέκτημα στη Meta – είναι το γεγονός ότι πολλά από αυτά είναι διαδραστικά.
Ο σωρός των δεδομένων στα οποία κάθεται είναι ιδιαίτερα πολύτιμος, επειδή πολλά από αυτά προέρχονται από νήματα σχολίων. Οποιοδήποτε κείμενο που αντιπροσωπεύει τον ανθρώπινο διάλογο είναι κρίσιμο για την εκπαίδευση των λεγόμενων συνομιλητών, γι’ αυτό το OpenAI εξόρυξε σε μεγάλο βαθμό το διαδικτυακό φόρουμ Reddit Inc. για να δημιουργήσει το δικό του δημοφιλές chatbot.
Αλλά το κομμάτι δείχνει επίσης τις δύο μεγάλες κόκκινες σημαίες εδώ. Πρώτον, η Meta θα εκπαιδεύει αποτελεσματικά το AI της σε κάτι που μπορεί να είναι πολύ προσωπικές αναρτήσεις και συνομιλίες μεταξύ φίλων στα σχόλια του Facebook. Αυτό εγείρει σημαντικούς συναγερμούς απορρήτου.
Δεύτερον, όποιος έχει διαβάσει ποτέ την ενότητα σχολίων οπουδήποτε στο Διαδίκτυο γνωρίζει ότι το ποσοστό του τοξικού περιεχομένου είναι υψηλό. Ενώ οι στοχαστικοί χρήστες συζητούν τα ζητήματα, δεν λείπουν οι σχολιαστές που καταφεύγουν σε προσωπικές επιθέσεις και ωμές προσβολές – και ένα ανησυχητικό ποσοστό αυτών είναι ρατσιστικό και σεξιστικό.
Αυτό είναι κάτι που κάθε σύστημα εκπαίδευσης chatbot πρέπει να φιλτράρει – και η Apple είναι πιθανότατα πιο προσεκτική από οποιονδήποτε άλλον στις δικές της εργασίες ανάπτυξης chatbot, συμβάλλοντας σε μια πολύ καθυστερημένη επανεκκίνηση της Siri – αλλά η κατάσταση εδώ μπορεί να είναι ιδιαίτερα κακή.
Ορισμένο από το περιεχόμενο στο Facebook που επισημαίνεται ως τοξικό δεν ελέγχεται πλέον από άνθρωπο και παραμένει στον ιστότοπο. Χειρότερα: Όταν ο Zuckerberg είπε ότι τα δεδομένα του Meta ήταν μεγαλύτερα από αυτά του Common Crawl, πιθανότατα βρισκόταν στο ιστορικό αρχείο της εταιρείας που θα περιελάμβανε όλο το υπερβολικό πολιτικό περιεχόμενο και τις ψεύτικες ειδήσεις που υπήρχαν στον ιστότοπο προτού ο Zuckerberg κάνει τον κόπο να το καθαρίσει.
Και αυτή είναι η εταιρεία που, ακόμη και πριν από λίγες μέρες, είπε ότι ένα ψεύτικο βίντεο του Προέδρου Μπάιντεν θα πρέπει να επιτρέπεται να παραμείνει στην πλατφόρμα επειδή το έχει επεξεργαστεί ένας άνθρωπος και όχι από ένα σύστημα τεχνητής νοημοσύνης, επομένως τα πρότυπά του δεν είναι ακριβώς ψηλά ακόμα και σήμερα.
Aκολουθήστε το AppleWorldHellas στο Google News για να ενημερώνεστε άμεσα για όλα τα νέα άρθρα! Όσοι χρησιμοποιείτε υπηρεσία RSS (π.χ. Feedly), μπορείτε να προσθέσετε το AppleWorldHellas στη λίστα σας με αντιγραφή και επικόλληση της διεύθυνσης https://appleworldhellas.com/feed. Ακολουθήστε επίσης το AppleWorldHellas.com σε Facebook, Twitter, Instagram, και YouTube