Μια νέα αναφορά από το The Information αποκαλύπτει σήμερα μεγάλο μέρος της εσωτερικής αναταραχής πίσω από την ανανεωμένη έκδοση του Siri της Apple Intelligence.

Η Apple προφανώς εξέτασε πολλαπλές επιλογές για το backend του Apple Intelligence. Μια αρχική ιδέα ήταν να δημιουργηθούν τόσο μικρά όσο και μεγάλα μοντέλα γλωσσών, με τα ονόματα “Mini Mouse” και “Mighty Mouse”, για να εκτελούνται τοπικά σε iPhones και στο cloud, αντίστοιχα.
Η ηγεσία της Siri αποφάσισε στη συνέχεια να ακολουθήσει διαφορετική κατεύθυνση και να δημιουργήσει ένα ενιαίο μεγάλο μοντέλο γλωσσών για να χειρίζεται όλα τα αιτήματα μέσω του cloud, πριν από μια σειρά περαιτέρω τεχνικών αλλαγών. Η αναποφασιστικότητα και οι επαναλαμβανόμενες αλλαγές κατεύθυνσης φέρεται να απογοήτευσαν τους μηχανικούς και ώθησαν ορισμένα μέλη του προσωπικού να εγκαταλείψουν την Apple.
Εκτός από τη βαθιά ριζωμένη στάση της Apple σχετικά με την ιδιωτικότητα, οι αντικρουόμενες προσωπικότητες εντός της Apple συνέβαλαν στα προβλήματα. Περισσότεροι από μισή ντουζίνα πρώην υπάλληλοι που εργάζονταν στην ομάδα τεχνητής νοημοσύνης και μηχανικής μάθησης της Apple δήλωσαν στο The Information ότι η κακή ηγεσία ευθύνεται για τα προβλήματα εκτέλεσης, επικαλούμενοι μια υπερβολικά χαλαρή κουλτούρα, καθώς και έλλειψη φιλοδοξίας και όρεξης για ανάληψη κινδύνων κατά το σχεδιασμό μελλοντικών εκδόσεων της Siri.
Η ομάδα Τεχνητής Νοημοσύνης/Μηχανικής Μάθησης της Apple έχει χαρακτηριστεί εσωτερικά ως «Χωρίς ΣΚΟΠΟ», ενώ οι εργαζόμενοι λέγεται ότι αναφέρονται στη Siri ως «καυτή πατάτα» που συνεχώς ανταλλάσσεται μεταξύ διαφορετικών ομάδων χωρίς σημαντικές βελτιώσεις.
Υπήρξαν επίσης συγκρούσεις σχετικά με υψηλότερες αμοιβές, ταχύτερες προαγωγές, μεγαλύτερες διακοπές και μικρότερες ημέρες εργασίας για τους συναδέλφους στην ομάδα Τεχνητής Νοημοσύνης. Ο επικεφαλής της Τεχνητής Νοημοσύνης της Apple, John Giannandrea, ήταν προφανώς βέβαιος ότι θα μπορούσε να διορθώσει τη Siri με τα σωστά δεδομένα εκπαίδευσης και καλύτερη αναζήτηση απαντήσεων σε ερωτήσεις γενικής γνώσης.
Οι ανώτεροι ηγέτες δεν απάντησαν με αίσθημα επείγοντος στο ντεμπούτο του ChatGPT το 2022. Ο Giannandrea είπε στους υπαλλήλους ότι δεν πίστευε ότι τα chatbots όπως το ChatGPT πρόσθεσαν μεγάλη αξία για τους χρήστες. Το 2023, οι διευθυντές της Apple είπαν στους μηχανικούς ότι απαγορευόταν να συμπεριλαμβάνουν μοντέλα από άλλες εταιρείες στα τελικά προϊόντα της Apple και μπορούσαν να τα χρησιμοποιήσουν μόνο για να συγκρίνουν με τα δικά τους μοντέλα, αλλά τα δικά της μοντέλα της Apple «δεν απέδωσαν τόσο καλά όσο η τεχνολογία της OpenAI».
Εν τω μεταξύ, ο επικεφαλής της Siri, Robby Walker, επικεντρώθηκε σε «μικρές νίκες», όπως η μείωση του χρόνου αναμονής για τις απαντήσεις της Siri. Ένα από τα αγαπημένα έργα του Walker ήταν η αφαίρεση του «hey» από τη φωνητική εντολή «hey Siri» που χρησιμοποιείται για την κλήση του βοηθού, κάτι που χρειάστηκε πάνω από δύο χρόνια για να επιτευχθεί. Επίσης, απέρριψε την προσπάθεια μιας ομάδας μηχανικών να χρησιμοποιήσουν LLM για να δώσουν στη Siri μεγαλύτερη συναισθηματική ευαισθησία, ώστε να μπορεί να ανιχνεύει και να δίνει κατάλληλες απαντήσεις σε χρήστες που βρίσκονται σε κίνδυνο.
Η Apple ξεκίνησε ένα έργο με την κωδική ονομασία «Link» για την ανάπτυξη φωνητικών εντολών για τον έλεγχο εφαρμογών και την ολοκλήρωση εργασιών για το Vision Pro, με σχέδια να επιτρέπει στους χρήστες να πλοηγούνται στον ιστό και να αλλάζουν το μέγεθος των παραθύρων μόνο με φωνή, καθώς και να υποστηρίζουν εντολές από πολλά άτομα σε έναν κοινόχρηστο εικονικό χώρο για συνεργασία. Οι περισσότερες από αυτές τις λειτουργίες καταργήθηκαν λόγω της αδυναμίας της ομάδας της Siri να τις επιτύχει.
Η έκθεση ισχυρίζεται ότι η επίδειξη των πιο εντυπωσιακών χαρακτηριστικών της Apple Intelligence στο WWDC 2024, όπως το πού η Siri έχει πρόσβαση στα email ενός χρήστη για να βρει δεδομένα πτήσης σε πραγματικό χρόνο και παρέχει υπενθύμιση για τα σχέδια μεσημεριανού γεύματος χρησιμοποιώντας μηνύματα και σχεδιάζει μια διαδρομή σε χάρτες, ήταν ουσιαστικά φανταστική. Η επίδειξη προφανώς αποτέλεσε έκπληξη για τα μέλη της ομάδας Siri, τα οποία δεν είχαν δει ποτέ λειτουργικές εκδόσεις των δυνατοτήτων. Το μόνο χαρακτηριστικό από την επίδειξη του WWDC που ενεργοποιήθηκε σε δοκιμαστικές συσκευές ήταν η παλλόμενη, πολύχρωμη κορδέλα της Apple Intelligence γύρω από την άκρη της οθόνης.
Η απόφαση να παρουσιαστεί μια τεχνητή επίδειξη ήταν μια σημαντική απόκλιση από την προηγούμενη συμπεριφορά της Apple, όπου στις εκδηλώσεις της έδειχνε μόνο χαρακτηριστικά και προϊόντα που ήδη λειτουργούσαν σε δοκιμαστικές συσκευές και τα οποία η ομάδα μάρκετινγκ της είχε εγκρίνει για να διασφαλίσει ότι θα μπορούσαν να κυκλοφορήσουν εντός του χρονοδιαγράμματος.
Λέγεται ότι ορισμένοι υπάλληλοι της Apple είναι αισιόδοξοι ότι ο Craig Federighi και ο Mike Rockwell μπορούν να αλλάξουν τη Siri. Ο Federighi προφανώς έχει δώσει εντολή στους μηχανικούς της Siri να κάνουν «ό,τι χρειάζεται για να δημιουργήσουν τις καλύτερες δυνατότητες τεχνητής νοημοσύνης», ακόμα κι αν αυτό σημαίνει τη χρήση μοντέλων ανοιχτού κώδικα από άλλες εταιρείες στα προϊόντα λογισμικού της, σε αντίθεση με τα δικά της μοντέλα της Apple.
Aκολουθήστε το AppleWorldHellas στο Google News για να ενημερώνεστε άμεσα για όλα τα νέα άρθρα! Όσοι χρησιμοποιείτε υπηρεσία RSS (π.χ. Feedly), μπορείτε να προσθέσετε το AppleWorldHellas στη λίστα σας με αντιγραφή και επικόλληση της διεύθυνσης https://appleworldhellas.com/feed. Ακολουθήστε επίσης το AppleWorldHellas.com σε Facebook, Twitter, Instagram, και YouTube.