Saturday, June 15, 2024

Το νέο μοντέλο AI της Apple επεξεργάζεται εικόνες με βάση την εισαγωγή φυσικής γλώσσας

Οι ερευνητές της Apple κυκλοφόρησαν ένα νέο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα που είναι σε θέση να επεξεργάζεται εικόνες με βάση τις οδηγίες φυσικής γλώσσας του χρήστη (μέσω VentureBeat).

Ονομάζεται “MGIE”, που σημαίνει MLLM-Guided Image Editing, χρησιμοποιεί πολυτροπικά μοντέλα μεγάλων γλωσσών (MLLMs) για την ερμηνεία των αιτημάτων των χρηστών και την εκτέλεση χειρισμών σε επίπεδο pixel.

Το μοντέλο είναι σε θέση να επεξεργάζεται διάφορες πτυχές εικόνων. Οι βελτιώσεις φωτογραφιών μπορούν να περιλαμβάνουν φωτεινότητα, αντίθεση ή ευκρίνεια ή την εφαρμογή καλλιτεχνικών εφέ όπως σκίτσο.

Η τοπική επεξεργασία μπορεί να τροποποιήσει το σχήμα, το μέγεθος, το χρώμα ή την υφή συγκεκριμένων περιοχών ή αντικειμένων σε μια εικόνα, ενώ οι τροποποιήσεις σε στυλ Photoshop μπορούν να περιλαμβάνουν περικοπή, αλλαγή μεγέθους, περιστροφή και προσθήκη φίλτρων ή ακόμα και αλλαγή φόντου και ανάμειξη εικόνων.

Η συμβολή του χρήστη για μια φωτογραφία μιας πίτσας θα μπορούσε να είναι “να την κάνει να φαίνεται πιο υγιεινή”. Χρησιμοποιώντας λογική, το μοντέλο μπορεί να προσθέσει επικαλύψεις λαχανικών, όπως ντομάτες και βότανα. Ένα αίτημα εισαγωγής καθολικής βελτιστοποίησης μπορεί να έχει τη μορφή “προσθήκη αντίθεσης για προσομοίωση περισσότερου φωτός”, ενώ μια τροποποίηση σε στυλ Photoshop θα μπορούσε να γίνει ζητώντας από το μοντέλο να αφαιρέσει άτομα από το φόντο μιας φωτογραφίας, μετατοπίζοντας την εστίαση της εικόνας στο έκφραση του προσώπου του υποκειμένου.

Η Apple συνεργάστηκε με ερευνητές του Πανεπιστημίου της Καλιφόρνια για να δημιουργήσει το MGIE, το οποίο παρουσιάστηκε σε μια εργασία στο International Conference on Learning Representations (ICLR) 2024. Το μοντέλο είναι διαθέσιμο στο GitHub και περιλαμβάνει τον κώδικα, τα δεδομένα και τα προ εκπαιδευμένα μοντέλα.

Aκολουθήστε το AppleWorldHellas στο Google News για να ενημερώνεστε άμεσα για όλα τα νέα άρθρα! Όσοι χρησιμοποιείτε υπηρεσία RSS (π.χ. Feedly), μπορείτε να προσθέσετε το AppleWorldHellas στη λίστα σας με αντιγραφή και επικόλληση της διεύθυνσης https://appleworldhellas.com/feed. Ακολουθήστε επίσης το AppleWorldHellas.com σε FacebookTwitterInstagram, και YouTube

Dimitrios Georgoulas
Dimitrios Georgoulas
Dimitris is the co-owner and chief in editor of AppleWorldHellas. With a PhD Degree in Wireless Sensor Networks and with more than 10 years experience in covering Apple and technology news he loves the challenges and new adventures.