Monday, November 18, 2024

Το νέο μοντέλο AI της Apple επεξεργάζεται εικόνες με βάση την εισαγωγή φυσικής γλώσσας

Οι ερευνητές της Apple κυκλοφόρησαν ένα νέο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα που είναι σε θέση να επεξεργάζεται εικόνες με βάση τις οδηγίες φυσικής γλώσσας του χρήστη (μέσω VentureBeat).

Το νέο μοντέλο AI της Apple επεξεργάζεται εικόνες με βάση την εισαγωγή φυσικής γλώσσας

Ονομάζεται “MGIE”, που σημαίνει MLLM-Guided Image Editing, χρησιμοποιεί πολυτροπικά μοντέλα μεγάλων γλωσσών (MLLMs) για την ερμηνεία των αιτημάτων των χρηστών και την εκτέλεση χειρισμών σε επίπεδο pixel.

Το μοντέλο είναι σε θέση να επεξεργάζεται διάφορες πτυχές εικόνων. Οι βελτιώσεις φωτογραφιών μπορούν να περιλαμβάνουν φωτεινότητα, αντίθεση ή ευκρίνεια ή την εφαρμογή καλλιτεχνικών εφέ όπως σκίτσο.

Η τοπική επεξεργασία μπορεί να τροποποιήσει το σχήμα, το μέγεθος, το χρώμα ή την υφή συγκεκριμένων περιοχών ή αντικειμένων σε μια εικόνα, ενώ οι τροποποιήσεις σε στυλ Photoshop μπορούν να περιλαμβάνουν περικοπή, αλλαγή μεγέθους, περιστροφή και προσθήκη φίλτρων ή ακόμα και αλλαγή φόντου και ανάμειξη εικόνων.

Η συμβολή του χρήστη για μια φωτογραφία μιας πίτσας θα μπορούσε να είναι “να την κάνει να φαίνεται πιο υγιεινή”. Χρησιμοποιώντας λογική, το μοντέλο μπορεί να προσθέσει επικαλύψεις λαχανικών, όπως ντομάτες και βότανα. Ένα αίτημα εισαγωγής καθολικής βελτιστοποίησης μπορεί να έχει τη μορφή “προσθήκη αντίθεσης για προσομοίωση περισσότερου φωτός”, ενώ μια τροποποίηση σε στυλ Photoshop θα μπορούσε να γίνει ζητώντας από το μοντέλο να αφαιρέσει άτομα από το φόντο μιας φωτογραφίας, μετατοπίζοντας την εστίαση της εικόνας στο έκφραση του προσώπου του υποκειμένου.

Η Apple συνεργάστηκε με ερευνητές του Πανεπιστημίου της Καλιφόρνια για να δημιουργήσει το MGIE, το οποίο παρουσιάστηκε σε μια εργασία στο International Conference on Learning Representations (ICLR) 2024. Το μοντέλο είναι διαθέσιμο στο GitHub και περιλαμβάνει τον κώδικα, τα δεδομένα και τα προ εκπαιδευμένα μοντέλα.

Aκολουθήστε το AppleWorldHellas στο Google News για να ενημερώνεστε άμεσα για όλα τα νέα άρθρα! Όσοι χρησιμοποιείτε υπηρεσία RSS (π.χ. Feedly), μπορείτε να προσθέσετε το AppleWorldHellas στη λίστα σας με αντιγραφή και επικόλληση της διεύθυνσης https://appleworldhellas.com/feed. Ακολουθήστε επίσης το AppleWorldHellas.com σε FacebookTwitterInstagram, και YouTube

Dimitrios Georgoulas
Dimitrios Georgoulas
Dimitris is the co-owner and chief in editor of AppleWorldHellas. With a PhD Degree in Wireless Sensor Networks and with more than 10 years experience in covering Apple and technology news he loves the challenges and new adventures.
Video thumbnail
Quad Lock iPhone 16 Series Cases Review - Ένα μοναδικό οικοσύστημα που διαφέρει
16:31
Video thumbnail
iPhone 16 Pro Unboxing και Πρώτες Εντυπώσεις: Πόσο εύκολα θα κερδίσει τους καταναλωτές φέτος;
29:30
Video thumbnail
🐁 Logitech MX Master 3S για Mac: Το καλύτερο ποντίκι για χρήστες Mac;
24:21
Video thumbnail
🖥️🥸 Minisforum NAB6 Lite: Ένα Mini PC που δεν πρέπει να προσπεράσετε
29:21
Video thumbnail
🤩 Govee TV Backlight 3 Lite: Το δοκιμάσαμε, εντυπωσιατήκαμε και σας έχουμε και εκπτωτική προσφορά!
36:04
Video thumbnail
😮🤩 Withings Body Scan: Δοκιμάσαμε την πιο έξυπνη και premium ζυγαριά της αγοράς!
29:31
Video thumbnail
Withings ScanWatch 2 Review: Η διαφορετικότητα του που μας κέρδισε
37:34
Video thumbnail
💼 GRAMS28 109 Essential Case & 132 Essential Pro Case Review: Μια μοναδική εμπειρία που ξεχωρίζει
26:50
Video thumbnail
👨🏻‍💻 Lofree Flow Keyboard: Ένα μηχανικό πληκτρολόγιο χαμηλού προφίλ που δεν πρέπει να προσπεράσετε
15:52
Video thumbnail
Lululook 360 Rotating Foldable Laptop Stand: Είναι μια από τις καλύτερες επιλογές της αγοράς;
18:54
Video thumbnail
Mujjo δερμάτινες θήκες για iPhone 15 Pro/Pro Max Review: Γιατί και φέτος είναι στις top επιλογές
15:09
Video thumbnail
📱iPhone 15 Pro Max Review: Ακόμη πιο κοντά στο τέλειο
42:11