Η Meta παρουσίασε τον Ιούλιο την υπηρεσία Make-a-Scene που με τη βοήθεια της τεχνητής νοημοσύνης, μετατρέπει μια πρόταση σε εικόνα, όπως ακριβώς το Dall-E και το Midjourney. Όπως κάθε παρόμοια υπηρεσία, έτσι κι’αυτή χρησιμοποιεί αλγορίθμους μηχανικής μάθησης (και τεράστιες βάσεις δεδομένων με έργα τέχνης στο διαδίκτυο) για τη δημιουργία φανταστικών απεικονίσεων που ο χρήστης περιγράφει με μια απλή πρόταση. Την Πέμπτη, ο διευθύνων σύμβουλος της Meta, Mark Zuckerberg, αποκάλυψε την πιο σύγχρονη έκδοση του Make-a-Scene, το Make-a-Video το οποίο αντί για εικόνα δημιουργεί..βίντεο.
Όπως υποδηλώνει και το όνομά του, το Make-a-Video είναι «ένα νέο σύστημα τεχνητής νοημοσύνης που επιτρέπει στους ανθρώπους να μετατρέπουν μια πρόταση κειμένου σε σύντομα, υψηλής ποιότητας βίντεο κλιπ», έγραψε ο Zuckerberg στο blog της Meta. Τεχνικά, το Video λειτουργεί με τον ίδιο τρόπο που λειτουργεί και το Scene – βασιζόμενο σε ένα μείγμα επεξεργασίας φυσικής γλώσσας και παραγωγικών νευρωνικών δικτύων για τη μετατροπή μη οπτικών προτροπών σε εικόνες – απλώς αντλεί περιεχόμενο σε διαφορετική μορφή.
«Η διαίσθησή μας είναι απλή: να μάθουμε πώς μοιάζει ο κόσμος και πώς περιγράφεται από ζευγαρωμένα δεδομένα κειμένου-εικόνας, και να μάθουμε πώς κινείται ο κόσμος από βίντεο υλικό», έγραψε η ομάδα ερευνητών της Meta σε έγγραφο που δημοσιεύθηκε αυτή την εβδομάδα. Με αυτόν τον τρόπο η ομάδα κατάφερε να μειώσει τον χρόνο που απαιτείται για την εκπαίδευση του μοντέλου Video και να εξαλείψει την ανάγκη για ζευγαρωμένα δεδομένα κειμένου-βίντεο, διατηρώντας παράλληλα «την ποικιλομορφία στην αισθητική (φανταστικέ …
Διαβάστε όλο το άρθρο από την πηγή
© Newsmag.gr 2024. Design by The Design Agency