Τεχνητή νοημοσύνη εναντίον Imaging
Αναδημοσίευση από
photo.gr
Φωτογραφικό ψηφιακό έργο Αrtificial
Intelligence κέρδισε διαγωνισμό ξεσηκώνοντας θύελλα αντιδράσεων και
διασπείροντας το φόβο για την επόμενη μέρα!
Πρόσφατα
διαβάσαμε στα νέα που έκαναν τον γύρο του διαδικτύου, για ένα έργο
που κέρδισε διαγωνισμό – μόνο που δεν προερχόταν από καλλιτεχνικό
χέρι αλλά ήταν δημιούργημα τεχνητής νοημοσύνης. Συγκεκριμένα
πρόκειται για διαγωνισμό FineArt της πολιτείας Colorado στις ΗΠΑ με
νικητή τον Jason Allen που συμμετείχε στην κατηγορία “Digitally
Manipulated Photography” με το ψευδώνυμο Sicarnate. To έργο
κατασκευάστηκε στο σύστημα τεχνητής νοημοσύνης Μidjourney που
βρίσκεται σε στάδιο beta testing και οι φιγούρες ήταν όλες τεχνητές
ενώ η αναγεννησιακή ατμόσφαιρα παραπέμπει σε πίνακα ζωγραφικής αν
και όπως απεκάλυψε ο Allen επεδίωξε το στιλ “space opera”. Μετά η
ανάλυση πολλαπλασιάστηκε με το Gigapixel AI. To έργο είχε τον τίτλο
Theatre d Opera Spatial . Οι κριτές του έδωσαν την πρώτη θέση και το
έπαθλο των 300 δολ. Όμως υπήρξαν πάρα πολλές αντιδράσεις στα social twitter.com/GenelJumalon/status από
δημιουργούς γιατί κέρδισε ένα “ψεύτικο” έργο και όχι ένα έργο του
ανθρώπινου πνεύματος. Mέχρι και η έγκυρη Washington
Post έγραψε σχετικά σχολιάζοντας τις προεκτάσεις του
ζητήματος για την πνευματική δημιουργία που θέτει η παρέμβαση της AI
στην δημιουργικότητα Τελικά, στους όρους του διαγωνισμού δεν υπήρχε
πρόβλεψη για εξαίρεση των έργων τεχνητής νοημοσύνης και έτσι τεχνικά
ο Allen νομότυπα απεκόμισε το πρώτο βραβείο!
Πίσω από την είδηση υπάρχει αρκετό υπόβαθρο.
To έργο του Allen δημιουργήθηκε με το μάλλον άγνωστο από τα φώτα της
δημοσιότητας Midjourney AI, και θα μπορούσε να είχε χρησιμοποιηθεί
και το Stable Diffusion AI, αλλά όλη η ιστορία αρχίζει με το
ευρύτερα γνωστό DALL-E ένα σύστημα τεχνητής νοημοσύνης που εκπόνησε
η εταιρία OpenAI που είναι σε θέση να δημιουργεί εικαστικά έργα
(φωτογραφίες αλλά και ζωγραφικά έργα) παίρνοντας οδηγίες σε φυσική
γλώσσα. Για παράδειγμα ο “εντολέας” μπορεί να ζητήσει να του
ζωγραφίσει ένα πίνακα που να απεικονίζει ένα αγρό με ανεμώνες στο
στιλ ενός ιμπρεσσιονιστή όπως ο Μonet .
Η αρχική έκδοση DALL-E παρουσιάστηκε το 2021
και φέτος αναβαθμίστηκε σε DALL-E 2 με τετραπλάσια ανάλυση και
περισσότερη ακρίβεια και ρεαλισμό. Το σύστημα δουλεύει μετατρέποντας
περιγραφικό προφορικό λόγο σε εικόνες με μια διαδικασία διάχυσης.
Ξεκινάει με μια σειρά τυχαία κατανεμημένων χρωματικών κουκίδων που
μετασχηματίζονται σε διακριτές μορφές ανάλογα με την περιγραφική
οδηγία και το στιλ και τεχνοτροπία που ζητείται. Μόλις ο χρήστης
πάρει το πρώτο αποτέλεσμα έχει τη δυνατότητα να επέμβει μετακινώντας
αντικείμενα στη σύνθεση, διορθώνοντας τις φωτοσκιάσεις, τις
αντανακλάσεις, τα χρώματα, τις υφές και άλλες συνιστώσες, στα σημεία
που επιθυμεί. Το DALL-E έχει κάποιες ασφαλιστικές δικλείδες για να
μη χρησιμοποιηθεί “παράνομα” για δημιουργία deep fakes όπως ότι
απαγορεύει τη δημιουργία προσομοίωσης κανονικών ανθρώπων ή την
αντιγραφή δημόσιων προσώπων ή πορνογραφικών απεικονίσεων. Aπό το
καλοκαίρι του 2022 στις δυνατότητες του DALL-E έχει προστεθεί και το
outpainting δηλ. ένα χαρακτηριστικό που επιτρέπει την επανασχεδίαση
ενός γνωστού πίνακα ζωγραφικής με προσθήκη λεπτομερειών διατηρώντας
το βασικό θέμα π.χ. ένα πορτραίτο.
Προφανώς οι δυνατότητες είναι άπειρες στον
τομέα της φωτογραφίας, της ζωγραφικής, του καρτούν, των
εικονογραφήσεων κλπ. και δυνητικά τρομακτικές όσον αφορά την
περιθωριοποίηση των φυσικών προσώπων-δημιουργών που
δραστηριοποιούνται στον τομέα και μονομιάς θα είναι εκτεθειμένοι
στον αθέμιτο ανταγωνισμό της τεχνητής νοημοσύνης. Έτσι βλέπουμε
ζωντανή και πραγματική μπροστά μας μια μόνον από τις άπειρες
διαστάσεις εφαρμογής της τεχνητής νοημοσύνης που σε πλήρη ανάπτυξη
θα περιθωριοποιήσει πολλές ανθρώπινες δραστηριότητες και θα θέσει
εκτός εργασιακού και κοινωνικού περιβάλλοντος πραγματικούς ανθρώπους
(φωτογράφους, εικονογράφους, ζωγράφους, καρτουνίστες κλπ.) που ως
σήμερα απολαμβάνουν ένα εισόδημα και μια κοινωνική θέση.
Σκεφθείτε ακόμη την εικονική γραμματέα με
τεχνητή νοημοσύνη (όχι ανδροειδές) απλά μια φιγούρα στην άλλη άκρη
του Skype ή του Zoom που απαντά στα αιτήματα επικοινωνίας,
“πληκτρολογεί” υπαγορευμένα κείμενα, κρατά μηνύματα και γενικά
αναλαμβάνει το γραμματειακό ρόλο. Τέτοιες εφαρμογές ΑΙ είναι ήδη
μαζί μας και η μορφή του μέλλοντος δεν είναι τόσο μελλοντική αλλά
άμεση, live κάπου στο ψηφιακό παρόν.