Τεχνητή Νοημοσύνη, Τεχνολογία

Q* / Q-Star : Νέα απειλή;

Γράφει η Βίκυ Βούλτσου

Η εταιρία OpenAI δημιουργήθηκε με σκοπό, μη κερδοσκοπικό, να ενημερώνει το κόσμο για την ασφαλή και επικερδέστερη χρήση της τεχνητής νοημοσύνης. Μέσα από αυτό δημιουργήθηκε ένα τμήμα το οποίο έχει κερδοσκοπικό σκοπό και συνεργάζεται με την Microsoft. Αυτό το τμήμα είχε ως στόχο να ελέγχει τα μέλη του οργανισμού και τις δράσεις τους, ώστε να μην χρησιμοποιούνται όσα βρίσκουν με κακόβουλο τρόπο.

Πρόσφατα έγινε γνωστό ότι, οι ερευνητές του προσωπικού της OpenAI έγραψαν μια επιστολή προς το διοικητικό συμβούλιο προειδοποιώντας ότι ένα εσωτερικό έργο με την ονομασία «Q*» ή «Q-Star» θα μπορούσε να αποτελέσει μια σημαντική ανακάλυψη στη δημιουργία τεχνητής νοημοσύνης, που θα μπορούσε να ξεπεράσει την ανθρώπινη νοημοσύνη σε μια σειρά από τομείς. Τι είναι όμως το Q* ;

Το Q* είναι ένα μοντέλο τεχνητής νοημοσύνης που συνδυάζει την εκμάθηση Q (Q-Learning) και την αναζήτηση A*. Στη μάθηση των υπολογιστών, ένα κοινό μειονέκτημα είναι ο τεράστιος όγκος δεδομένων που χρειάζονται τα μοντέλα για να εκπαιδευτούν. Όσο πιο πολύπλοκο είναι ένα μοντέλο, τόσο περισσότερα δεδομένα μπορεί να απαιτεί. Ακόμη και μετά από όλα αυτά, τα δεδομένα που λαμβάνουμε μπορεί να μην είναι αξιόπιστα. Μπορεί να έχουν ψευδείς ή ελλιπείς τιμές ή να έχουν συλλεχθεί από μη αξιόπιστες πηγές. Αυτό που βοηθά να ξεπεραστεί το πρόβλημα απόκτησης δεδομένων είναι η ενισχυτική μάθηση. Η ενισχυτική μάθηση είναι ένας κλάδος της μηχανικής μάθησης που εκπαιδεύει ένα μοντέλο να καταλήξει σε μια βέλτιστη λύση για ένα πρόβλημα λαμβάνοντας αποφάσεις από μόνο του. Η Q-Learning λοιπόν, είναι μια πολιτική ενισχυτικής μάθησης η οποία προσπαθεί να βρίσκει κάθε φορά την επόμενη καλύτερη ενέργεια, δεδομένης μιας τρέχουσας κατάστασης. Επιλέγει αυτή τη δράση τυχαία και στοχεύει στη μεγιστοποίηση της ανταμοιβής. Το Α* είναι ένας αλγόριθμος αναζήτησης που χρησιμοποιείται για την εύρεση της συντομότερης διαδρομής μεταξύ ενός αρχικού και ενός τελικού σημείου. Aναζητά πρώτα τις συντομότερες διαδρομές, καθιστώντας τον έτσι έναν βέλτιστο και πλήρη αλγόριθμο.

Επομένως το Q* συνδυάζοντας τις δύο τεχνικές που προαναφέρθηκαν, έχει τη μοναδική στο είδος του ικανότητα, να απαντά αυτόνομα σε στοιχειώδη μαθηματικά προβλήματα, ξεπερνώντας τα όρια των αρχικών δεδομένων εκπαίδευσής του. Αυτή η ικανότητα αποτελεί χαρακτηριστικό γνώρισμα των προηγμένων συστημάτων τεχνητής νοημοσύνης, τα οποία προοδεύουν προς τον ευρύτερο και πιο φιλόδοξο στόχο της “Artificial General intelligence” (AGI), κατά τον οποίο η τεχνητή νοημοσύνη μπορεί να εκτελεί ένα ευρύ φάσμα διανοητικών λειτουργιών, παρόμοια με τον ανθρώπινο εγκέφαλο. Για παράδειγμα, τα νέα κινητά τηλέφωνα, smartphones, χρησιμοποιούν τεχνητή νοημοσύνη για να παρέχουν έναν εικονικό βοηθό ο οποίος λειτουργεί ως προσωπικός γραμματέας του χρήστη. Υπενθυμίζει στον χρήστη συναντήσεις, μπορεί να απαντήσει σε ερωτήσεις και να παρέχει συστάσεις. Επίσης λειτουργεί ως ένας ηλεκτρονικός συνομιλητής ο οποίος έχει προσαρμοστεί σε συγκεκριμένα χαρακτηριστικά κάποιου ατόμου.

Όπως είναι φυσικό κάτι το οποίο είναι άγνωστο, τρομάζει. Στη συγκεκριμένη περίπτωση, το Q* έχει σίγουρα να προσφέρει πολλά, καθώς αποτελεί μια εξέλιξη που θα μπορούσε να διαμορφώσει το μέλλον της τεχνητής νοημοσύνης. Θα πρέπει να δοθεί ιδιαίτερη προσοχή στο σκοπό για τον οποίο θα χρησιμοποιηθεί αυτό το εργαλείο και να διασφαλιστεί η ανθρώπινη ασφάλεια, ώστε μελλοντικά η τεχνητή νοημοσύνη να λειτουργεί προς όφελος της ανθρωπότητας.

Πηγές:

https://www.simplilearn.com/tutorials/machine-learning-tutorial/what-is-q-learning

https://medium.com/@arthur.sedek/what-is-q-model-from-openai-d98ad28c7f0c

https://gizmodo.com/sam-altman-openai-q-machine-learning-artificial-intelli-1851062584

https://www.simplilearn.com/tutorials/artificial-intelligence-tutorial/a-star-algorithm

https://www.europarl.europa.eu/news/el/headlines/society/20200827STO85804/ti-einai-i-techniti-noimosuni-kai-pos-chrisimopoieitai