ChatGPT – Bing- Bard: σε τι διαφέρουν;

   Χρόνος ανάγνωσης: 5 λεπτά

Το 2023 η δημόσια συζήτηση αναφορικά με την ΤΝ μονοπωλήθηκε από το ChatGPT. Από ότι δείχνουν οι πρώτες μέρες του 2024 αυτή η συζήτηση θα συνεχιστεί. Και όσο συζητάμε η τεχνολογία θα μπαίνει όλο και πιο πολύ μέσα στην επαγγελματική και όχι μόνο, καθημερινότητά μας.

Πέρα από τον κλάδο marketing δεν έχει υπάρξει επαγγελματικός κλάδος που να μην συζήτησε ή να μην εξακολουθεί να συζητάει για την τεχνητή νοημοσύνη και την εισβολή της στο επάγγελμά του.

Από το λανσάρισμα του ChatGPT τον Νοέμβριο 2022 και μετά γνωρίσαμε επίσης τον Bard αλλά και το Bing. [Bing είναι η γνωστή μηχανή αναζήτησης της Microsoft η οποία έχει αντικαταστήσει τα: Live Search, Windows Live Search και MSN Search.

Μιλώντας για όλα αυτά, μιλάμε ουσιαστικά για την ρομποτική τεχνολογία που απαντά απλά ερωτήματα, προτείνει ιδέες για περιεχόμενο, διορθώνει κώδικα, δημιουργεί εικόνες και Video και πολλά, πολλά ακόμα.

Ποια από τις τρεις όμως είναι η πιο καλή/αξιόπιστη/έγκυρη; Ποια από όλες να προτιμήσετε να χρησιμοποιείτε;

Ας συγκρίνουμε μερικά βασικά στοιχεία.

  ChatGPT Bard Bing
Τιμή Η βασική έκδοση είναι δωρεάν. Η πληρωμένη κοστίζει 20$/μήνα Δωρεάν για χρήστες που μπήκαν σε λίστα αναμονής και έγιναν αποδεκτοί Δωρεάν μετά από λίστα αναμονής
API Διαθέσιμο με χρέωση Όχι ακόμα Όχι ακόμα
Παραγωγός OpenAI Google (Alphabet) OpenAI
Τεχνολογία GPT-4 LaMDA GPT-4
Πρόσβαση σε πληροφορίες Το δωρεάν μοντέλο έχει εκπαιδευτεί με δεδομένα έως και το 2021. Η εκπαίδευση συνεχίζεται αλλά τα μεταγενέστερα δεδομένα δεν περιλαμβάνονται στις απαντήσεις.

Η έκδοση GTP4 έχει δεδομένα έως τον Απρίλιο του 2023

Όλα τα δεδομένα της Google σε πραγματικό χρόνο Όλα τα δεδομένα του Bing σε πραγματικό χρόνο

 

Τι είναι GPT και τι είναι LaMDA;

GPT και LaMDA είναι οι τεχνολογίες που υποστηρίζουν το ChatGPT και το BARD αντίστοιχα οι οποίες διαφέρουν εντελώς ως προς το παραγόμενο προϊόν.

Ακόμα και το Bing που συνεργάζεται με την OpenAI, δηλαδή με το GPT, παρεμβάλει ένα fine tuning ώστε να επεξεργάζεται τις απαντήσεις πριν αυτές φτάσουν στον τελικό χρήστη.

Δηλαδή, ενώ το GPT είναι ένα ολοκληρωμένο σύστημα από μόνο του, το Bard και το Bing αποτελούν κομμάτι ενός μεγαλύτερου συστήματος (της αναζήτησης) και έτσι οφείλουν να ελέγξουν τις απαντήσεις/πληροφορίες πριν τις δώσουν.

Πηγή εικόνας: fireflies.ai

ChatGPT = Chat Generative Pre-trained Transformer

Όπως υποδηλώνει και το όνομά του το GPT είναι προεκπαιδευμένο επάνω σε τόνους δεδομένων. Η εκπαίδευση αποτελείται από δύο στάδια: την ανεπιτήρητη εκπαίδευση και τον μετέπειτα συντονισμό της. Το μοντέλο έχει διδαχθεί από 175 εκατομμύρια (!) παραμέτρους μερικές μόνο από τις οποίες είναι: η αρθρογραφία, τα βιβλία, οι ιστοσελίδες κλπ. Εν τω μεταξύ το μοντέλο της OpenAI δέχεται plug ins που του δίνουν τη δυνατότητα να συμπεριλαμβάνει δεδομένα σε πραγματικό χρόνο.

Πηγή εικόνας: medium.com

LaMDA = Language Model For Dialogue Applications

Αναπτύσσοντας την ΤΝ η Google αποφάσισε να χρησιμοποιήσει το παραπάνω μοντέλο για τον απλούστατο λόγο ότι αυτός ταιριάζει με τον τρόπο που μιλάμε και απαντάμε σε ερωτήσεις. Έτσι η πλατφόρμα εκπαιδεύτηκε σε διαλόγους και ανθρώπινες συζητήσεις ενώ χρησιμοποιεί όλα τα δεδομένα της αναζήτησης για να παράξει απαντήσεις σε πραγματικό χρόνο. Προς το παρόν δεν γνωρίζουμε περισσότερα για τον τρόπο που συλλέγει δεδομένα το μοντέλο της Google.

Κάτι που πρέπει να αναφερθεί και για τα δύο μοντέλα είναι το γεγονός των λαθών: τα λάθη είναι συχνά και πάντα απαιτείται ανθρώπινος έλεγχος πριν την χρήση των απαντήσεων. Για αυτό άλλωστε τόσο η Google όσο και το Bing εμφανίζουν σχετικά προειδοποιητικά μηνύματα.

Οπότε αν ζητήσετε επιστημονικά δεδομένα και μελέτες, βεβαιωθείτε ότι θα ελέγξετε τα στοιχεία που θα λάβετε.

Ποιο Chatbot είναι το καλύτερο στο στάδιο που βρισκόμαστε;

Το Search Engine Journal «έτρεξε» εκτεταμένες δοκιμές κάνοντας τις ίδιες ερωτήσεις και στα τρία chatbots και έβγαλε την ετυμηγορία.

Οι ερωτήσεις ήταν πολλές και ποικίλες. Μία ρωτούσε τους παράγοντες SEO που θα βελτιώσουν ένα website, μία άλλη ζητούσε πληροφορίες για ταξίδι στην Ιταλία, μία τρίτη αφορούσε το βιογραφικό του αρθρογράφου (άσημος, άγνωστος) και μία τέταρτη ήταν εντελώς τεχνική και ζητούσε την κατασκευή ενός robots.txt αρχείου το οποίο θα κάνει ένα συγκεκριμένο έργο.

Οι απαντήσεις έδειξαν ότι κάθε εργαλείο έχει δυνατά και αδύνατα σημεία.

Το ChatGPT είναι ιδανικό για δημιουργία κειμένων, ανεξαρτήτως μεγέθους αλλά θέλει έλεγχο από ειδικούς σε ότι αφορά τα δεδομένα που παρουσιάζει.

Ο Bard είναι πιο γρήγορος και δίνει αξιοπρεπείς απαντήσεις αλλά υστερεί λίγο στην αρχική απάντηση. Έχει πολύ καλό user interface και «έχει» τις απαντήσεις.

Ο Bing συμπεριλαμβάνει τις πηγές των απαντήσεων, κάτι που μάλλον καλό είναι, και ίσως θα έπρεπε να το συμπεριλάβουν όλα τα chatbots. Η πλατφόρμα είναι εύχρηστη. Ακούγεται ότι θα συμπεριλάβει διαφημίσεις (ως πηγές για απαντήσεις) κάτι που θα έχει ενδιαφέρον να δούμε πως θα γίνει. Δηλαδή πως θα ορίζεται η προτεραιότητα; Θα εμφανίζεται μία πληρωμένη διαφήμιση ως απάντηση ή θα απλώς θα μπορεί να αντλεί πληροφορίες από τις διαφημίσεις;

Γενικώς η χρήση των παραπάνω εργαλείων ήταν πολύ ενδιαφέρουσα κάτι που κάνει τις «καρέκλες» των παραδοσιακών publishers περιεχομένου να τρίζουν. Ωστόσο είναι αρκετά νωρίς για να προδικάσουμε.

Πηγή εικόνας: youthtimemag.com

Τι υπάρχει γύρω από την ΤΝ;

Plugins

Γύρω από το ChatGPT έχουν δημιουργηθεί διάφορα plugins, πάνω από 1000, τόσο από την ίδια την OpenAI όσο και από άλλες εταιρείες και είναι διαθέσιμα στην Plus έκδοση. Στόχος όλων αυτών των plugins είναι να «ξεκλειδώσουν την πλήρη δυναμική της τεχνολογίας και να διευκολύνουν την αφομοίωσή της από τον χρήστη . Υπάρχουν πολλών διαφορετικών ειδών plugins: σχεδιαστικά/ γραφιστικά, ταξιδιωτικά, αυτά που βελτιώνουν την εντολοδοσία προς την εφαρμοφή, αυτά που βοηθούν τον χρήστη να κάνει κράτηση στο αγαπημένο του εστιατόριο και πολλά ακόμα.

DALL-e

Το DALL-e είναι ένα σύστημα ΤΝ το οποίο μπορεί να δημιουργήσει εικόνα από μόνο μία απλή φωνητική περιγραφή. Το αποτέλεσμα μπορεί να είναι εικόνα, emoji ή πίνακας ζωγραφικής και είναι πραγματικά mind blowing.  Αυτή την περίοδο βρισκόμαστε στο DALL-e 3 όπου το μοντέλο μπορεί πλέον να αντιλαμβάνεται το ύφος και τις αποχρώσεις στον λόγο και να προσαρμόζει αυτά που παράγει αναλόγως. Fun fact: το όνομα της εφαρμογής προέρχεται από το γνωστό animated ρομποτάκι της Pixar, τον WALL-E και τον Ισπανό σουρεαλιστή καλλιτέχνη Salvador Dalí.

Gemini

Έχει δεν έχει περάσει ένας μήνας από τότε που η Google ανακοίνωσε την κυκλοφορία του Gemini. Το Gemini είναι μεγαλύτερο και ικανότερο μοντέλο ΤΝ από όσα έχει μέχρι στιγμής φτιάξει η Google.

Σχεδιάστηκε εξ’ αρχής ώστε να είναι πολυτροπικό, πράγμα που σημαίνει ότι μπορεί να γενικεύει και να κατανοεί αδιάλειπτα, να λειτουργεί και να συνδυάζει διαφορετικούς τύπους πληροφοριών όπως κείμενο, κώδικα, ήχο, εικόνα και video. WOW!

Παράλληλα είναι το πιο ευέλικτο μοντέλο αφού ανάλογα με την έκδοση (υπάρχουν τρεις) μπορεί να χρησιμοποιηθεί από ένα κινητό μέχρι ένα data center.

Πηγή εικόνας: google.com

Με λίγα λόγια…

Η ΤΝ έχει ήδη μπει στην ζωή μας και σχεδόν σίγουρα έχετε παρατηρήσει πόσο πολύ έχουν αλλάξει οι διάφορες αναζητήσεις που κάνουμε (κυρίως ως προς τα αποτελέσματα που παίρνουμε). Η υπολογιστική δυνατότητα έχει πολλαπλασιαστεί και ακόμα είμαστε στην αρχή. Φανταστείτε πόσα ακόμα έχουμε να δούμε και να ζήσουμε. Όσο βελτιώνονται τα μοντέλα και εξαπλώνεται η μηχανική μάθηση τόσο πιο εύκολη και αποτελεσματική θα είναι η συνεννόησή μας με τις μηχανές.

Εσείς; Πόσο βαθιά έχετε μπει στην χρήση της ΤΝ;

 

Πηγή Εικόνας Προφίλ: medium.com

Facebook
Twitter
LinkedIn

Τελευταία Άρθρα

   Χρόνος ανάγνωσης: 4 λεπτάΓια το Google Gemini έχουμε ξαναγράψει αλλά ας πούμε ακόμα δυο λόγια. Το Gemini είναι ο απόγονος του BARD και είναι

26 Απριλίου, 2024

Το πιο γνωστό ελληνικό βιβλίο για κερδοφόρα E-Shops