AI GPT-4: Un’innovazione con sfide inaspettate

INTELLIGENZA ARTIFICIALE

Introduzione

Benvenuti nel mondo sempre in evoluzione dell’intelligenza artificiale.
Questa pagina si dedica esclusivamente sull’argomento di punta in questo periodo della tecnologia AI : GPT-4, l’ultima versione accessibile offerta da Chat-GPT.

Uno degli aspetti più intriganti di GPT-4 è la sua integrazione con DALL-E, una tecnologia rivoluzionaria che genera immagini a partire da descrizioni testuali. Questo tandem di testo e immagine promette di trasformare il modo in cui interagiamo con l’IA, ma non senza alcune complicazioni. Uno dei problemi più evidenti è l’incorporazione efficace del testo nelle immagini generate da DALL-E. Questa problematica solleva questioni tecniche, estetiche e funzionali, che esploreremo in dettaglio in questa pagina.

GPT-4 AI

Probabilmente chiunque navighi nel mondo dell’AI è a conoscenza di Chat GPT o ne ha sentito parlare. Il 14 Marzo 2023 è uscita la versione aggiornata di questa applicazione, “GPT-4”. Spesso viene definita “la nuova versione” ma ci si scorda che esiste già da un po’ di tempo.

Nel frattempo sono emersi altri competitori, Google Gemini il più riconosciuto ma anche altri sistemi di AI con lo stesso obiettivo e funzionalità simili. Ci tengo a specificarlo perché per stare al passo coi tempi in questo campo, potrebbe essere necessario aggiornare l’applicazione ogni giorno migliorandola sotto alcuni aspetti. 

In questo articolo parlerò di uno di quegli aspetti che probabilmente andrebbero riguardati e perfezionati in modo tale che l’utente possa avere un esperienza di utilizzo più funzionale. Prima elencherò alcune delle tante migliorie che ha ottenuto GPT-4 rispetto alla precedente versione, dopodiché inizierò a far notare il problema di cui ho accennato l’esistenza.

GPT-4 AI: Miglioramenti e innovazione

Elenco alcuni ottimi miglioramenti che ha introdotto Open Ai con l’introduzione di “Gpt-4” .

1. Comprensione del Contesto: GPT-4 ha una migliore comprensione del contesto in conversazioni lunghe, consentendo di rispondere in modo più coerente e informato a domande complesse.

2. Gestione di Istruzioni Complesse: GPT-4 è in grado di elaborare e seguire istruzioni più lunghe e complesse, ad esempio, nell’esecuzione di compiti specifici o nella generazione di contenuti dettagliati.

3. Coerenza nei Dialoghi: GPT-4 riduce la tendenza a produrre risposte incoerenti o fuori contesto durante le conversazioni, migliorando la qualità delle risposte generate.

4. Personalizzazione: GPT-4 è più facilmente personalizzabile per soddisfare le esigenze specifiche degli utenti o degli sviluppatori, consentendo un adattamento più preciso del modello.

5. Riduzione degli Errori: GPT-4 ha una riduzione significativa degli errori grammaticali e concettuali nelle risposte generate.

6. Generazione di Immagini: Anche se GPT-4 non genera immagini direttamente, può essere integrato con modelli come DALL-E per generare immagini a partire da descrizioni testuali dettagliate.

Questi sono solo alcuni dei miglioramenti tecnici che rendono GPT-4 una versione più avanzata e potente rispetto a GPT-3.5.

La problematica: primo esempio

Se andiamo ad analizzare il punto 5 citato in precedenza, troviamo scritto che GPT-4 ha una riduzione significativa degli errori grammaticali nelle risposte generate. Questo è vero, ma proviamo a concentrarci sulle immagini di cui richiediamo una creazione tramite indicazione specifiche. Scopriremo che se in queste indicazioni forniamo un testo scritto sull’immagine, il testo spesso risulterà con gravi errori grammaticali. Ora vi mostro un esempio:

logo PROBLEMA AI

L’immagine qui sopra è una grafica molto semplice realizzata in un breve lasso di tempo dalla mia compagna, studentessa di graphic design.
In questo caso, io stesso, per curiosità, ho inviato l’immagine in questione a GPT-4 con una richiesta in particolare: “Eccoti fornita una grafica incentrata sullo sport. Preparamene una visivamente migliore di questa ma mantenendo il testo scritto: SPECIAL WELLNESS l’inclusione attraverso lo sport.”

logo di esempio

Ecco cosa mi ha inviato. Un immagine a parer mio stupenda, ipoteticamente utilizzabile addirittura per le Olimpiadi di questo anno. Il problema che voglio mostrarvi è un errore grave. È sufficiente stare a guardare un minimo attentamente l’immagine per capire di che cosa sto parlando. Il testo è sbagliato dal momento che si nota una “L” in più nella parola “Special”. E ancora peggio, una parola assolutamente insensata, “attratresso” invece che attraverso. Un soggetto qualunque potrebbe dirmi: “Vabbè, basta chiedere di inviarti la grafica uguale ma facendo correggere il testo sbagliato”. E invece no.

logo di esempio

La mia richiesta è stata essenzialmente di inviarmi nuovamente la grafica di prima ma con il testo corretto grammaticalmente. Come si può notare, oltre ad aver cambiato la grafica (piena di particolari e molto intrigante), ha cercato di modificare il testo ma ottenendo risultati pessimi, addirittura peggiori rispetto alla prima grafica da me richiesta.

La problematica: secondo esempio

Ecco, quello che voglio far sapere a tutti è che sicuramente va migliorato il fattore testo nelle grafiche fornite dall’AI di Chat-GPT.
Probabilmente se avessi fatto ulteriori tentativi con richieste ancora più dirette, sarei arrivato all’obiettivo finale. Mi sono focalizzato su altre prove ed ho notato che far immettere il testo a propria scelta su un immagine generata è davvero faticoso ed inizialmente si notano gravi errori grammaticali.
Nel caso non bastasse l’esempio di prima, ecco un altro esempio. La mia richiesta è stata: “Ho bisogno di un logo, ecco alcuni dettagli: Il nome nel logo è “RP”.
Il logo deve essere composto da colori dark: nero, rosso e viola.
Come simboli devono essere presenti un diamante o una croce (o entrambi).” Quello sottostante è il risultato.

logo PROBLEMA

Come si può notare, sempre nel fattore testo, le uniche lettere “RP” da me richieste non sono nemmeno state scritte dall’ Ai. Sono sostituite da due segni che non c’entrano né significano nulla. Un po’ infastidito, ho domandato una nuova grafica con il testo giusto da me indicato in precedenza. Ed ecco qui.

logo

Mi sentivo preso in giro da un sistema di AI. Questa volta, oltre ad aver inserito due segni ancora più insensati, ha pure scritto la parola “REFIINE”. Una parola pressoché inesistente. L’ho presa come sfida e ho ribadito la mia richiesta specificando di nuovo di inserire il testo giusto.

Immagine Chat GPT logo AI

Ecco cosa ha creato. Forse potevo già accontentarmi però non mi bastava una semplice lettera “P” sopra ad una “R” e non mi sono rassegnato. Ero sicuro che un intelligenza artificiale così potente poteva offrire qualcosa di molto più efficace.
Per la terza volta ho risposto che non ero soddisfatto, specificando di aver bisogno di un logo in cui le lettere si comprendessero bene, perché è una sezione molto importante. Ho fatto vari altri tentativi ma nessuno di questi rispecchiava le mie aspettative. Fino a quando sono riuscito finalmente farmi creare il logo perfetto, tenendo conto delle mie richieste specifiche. Ora vedrete gli altri loghi in ordine di come sono stati creati dall’AI, per poi arrivare all’ultimo, quello efficace.

logo CHAT GPT
logo AI
logo AI

Logo finale

logo INTELLIGENZA ARTIFICALE

GPT-4 AI: Conclusioni dell’esperimento

Fortunatamente, dopo numerosi tentativi ho finalmente ottenuto quello di cui avevo bisogno in base alle informazioni da me fornite. Spero si siano notate le incomprensioni e i gravi errori grammaticali di cui adottava la “macchina” durante il giorno in cui ho eseguito gli esperimenti riportati. Tutt’ora è una faccenda ancora irrisolta, per questo motivo vorrei che tutti gli utenti si accorgessero di questo tipo di problema. L’obiettivo è far arrivare questa pagina web all’azienda fondatrice “Open AI” (che probabilmente è già a conoscenza del problema).

Riflessione

In conclusione, vorrei far arrivare questo messaggio ai produttori: queste disattenzioni grammaticali non sono ammissibili data la potenza del sistema.
Com’è possibile che una macchina di AI in grado di progettare immagini basate su richieste specifiche tramite algoritmi complessi, analizzare file pdf anche statistici e saperli descrivere, capace di riuscire a contribuire alla crescita di un impresa e dare consigli specifici inerenti a un’infinità di fattori specifici, ecc. non riesca nemmeno ad inserire un testo in modo corretto su una grafica?

Rimarrò ottimista, sono sicuro che in un futuro prossimo verrà risolto. Dopotutto, da un anno fa ad oggi ci sono stati miglioramenti e innovazioni molto importanti nel mondo dell’intelligenza artificiale.