OpenAI ha recentemente annunciato un importante aggiornamento alle capacità di generazione di immagini di ChatGPT, segnando un passo avanti significativo rispetto all’ultima evoluzione di oltre un anno fa. Ora, grazie all’integrazione del modello GPT-4o, gli utenti possono creare e modificare immagini e foto direttamente all’interno della piattaforma.
Un’innovazione attesa
GPT-4o, già alla base del chatbot potenziato dall’AI, finora era in grado di generare e modificare solo testi. Con questo aggiornamento, il modello è ora capace di produrre immagini dettagliate e accurate, superando le precedenti limitazioni della piattaforma. La novità è stata annunciata direttamente dal CEO di OpenAI, Sam Altman, durante una diretta streaming, confermando che la generazione di immagini nativa con GPT-4o è attiva in ChatGPT e Sora.
La funzione è disponibile sia per gli utenti con account gratuito che per quelli con abbonamento Plus, oltre che per gli sviluppatori che utilizzano il servizio API di OpenAI.
Un modello più avanzato di DALL-E 3
Rispetto al suo predecessore DALL-E 3, il nuovo GPT-4o “riflette” più a lungo prima di generare un’immagine, garantendo un livello di dettaglio superiore. La tecnologia permette anche di modificare immagini esistenti, intervenendo su elementi complessi come volti umani, oggetti in primo piano e sfondi, grazie a un processo di riempimento intelligente. OpenAI ha dichiarato di aver addestrato GPT-4o su “dati disponibili pubblicamente” e su dati proprietari provenienti da collaborazioni con aziende come Shutterstock.
Le potenzialità della nuova funzione
Le applicazioni di questa tecnologia sono numerose e abbracciano diversi ambiti:
- Creazione di contenuti per il lavoro: generazione di diagrammi esplicativi, infografiche dettagliate, materiali promozionali per i social media, loghi aziendali e istruzioni visive complesse.
- Immagini focalizzate sul testo: produzione di poster informativi, wordmark personalizzati, biglietti da visita e rappresentazioni concettuali.
- Output personalizzati per utilizzi esterni: creazione di immagini con sfondi trasparenti, ideali per presentazioni o progetti grafici.
- Immagini fotorealistiche di alta qualità: il modello è in grado di generare immagini realistiche con particolare attenzione a luci, ombre e texture, rendendolo utile per la creazione di foto stock personalizzate.
- Personalizzazione avanzata: gli utenti possono partire da un’immagine esistente per modificarla o trasformarla in uno stile artistico differente, come un dipinto personalizzato o un’illustrazione.
- Generazione contestuale basata su conoscenze reali: possibilità di richiedere immagini in base a un contesto specifico, come una rappresentazione storica o una visualizzazione dettagliata di fauna locale.
La concorrenza con Google
Questo aggiornamento arriva poco dopo il lancio della generazione di immagini sperimentale di Google con Gemini 2.0 Flash, un modello che ha suscitato scalpore sui social media per la sua mancanza di protezioni adeguate. Alcuni utenti hanno segnalato la possibilità di rimuovere filigrane e creare immagini di personaggi protetti da copyright, sollevando questioni etiche e legali.
Con questa evoluzione, OpenAI si posiziona in prima linea nella generazione di immagini basata sull’intelligenza artificiale, offrendo una soluzione avanzata e versatile per utenti e professionisti. Il futuro della creazione visiva digitale è appena iniziato e le possibilità sembrano essere infinite.
Hai letto dell’arrivo di ChatGPT Operator in Europa?
Se vuoi restare aggiornato sul mondo della tecnologia seguici sui nostri social (oltre che sul blog) e da smartphone tramite il nostro canale Telegram, oppure il nuovissimo canale Whatsapp, in modo da ricevere una notifica ogni volta che viene pubblicato un articolo, o se abbiamo qualcosa in più da comunicare. #ètempoditecnologia