X
Ultralytics YOLOv8.2 RilascioUltralytics YOLOv8.2 Rilascio del cellulareUltralytics YOLOv8.2 Freccia di rilascio
Controllo verde
Link copiato negli appunti

Un'immersione profonda nelle capacità del GPT-4o Mini di OpenAI

Scopri le caratteristiche e le applicazioni di GPT-4o Mini. L'ultimo modello di OpenAI, il più economico, offre funzionalità AI avanzate a un prezzo inferiore del 60% rispetto a GPT-3.5 Turbo.

Nel maggio 2024, OpenAI ha rilasciato il GPT-4o e ora, a soli tre mesi di distanza, è tornato con un altro modello impressionante: GPT-4o Mini. Il 18 luglio 2024, OpenAI ha presentato GPT-4o Mini. Lo definiscono il loro "modello più economico"! GPT-4o Mini è un modello compatto che si basa sulle capacità dei modelli precedenti e mira a rendere l'IA avanzata più accessibile e conveniente.

Attualmente GPT-4o Mini supporta le interazioni con il testo e la visione, mentre in futuro si prevede di aggiungere funzionalità per la gestione di immagini, video e audio. In questo articolo esploreremo cos'è GPT-4o Mini, le sue caratteristiche principali, come può essere utilizzato, le differenze tra GPT-4 e GPT-4o Mini e come può essere utilizzato in vari casi di computer vision. Scopriamo cosa ha da offrire GPT-4o Mini!

Cos'è il GPT-4o Mini?

GPT-4o Mini è l'ultimo nato tra i modelli di intelligenza artificiale di OpenAI, progettato per essere più economico e accessibile. Si tratta di un modello linguistico multimodale di grandi dimensioni (LLM), il che significa che può elaborare e generare diversi tipi di dati, come testo, immagini, video e audio. Il modello si basa sui punti di forza dei modelli precedenti, come GPT-4 e GPT-4o, per offrire potenti funzionalità in un pacchetto compatto. 

GPT-4o Mini è più economico del 60% rispetto a GPT-3.5 Turbo, con un costo di 15 centesimi per milione di token di input (unità di testo o dati che il modello elabora) e 60 centesimi per milione di token di output (unità che il modello genera in risposta). Per mettere le cose in prospettiva, un milione di token equivale all'incirca all'elaborazione di 2.500 pagine di testo. Con una finestra di contesto di 128K token e la capacità di gestire fino a 16K token di output per richiesta, GPT-4o Mini è stato progettato per essere efficiente e conveniente.

Figura 1. GPT-4o Mini è più economico del 60% rispetto a GPT-3.5 Turbo.

Caratteristiche principali di GPT-4o Mini 

GPT-4o Mini supporta una serie di attività che lo rendono un'ottima opzione per diverse applicazioni. Può essere utilizzato per eseguire più operazioni contemporaneamente, come ad esempio richiamare più API, gestire grandi quantità di dati come basi di codice complete o cronologie di conversazioni e fornire risposte rapide e in tempo reale nei chatbot di assistenza clienti.

Ecco altre caratteristiche chiave:

  • Base di conoscenze aggiornata: Il modello contiene informazioni fino a ottobre 2023.
  • Tokenizzatore migliorato: GPT-4o Mini rende più conveniente l'elaborazione di testi nonEnglish .
  • Robuste misure di sicurezza: Queste misure includono il filtraggio dei contenuti dannosi e la protezione da problemi di sicurezza come le iniezioni di prompt e le manipolazioni del sistema.

Come iniziare con il GPT-4o Mini 

Puoi provare a utilizzare GPT-4o Mini attraverso l'interfaccia ChatGPT . È accessibile agli utenti Free, Plus e Team e sostituisce GPT-3.5 come mostrato di seguito. Presto potranno accedervi anche gli utenti aziendali, in linea con l'obiettivo di OpenAI di offrire a tutti i vantaggi dell'intelligenza artificiale. GPT-4o Mini è disponibile anche attraverso le API per gli sviluppatori che vogliono integrare le sue funzionalità nelle loro applicazioni. Al momento, le funzionalità di visione sono accessibili solo attraverso l'API.

Figura 2. Opzioni dei modelli all'interno di ChatGPT.

La differenza tra GPT-4o e GPT-4o Mini 

GPT-4o Mini e GPT-4o hanno entrambi prestazioni impressionanti in vari benchmark. Sebbene GPT-4o sia generalmente superiore a GPT-4o Mini, GPT-4o Mini è ancora una soluzione conveniente per le attività quotidiane. I benchmark includono compiti di ragionamento, competenze matematiche e di codifica e ragionamento multimodale. Come mostra l'immagine qui sotto, il GPT-4o Mini ha un benchmark piuttosto alto rispetto ad altri modelli popolari.

Figura 3. Confronto tra GPT-4o Mini e altri modelli popolari.

Come fare a mettere le mani su GPT-4o e GPT-4o Mini

Un'interessante richiesta che è stata discussa online riguarda i popolari LLM che confrontano i numeri decimali in modo errato. Quando abbiamo messo alla prova GPT-4o e GPT-4o Mini, le loro capacità di ragionamento hanno mostrato chiare differenze. Nell'immagine qui sotto, abbiamo chiesto a entrambi i modelli quale fosse il numero maggiore: 9,11 o 9,9, e poi abbiamo chiesto loro di spiegare il loro ragionamento.

Figura 4. Test del GPT-4o e del GPT-4o Mini.

Entrambi i modelli inizialmente rispondono in modo errato e affermano che 9,11 è maggiore. Tuttavia, GPT-4o è in grado di ragionare per arrivare alla risposta corretta e afferma che 9,9 è maggiore. Fornisce una spiegazione dettagliata e confronta i decimali in modo accurato. Al contrario, il GPT-4o Mini si ostina a mantenere la sua risposta sbagliata iniziale nonostante abbia capito correttamente il ragionamento per cui 9,9 è maggiore.

Entrambi i modelli mostrano una forte capacità di ragionamento. La capacità del GPT-4o di correggersi da solo lo rende superiore e utile per i compiti più complessi. Il GPT-4o Mini, pur essendo meno adattabile, offre comunque un ragionamento chiaro e preciso per i compiti più semplici. 

Utilizzo della GPT-4o Mini per diversi casi d'uso della Computer Vision

Se preferisci esplorare le capacità di visione di GPT-4o Mini senza immergerti nel codice, puoi facilmente testare le API su OpenAI Playground. Abbiamo provato noi stessi per vedere quanto GPT-4o Mini sia in grado di gestire diversi casi d'uso legati alla computer vision.

Classificazione delle immagini con GPT-4o Mini

Abbiamo chiesto a GPT-4o Mini di classificare due immagini: una di una farfalla e una di una mappa. Il modello AI ha identificato con successo la farfalla e la mappa. Si tratta di un compito piuttosto semplice, dato che le immagini sono molto diverse tra loro.

Figura 5. Classificazione delle immagini con l'aiuto di GPT-4o Mini.

Abbiamo poi fatto passare altre due immagini attraverso il modello: una che mostrava una farfalla appoggiata su una pianta e un'altra che si posava a terra. Anche in questo caso l'intelligenza artificiale ha fatto un ottimo lavoro, individuando correttamente la farfalla sulla pianta e quella a terra. Quindi abbiamo fatto un ulteriore passo avanti.

Figura 6. Classificazione di immagini simili con l'aiuto di GPT-4o Mini.

Abbiamo poi chiesto a GPT-4o Mini di classificare due immagini: una che mostra una farfalla che si nutre dei fiori di una Swamp Milkweed e l'altra che mostra una farfalla che si nutre di un fiore di Zinnia. È sorprendente che il modello sia stato in grado di classificare un'etichetta così specifica senza ulteriori messe a punto. Questi rapidi esempi dimostrano che GPT-4o Mini può essere utilizzato per compiti di classificazione delle immagini senza bisogno di un addestramento personalizzato.

Figura 7. Classificazione di immagini dettagliate con l'aiuto di GPT-4o Mini.

Capire le pose usando la GPT-4o Mini

Al momento, compiti di computer vision come il rilevamento di oggetti e la segmentazione di istanze non possono essere gestiti con GPT-4o Mini. Il GPT-4o fatica a raggiungere la precisione, ma può essere utilizzato per questi compiti. Per quanto riguarda la comprensione delle pose, non possiamo rilevare o stimare la posa nell'immagine, ma possiamo classificarla e comprenderla.

Figura 8. Utilizzo di GPT-4o Mini per comprendere le pose in un'immagine. 

L'immagine qui sopra mostra come il GPT-4o Mini sia in grado di classificare e comprendere le pose, nonostante non sia in grado di rilevare o stimare le coordinate precise della posa. Questo può essere utile in diverse applicazioni. Ad esempio, nell'analisi dello sport, può valutare in modo ampio i movimenti degli atleti e aiutare a prevenire gli infortuni. Allo stesso modo, in fisioterapia, può aiutare a monitorare gli esercizi per assicurarsi che i pazienti eseguano i movimenti corretti durante la riabilitazione. Inoltre, per la sorveglianza, può aiutare a identificare attività sospette analizzando il linguaggio generale del corpo. Sebbene il GPT-4o Mini non sia in grado di rilevare punti chiave specifici, la sua capacità di classificare pose generali lo rende utile in questi e altri campi.

Le applicazioni per cui GPT-4o Mini è adatto

Abbiamo dato un'occhiata a ciò che GPT-4o Mini può fare. Ora parliamo delle applicazioni in cui è più opportuno utilizzare GPT-4o Mini.

GPT-4o Mini è ideale per le applicazioni che richiedono una comprensione avanzata del linguaggio naturale e che necessitano di un ingombro computazionale ridotto. Permette di integrare l'intelligenza artificiale in applicazioni che normalmente sarebbero troppo costose. Infatti, un'analisi dettagliata di Artificial Analysis ha dimostrato che GPT-4o Mini fornisce risposte di alta qualità a una velocità incredibile rispetto alla maggior parte degli altri modelli.

Figura 9. Qualità in funzione della velocità di uscita del GPT-4o Mini.

Ecco alcune aree chiave in cui potrebbe brillare in futuro:

  • Assistenti virtuali e chatbot: GPT-4o Mini può fornire risposte rapide e intelligenti per migliorare le interazioni con gli utenti.
  • Strumenti didattici: Il modello può essere utilizzato per costruire strumenti per offrire tutoraggio personalizzato e generazione di contenuti.
  • Strumenti di produttività: Può migliorare attività come la sintesi di documenti, la stesura di e-mail e la traduzione di lingue per aumentare l'efficienza.
  • Traduzione linguistica: L'ultima versione di GPT può essere utilizzata per sviluppare traduttori che forniscono traduzioni accurate e in tempo reale per migliorare la comunicazione in diverse lingue.

GPT-4o Mini apre nuove porte

GPT-4o Mini sta creando nuove opportunità per il futuro dell'IA multimodale. Il costo dell'elaborazione di ciascun testo o dato, noto come costo per token, è diminuito sostanzialmente - di quasi il 99% - dal 2022, anno in cui è stato rilasciato il modello GPT-3 text-davinci-003. La diminuzione del costo mostra una chiara tendenza a rendere l'IA avanzata più accessibile. Con il continuo miglioramento dei modelli di IA, è sempre più probabile che l'integrazione dell'IA in ogni app e sito web diventi economicamente conveniente!

Vuoi toccare con mano l'Intelligenza Artificiale? Visita il nostro repository GitHub per vedere le nostre innovazioni e diventare parte della nostra attiva comunità. Scopri di più sulle applicazioni dell'IA nel settore manifatturiero e agricolo sulle nostre pagine dedicate alle soluzioni.

Logo di FacebookLogo di TwitterLogo di LinkedInSimbolo di copia-link

Leggi tutto in questa categoria

Costruiamo insieme il futuro
di AI!

Inizia il tuo viaggio nel futuro dell'apprendimento automatico