Scopri la potenza dei modelli di base nell'IA. Impara come adattare modelli su larga scala come Ultralytics per attività personalizzate utilizzando la Ultralytics .
Un modello di base rappresenta un significativo cambiamento di paradigma nel campo dell' intelligenza artificiale (AI). Si tratta di un modello di apprendimento automatico su larga scala addestrato su una vasta quantità di dati, che spesso comprende miliardi di parametri, che può essere adattato a un'ampia gamma di attività a valle. A differenza dei tradizionali modelli di apprendimento automatico (ML), che sono tipicamente costruiti per uno scopo specifico e singolare, come la classificazione di un tipo specifico di fiore, un modello di base apprende modelli, strutture e relazioni generali durante una fase di pre-addestramento che richiede molte risorse. Questa ampia base di conoscenze consente agli sviluppatori di applicare il modello a nuovi problemi attraverso il transfer learning, riducendo in modo significativo il tempo e i dati necessari per ottenere risultati all'avanguardia.
La potenza di un modello di base risiede nel suo processo di sviluppo in due fasi: pre-addestramento e messa a punto. Durante il pre-addestramento, il modello viene esposto a enormi set di dati, come grandi porzioni di Internet, diverse librerie di immagini o vasti repository di codice. Questa fase spesso utilizza l' apprendimento auto-supervisionato, una tecnica in cui il modello genera le proprie etichette dalla struttura dei dati stessa, rimuovendo il collo di bottiglia dell'annotazione manuale dei dati. Ad esempio, un modello linguistico potrebbe imparare a prevedere la parola successiva in una frase, mentre un modello visivo impara a comprendere i contorni, le trame e la permanenza degli oggetti.
Una volta pre-addestrato, il modello funge da versatile punto di partenza. Attraverso un processo chiamato fine-tuning, gli sviluppatori possono modificare i pesi del modello su un set di dati più piccolo e specifico per un determinato dominio. Questa capacità è fondamentale per la democratizzazione dell'IA, poiché consente alle organizzazioni con risorse computazionali limitate di sfruttare architetture potenti. I flussi di lavoro moderni utilizzano spesso strumenti come Ultralytics per semplificare questo processo di adattamento, consentendo un addestramento efficiente su set di dati personalizzati senza la necessità di costruire una rete neurale da zero.
I modelli di base fungono da colonna portante per le innovazioni in vari settori. La loro capacità di generalizzare li rende applicabili a compiti che vanno dall'elaborazione del linguaggio naturale alla visione artificiale avanzata .
Gli sviluppatori possono sfruttare i modelli di base per eseguire attività complesse con un codice minimo. L'esempio seguente mostra come caricare un modello YOLO26pre-addestrato, un modello di base di visione ottimizzato per applicazioni in tempo reale, ed eseguire il rilevamento di oggetti su un'immagine.
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")
# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
È utile distinguere il "modello di base" dai concetti correlati nel panorama dell'IA per comprenderne i ruoli specifici:
L'evoluzione dei modelli di base si sta orientando verso l' intelligenza artificiale multimodale, in cui un unico sistema è in grado di elaborare e mettere in relazione simultaneamente informazioni provenienti da testi, immagini, audio e dati dei sensori. La ricerca condotta da istituzioni come lo Stanford Institute for Human-Centered AI (HAI) evidenzia il potenziale di questi sistemi di ragionare sul mondo in modo più simile agli esseri umani. Man mano che questi modelli diventano più efficienti, la loro implementazione su dispositivi di edge computing diventa sempre più fattibile, portando potenti capacità di IA direttamente su smartphone, droni e sensori IoT.