Glossario

Pesi del modello

Scopri l'importanza dei pesi dei modelli nell'apprendimento automatico, il loro ruolo nelle previsioni e come Ultralytics YOLO semplifica il loro utilizzo per le attività di AI.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

I pesi del modello sono i parametri fondamentali che un modello di apprendimento automatico apprende durante il processo di formazione. Questi valori numerici rappresentano la conoscenza acquisita dai dati di formazione e sono fondamentali per il modo in cui il modello fa previsioni o prende decisioni su nuovi dati non visti. In sostanza, i pesi determinano la forza e l'importanza delle connessioni all'interno del modello, come tra i neuroni di una rete neurale (NN).

Capire i pesi del modello

Immagina una macchina complessa con molte manopole regolabili; i pesi del modello agiscono come queste manopole. Durante l'addestramento, al modello vengono mostrati degli esempi da un set di dati e fa delle previsioni. La differenza tra queste previsioni e le risposte effettivamente corrette (verità di base) viene misurata da una funzione di perdita. Un algoritmo di ottimizzazione, come Stochastic Gradient Descent (SGD) o Adam, regola sistematicamente i pesi per minimizzare la perdita. Questo processo viene ripetuto per molte iterazioni, o epoche, affinando gradualmente i pesi. Inizialmente, i pesi sono spesso impostati su piccoli valori casuali, ma con l'addestramento convergono verso valori che catturano i modelli sottostanti dei dati. È importante distinguere i pesi dagli iperparametri, come il tasso di apprendimento o la dimensione del batch, che vengono impostati prima dell' addestramento e guidano il processo di apprendimento stesso, anziché essere appresi durante. Le bias, un altro tipo di parametro appreso che spesso si trova accanto ai pesi nelle NN, rappresentano l'attivazione di base di un neurone.

L'importanza dei pesi del modello

I pesi del modello sono fondamentali perché codificano i modelli e le relazioni apprese dai dati di formazione. Pesi ben ottimizzati consentono a un modello di generalizzare in modo efficace, facendo previsioni accurate su dati che non ha mai incontrato prima. La qualità dei pesi influisce direttamente sulle metriche di performance del modello, come l'accuratezza e la robustezza. Pesi mal addestrati, spesso dovuti a problemi come dati insufficienti o overfitting, danno luogo a previsioni inaffidabili.

In molte applicazioni moderne di intelligenza artificiale, soprattutto nella computer vision (CV), i modelli sono spesso pre-addestrati su grandi set di dati generali come ImageNet o COCO. I pesi risultanti catturano ampie caratteristiche visive. Questi pesi pre-addestrati, come quelli disponibili per i modelliUltralytics YOLO , possono essere utilizzati direttamente per l'inferenza o come punto di partenza per la messa a punto su un compito specifico o un set di dati personalizzato. Questa tecnica, nota come apprendimento per trasferimento, velocizza notevolmente l'addestramento e spesso porta a prestazioni migliori, soprattutto con dati personalizzati limitati. Puoi gestire e addestrare i modelli con pesi specifici utilizzando piattaforme come Ultralytics HUB.

Applicazioni del mondo reale

I pesi dei modelli sono il motore di innumerevoli applicazioni di intelligenza artificiale:

  1. Rilevamento degli oggetti nei veicoli autonomi: Modelli come Ultralytics YOLOv8 utilizzano i loro pesi appresi per identificare e localizzare oggetti come automobili, pedoni e segnali stradali nei feed video in tempo reale, consentendo una navigazione più sicura. I pesi determinano il modo in cui il modello interpreta i modelli di pixel per riconoscere questi oggetti specifici.
  2. Analisi di immagini mediche per il rilevamento di malattie: Nel settore sanitario, i modelli di intelligenza artificiale addestrati sulle immagini mediche (come le radiografie o le risonanze magnetiche) utilizzano i loro pesi per rilevare sottili anomalie indicative di malattie, come l'identificazione di potenziali tumori nelle scansioni cerebrali utilizzando dataset come il Brain Tumor dataset. I pesi codificano le caratteristiche visive apprese da migliaia di immagini mediche annotate. Strumenti come Weights & Biases possono aiutare a tenere traccia degli esperimenti che producono questi pesi.
Leggi tutto