L'Automated Machine Learning (AutoML) si riferisce al processo di automazione delle attività iterative e dispendiose in termini di tempo coinvolte nello sviluppo di modelli di Machine Learning (ML). L'obiettivo è quello di rendere le tecniche di ML più accessibili a chi non è esperto del settore (come gli scienziati dei dati) e di accelerare il processo di sviluppo per i professionisti esperti. Gli strumenti e le piattaforme AutoML automatizzano varie fasi della pipeline di ML, consentendo agli utenti di costruire modelli di alta qualità con un intervento manuale minimo.
Principali attività automatizzate in AutoML
I sistemi AutoML in genere automatizzano diverse fasi critiche del flusso di lavoro dell'apprendimento automatico:
- Preelaborazione dei dati: Gestione dei valori mancanti, scalatura delle caratteristiche ed esecuzione delle trasformazioni necessarie sui dati di formazione. In questo modo si garantisce che i dati siano adatti all'addestramento del modello. Tecniche come la normalizzazione sono spesso automatizzate.
- Ingegneria delle caratteristiche: Creazione automatica di nuove caratteristiche a partire da quelle esistenti o selezione delle caratteristiche più rilevanti per migliorare le prestazioni del modello. Ciò può comportare l'utilizzo di tecniche coperte dai concetti di ingegneria delle caratteristiche.
- Selezione del modello: Scegliere l'algoritmo migliore (ad esempio, alberi decisionali, reti neurali come Ultralytics YOLOo macchine vettoriali di supporto) per un determinato compito e set di dati. Le piattaforme AutoML spesso esplorano diverse architetture di rilevamento degli oggetti o modelli di classificazione.
- Ottimizzazione degli iperparametri: Ottimizzazione delle impostazioni di configurazione (iperparametri) del modello selezionato per ottenere le migliori prestazioni. Si tratta di una fase cruciale, descritta in dettaglio nelle guide sulla regolazione degli iperparametri.
Vantaggi di AutoML
L'utilizzo di AutoML offre diversi vantaggi:
- Maggiore efficienza: Automatizza le attività ripetitive, riducendo significativamente il tempo necessario per sviluppare e distribuire i modelli di ML.
- Accessibilità migliorata: Consente agli esperti di dominio e agli sviluppatori con minori competenze di ML di sfruttare le potenti tecniche di modellazione.
- Prestazioni migliorate: Può esplorare una gamma più ampia di modelli e iperparametri rispetto agli approcci manuali, portando potenzialmente a modelli più accurati e robusti. Piattaforme come Ultralytics HUB semplificano il processo di formazione, contribuendo a questa efficienza.
- Riduzione dei pregiudizi: l 'automazione può aiutare a mitigare i pregiudizi umani nella selezione e nella messa a punto dei modelli di IA, anche se è necessaria un'attenta supervisione.
Applicazioni del mondo reale
L'AutoML viene applicato in diversi settori:
- Rilevamento delle frodi: Gli istituti finanziari utilizzano AutoML per costruire e aggiornare rapidamente i modelli che rilevano le transazioni fraudolente, testando automaticamente diversi algoritmi e caratteristiche sui dati delle transazioni. Questo migliora i tassi di rilevamento e si adatta ai nuovi modelli di frode più velocemente rispetto alla modellazione manuale.
- Analisi delle immagini mediche: Nel settore sanitario, AutoML aiuta a sviluppare modelli per attività come l'analisi delle immagini mediche, ad esempio per identificare tumori o anomalie nelle radiografie o nelle risonanze magnetiche. AutoML è in grado di ottimizzare complessi modelli di deep learning per ottenere un'elevata precisione.
AutoML vs. MLOps
Mentre AutoML si concentra sull'automazione del processo di creazione del modello (selezione, formazione, messa a punto), Machine Learning Operations (MLOps) comprende l'intero ciclo di vita di un modello di ML, inclusi la distribuzione, il monitoraggio, la gestione e la governance. AutoML può essere considerato un componente di una strategia MLOps più ampia, in grado di semplificare la fase iniziale di creazione del modello prima di passare alla distribuzione e alle pipeline di monitoraggio del modello.