Glossario

Apprendimento profondo (DL)

Scoprite la potenza dell'apprendimento profondo: esplorate le reti neurali, le tecniche di addestramento e le applicazioni reali nell'IA, nella sanità e altro ancora.

Il Deep Learning (DL) è un sottocampo specializzato del Machine Learning (ML) che utilizza reti neurali multistrato per imparare da grandi quantità di dati. Ispirati alla struttura del cervello umano, i modelli di DL, spesso chiamati reti neurali profonde, sono progettati per apprendere automaticamente rappresentazioni gerarchiche dei dati. Ciò significa che gli strati iniziali apprendono caratteristiche semplici e gli strati successivi le combinano per apprendere modelli sempre più complessi. Questa capacità ha reso la DL la forza trainante dei principali progressi nell'Intelligenza Artificiale (IA), in particolare in domini complessi come la Computer Vision (CV) e l'elaborazione del linguaggio naturale (NLP).

Come funziona l'apprendimento profondo

Il cuore del Deep Learning sono le reti neurali profonde, ovvero reti neurali con più strati nascosti tra gli strati di ingresso e di uscita. Il termine "profondo" in Deep Learning si riferisce a questa profondità. Ogni strato contiene unità di elaborazione (neuroni) che applicano un'operazione matematica, regolata da una funzione di attivazione, al loro ingresso. Durante l'addestramento, la rete viene alimentata con grandi insiemi di dati e un algoritmo chiamato backpropagation viene utilizzato per regolare i parametri interni della rete, o pesi. Questo processo di regolazione, in genere guidato da un algoritmo di ottimizzazione come la discesa del gradiente, minimizza la differenza tra le previsioni del modello e la verità effettiva, definita da una funzione di perdita. In questo modo la rete è in grado di scoprire automaticamente modelli complessi senza essere programmata esplicitamente per farlo. Un documento storico fondamentale che ha contribuito a rendere popolare la moderna DL è il documento AlexNet del 2012, che ha ottenuto risultati all'avanguardia sul set di dati ImageNet.

Apprendimento profondo contro apprendimento automatico. Apprendimento automatico

Sebbene il Deep Learning sia un sottoinsieme del Machine Learning, la differenza principale risiede nel loro approccio alla rappresentazione dei dati. I metodi di ML tradizionali si basano spesso sull'ingegneria manuale delle caratteristiche, in cui gli esperti di dominio creano meticolosamente le caratteristiche dai dati grezzi per aiutare il modello a fare previsioni accurate. Al contrario, i modelli DL eseguono l'estrazione automatica delle caratteristiche. La struttura gerarchica delle reti profonde consente loro di apprendere le caratteristiche rilevanti direttamente dai dati. Ciò rende i modelli DL particolarmente potenti per la gestione di dati non strutturati come immagini, testo e audio, dove l'ingegnerizzazione manuale delle caratteristiche è spesso impraticabile. Per esempio, nel riconoscimento delle immagini, un modello DL può imparare a identificare bordi e texture nei primi strati, poi parti di oggetti come occhi e nasi negli strati intermedi e infine interi oggetti come volti negli strati più profondi.

Applicazioni ed esempi

La capacità del Deep Learning di elaborare dati complessi ha portato alla sua adozione in numerosi settori e applicazioni. Due esempi importanti sono:

  1. Veicoli autonomi: Le auto a guida autonoma si affidano molto alla DL per la percezione in tempo reale. I modelli Ultralytics YOLO, una famiglia di modelli DL all'avanguardia, sono utilizzati per il rilevamento degli oggetti per identificare pedoni, altri veicoli e segnali stradali. Allo stesso modo, la DL viene utilizzata per la segmentazione delle immagini per distinguere la superficie stradale percorribile dall'ambiente circostante, elemento cruciale per una navigazione sicura. Per saperne di più sull'uso dell'intelligenza artificiale nelle auto a guida autonoma.
  2. Analisi delle immagini mediche: Nel settore sanitario, i modelli DL assistono i radiologi nell'analisi delle scansioni mediche. Le reti neurali convoluzionali (CNN), un'architettura DL molto diffusa per la visione, possono essere addestrate per rilevare anomalie come i tumori nelle risonanze magnetiche cerebrali o i segni di malattia nelle radiografie con un'elevata precisione. Questo può portare a una diagnosi più precoce e a un miglioramento dei risultati per i pazienti, come si è visto in applicazioni come il rilevamento dei tumori cerebrali.

Strumenti e strutture

Lo sviluppo di modelli DL è facilitato da varie librerie e piattaforme software. I framework open-source più diffusi includono:

Piattaforme come Ultralytics HUB forniscono ambienti integrati per l'addestramento di modelli personalizzati, la distribuzione e la gestione di modelli DL, in particolare per le attività di visione artificiale che utilizzano modelli come YOLO11. Uno sviluppo efficace spesso comporta pratiche come la messa a punto rigorosa degli iperparametri, la comprensione delle metriche delle prestazioni e l'utilizzo dell'accelerazione GPU per un addestramento efficiente dei modelli. Lo sviluppo e la distribuzione di questi sistemi complessi sono spesso gestiti attraverso le pratiche MLOps.

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti