Knowledge Distillation'ın uç cihazlarda ve gerçek dünya uygulamalarında daha hızlı ve verimli performans için modelleri sıkıştırarak yapay zekayı nasıl optimize ettiğini keşfedin.
Bilgi Damıtma, bilgiyi büyük, karmaşık bir modelden (genellikle "öğretmen" olarak adlandırılır) daha küçük, daha basit bir modele ("öğrenci" olarak bilinir) aktarmaya odaklanan bir makine öğrenimi tekniğidir. Bu yaklaşım, öğrenci modelinin öğretmenle karşılaştırılabilir performans elde etmesini sağlarken, hesaplama kaynakları açısından daha verimli olmasını sağlar ve mobil cihazlar, IoT cihazları veya uç bilgi işlem sistemleri gibi kaynak kısıtlı ortamlarda dağıtım için idealdir.
Bilgi Damıtma süreci, öğrenci modelinin öğretmen modelinin davranışını taklit edecek şekilde eğitilmesini içerir. Öğrenci, yalnızca orijinal etiketli verilere güvenmek yerine, farklı sınıflar arasındaki ilişkiler hakkında daha zengin bilgiler içeren öğretmenin "yumuşak etiketlerinden" veya olasılıksal çıktılarından öğrenir. Bu ek bilgi, öğrencinin daha az parametreyle bile daha iyi genelleme yapmasına yardımcı olur.
Örneğin, bir görüntü sınıflandırma görevinde öğretmen modeli "kedi" için %90, "köpek" için %8 ve "tavşan" için %2 gibi olasılıklar üretebilir. Bu yumuşak olasılıklar, öğrenci modelinin tahminlerini iyileştirmek için kullandığı sınıf benzerliklerine ilişkin içgörüler sağlar.
Bilgi Damıtma, yapay zeka ve makine öğreniminde çeşitli alanlarda yaygın bir kullanım alanı bulmuştur:
Tıbbi görüntülemede, X-ışınları veya MRI'lardaki anormallikleri tespit etmek için eğitilen büyük modeller, daha hızlı, gerçek zamanlı teşhis için daha küçük modellere ayrıştırılabilir. Örneğin, Ultralytics YOLO Nesne algılamadaki verimlilikleriyle bilinen modeller, sağlık cihazlarında hızlarını ve dağıtılabilirliklerini artırmak için damıtmadan yararlanabilir. Sağlık hizmetlerinde yapay zeka hakkında daha fazla bilgi edinin.
Otonom araçlar, gerçek zamanlı karar verme için nesne algılama ve sınıflandırma modellerine güvenir. Doğruluğu korurken çıkarım süresini kısalttıkları için damıtılmış modeller burada çok önemlidir. Kendi kendine sürüşte yapay zekanın ulaşım güvenliğini ve verimliliğini nasıl dönüştürdüğünü keşfedin.
NLP'de, BERT gibi büyük dönüştürücü tabanlı modeller, uç cihazlarda daha hızlı metin sınıflandırma, çeviri ve soru yanıtlama görevleri sağlamak için DistilBERT gibi daha küçük sürümlere damıtılır. Dönüştürücüler ve NLP hakkında daha fazla bilgi edinin.
Perakende ve üretim gibi sektörlerde Bilgi Damıtma, envanter yönetimi ve kusur tespiti gibi görevler için hafif modeller dağıtmak için kullanılır. Örneğin, Ultralytics damıtma yoluyla optimize edilen bilgisayarla görme modelleri, yapay zeka odaklı üretimde verimliliği artırabilir.
Hem Bilgi Damıtma hem de model budama model optimizasyonuna odaklanırken, budama daha az önemli parametreleri kaldırarak model karmaşıklığını azaltırken, damıtma daha büyük bir modelin davranışını taklit etmek için ayrı, daha küçük bir modelin eğitilmesini içerir.
Model niceleme, model parametrelerinin hassasiyetini azaltırken (örneğin, 32 bit kayan noktalı sayıları 8 bit tam sayılara dönüştürme), damıtma hassasiyeti korur ancak bilgiyi daha küçük bir mimariye aktarır.
Bilgi Damıtımı kullanılarak, büyük bir YOLO modeli, video akışlarındaki nesneleri yüksek doğrulukla ancak daha düşük gecikmeyle tespit etmek için daha küçük bir sürümü eğitebilir. Bu, gerçek zamanlı işlemenin kritik olduğu güvenlik gözetimi gibi uygulamalar için özellikle değerlidir. YOLO 'un gerçek zamanlı çıkarım yetenekleri hakkında daha fazla bilgi edinin.
Hassas tarımda, karmaşık veri kümeleri üzerinde eğitilen büyük yapay zeka modelleri, dronlara veya tarla sensörlerine dağıtılmak üzere kompakt versiyonlara dönüştürülebilir ve haşere tespiti veya mahsul sağlığı izleme gibi görevlere olanak tanır. Yapay zekanın tarımı nasıl dönüştürdüğünü keşfedin.
Birkaç çerçeve Bilgi Damıtmayı destekleyerek makine öğrenimi uygulayıcıları için erişilebilir hale getirmektedir:
Bilgi Damıtma, gerçek dünya uygulamaları için güçlü ancak verimli modeller sağlayarak yapay zeka sistemlerinin ilerlemesinde önemli bir rol oynamaya devam ediyor. Doğruluk ve verimlilik arasındaki boşluğu doldurarak, yapay zekanın küresel olarak daha fazla cihaza, sektöre ve kullanıcıya ulaşmasını sağlıyor.