Yeşil çek
Panoya kopyalanan bağlantı

CV projelerini Hugging Face'in açık kaynak araçlarıyla güçlendirmek

Hugging Face'in açık kaynak araçlarının yapay zeka gelişimini nasıl ilerlettiğini keşfetmeye odaklanan YOLO Vision 2024'ten bir açılış konuşmasını tekrar gözden geçirirken bize katılın.

Doğru algoritmaları seçmek, etkili bilgisayarla görme çözümleri oluşturmanın yalnızca bir parçasıdır. YZ mühendisleri genellikle büyük veri kümeleriyle çalışır, belirli görevler için modellere ince ayar yapar ve YZ sistemlerini gerçek dünya performansı için optimize eder. YZ uygulamaları daha hızlı benimsendikçe, bu süreçleri basitleştiren araçlara duyulan ihtiyaç da artıyor.

Ultralytics tarafından desteklenen yıllık hibrit etkinlik YOLO Vision 2024'te (YV24), yapay zeka uzmanları ve teknoloji meraklıları bilgisayarla görme alanındaki en son yenilikleri keşfetmek için bir araya geldi. Etkinlik, yapay zeka uygulama geliştirmeyi hızlandırmanın yolları gibi çeşitli konularda tartışmalara yol açtı.

Etkinlikte öne çıkan en önemli konulardan biri, model eğitimi, optimizasyonu ve dağıtımını kolaylaştıran açık kaynaklı bir yapay zeka platformu olan Hugging Face ile ilgili bir açılış konuşmasıydı. Hugging Face'de Makine Öğrenimi Mühendisi olan Pavel Lakubovskii, araçlarının görüntülerdeki nesneleri tespit etme, görüntüleri farklı gruplara ayırma ve belirli örnekler üzerinde önceden eğitim almadan tahminlerde bulunma (zero-shot learning) gibi bilgisayarla görme görevlerine yönelik iş akışlarını nasıl iyileştirdiğini paylaştı.

Hugging Face Hub, Ultralytics YOLO11 gibi çeşitli yapay zeka ve bilgisayarla görme modellerine ev sahipliği yapıyor ve erişim sağlıyor. Bu makalede, Pavel'in konuşmasından önemli çıkarımları özetleyecek ve geliştiricilerin yapay zeka modellerini hızlı bir şekilde oluşturmak ve dağıtmak için Hugging Face'in açık kaynaklı araçlarını nasıl kullanabileceklerini göreceğiz.

Şekil 1. Pavel YV24'te sahnede.

Hugging Face Hub daha hızlı yapay zeka gelişimini destekliyor

Pavel konuşmasına, çeşitli uygulamalar için önceden eğitilmiş modeller sunan açık kaynaklı bir yapay zeka platformu olarak Hugging Face i tanıtarak başladı. Bu modeller, doğal dil işleme (NLP), bilgisayarla görme ve çok modlu yapay zeka dahil olmak üzere çeşitli yapay zeka dalları için tasarlanmıştır ve sistemlerin metin, görüntü ve ses gibi farklı veri türlerini işlemesini sağlar.

Pavel, Hugging Face Hub'ın şu anda 1 milyondan fazla modele ev sahipliği yaptığını ve geliştiricilerin kendi projelerine uygun modelleri kolayca bulabileceklerini belirtti. Hugging Face , model eğitimi, ince ayar ve dağıtım için araçlar sunarak yapay zeka geliştirmeyi basitleştirmeyi amaçlıyor. Geliştiricilerin farklı modelleri deneyebilmeleri, yapay zekayı gerçek dünya uygulamalarına entegre etme sürecini basitleştiriyor.

Hugging Face başlangıçta NLP ile tanınırken, o zamandan beri bilgisayarla görme ve multimodal yapay zekaya doğru genişledi ve geliştiricilerin daha geniş bir yelpazedeki yapay zeka görevlerinin üstesinden gelmelerini sağladı. Ayrıca geliştiricilerin forumlar, Discord ve GitHub aracılığıyla işbirliği yapabilecekleri, içgörülerini paylaşabilecekleri ve destek alabilecekleri güçlü bir topluluğa sahiptir.

Bilgisayarla görme uygulamaları için Hugging Face modellerinin araştırılması

Daha fazla ayrıntıya giren Pavel, Hugging Face'in araçlarının bilgisayarla görme uygulamaları oluşturmayı nasıl kolaylaştırdığını açıkladı. Geliştiriciler bunları görüntü sınıflandırma, nesne algılama ve görme dili uygulamaları gibi görevler için kullanabilirler.

Ayrıca, bu bilgisayarla görme görevlerinin birçoğunun Hugging Face Hub'ında bulunan önceden eğitilmiş modellerle ele alınabileceğini ve sıfırdan eğitim ihtiyacını azaltarak zaman kazandıracağını belirtti. Aslında Hugging Face , gıda sınıflandırması, evcil hayvan sınıflandırması ve duygu tespiti de dahil olmak üzere görüntü sınıflandırma görevleri için 13.000'den fazla önceden eğitilmiş model sunuyor.

Bu modellerin erişilebilirliğini vurgulayarak, "Muhtemelen projeniz için bir model eğitmenize bile gerek yok - Hub'da topluluktan biri tarafından zaten eğitilmiş bir model bulabilirsiniz" dedi. 

Nesne algılama için Hugging Face modelleri 

Başka bir örnek veren Pavel, Hugging Face in bilgisayarla görmede görüntülerdeki nesneleri tanımlamak ve bulmak için kullanılan önemli bir işlev olan nesne algılamaya nasıl yardımcı olabileceğini detaylandırdı. Sınırlı etiketli verilerle bile, Hugging Face Hub'ında bulunan önceden eğitilmiş modeller nesne algılamayı daha verimli hale getirebilir. 

Ayrıca, Hugging Facede bulabileceğiniz bu görev için oluşturulmuş birkaç modele hızlı bir genel bakış sundu:

  • Gerçek zamanlı nesne algılama modelleri: Hızın çok önemli olduğu dinamik ortamlar için Detection Transformer (DETR) gibi modeller gerçek zamanlı nesne algılama özellikleri sunar. DETR, COCO veri kümesi üzerinde eğitilmiştir ve çok ölçekli özellikleri verimli bir şekilde işlemek için tasarlanmıştır, bu da onu zamana duyarlı uygulamalar için uygun hale getirir.
  • Görme-dil modelleri: Bu modeller görüntü ve metin işlemeyi birleştirerek yapay zeka sistemlerinin görüntüleri açıklamalarla eşleştirmesini veya eğitim verilerinin ötesindeki nesneleri tanımasını mümkün kılar. Örnekler arasında, metni görsellere bağlayarak görsel aramayı iyileştiren ve yapay zeka çözümlerinin bağlamlarını anlayarak yeni nesneleri tanımlamasını sağlayan CLIP ve SigLIP yer almaktadır.
  • Sıfır çekim nesne algılama modelleri: Görüntüler ve metin arasındaki ilişkiyi anlayarak daha önce görmedikleri nesneleri tanımlayabilirler. Örnekler arasında, etiketli eğitim verilerine ihtiyaç duymadan yeni nesneleri tespit etmek için sıfır vuruşlu öğrenmeyi kullanan OwlVit, GroundingDINO ve OmDet sayılabilir.

Hugging Face modelleri nasıl kullanılır?

Pavel daha sonra odak noktasını Hugging Face modelleriyle pratik yapmaya kaydırdı ve geliştiricilerin bunlardan yararlanabileceği üç yolu açıkladı: modelleri keşfetmek, hızlı bir şekilde test etmek ve daha fazla özelleştirmek.

Geliştiricilerin herhangi bir kod yazmadan doğrudan Hugging Face Hub üzerinde modellere nasıl göz atabileceklerini ve interaktif bir arayüz aracılığıyla modelleri anında test etmeyi nasıl kolaylaştırdığını gösterdi. Pavel, "Bir satır bile kod yazmadan veya modeli bilgisayarınıza indirmeden deneyebilirsiniz" diye ekledi. Bazı modeller büyük olduğundan, bunları Hub üzerinde çalıştırmak depolama ve işleme sınırlamalarını önlemeye yardımcı olur.

Şekil 2. Hugging Face modelleri nasıl kullanılır?

Ayrıca, Hugging Face Inference API, geliştiricilerin basit API çağrılarıyla yapay zeka modellerini çalıştırmasına olanak tanır. Karmaşık bir kuruluma ihtiyaç duymadan hızlı testler, kavram kanıtlama projeleri ve hızlı prototip oluşturma için harikadır.

Daha gelişmiş kullanım durumları için geliştiriciler, hem PyTorch hem de TensorFlow'u desteklerken metin, görüntü ve ses görevleri için önceden eğitilmiş modeller sağlayan açık kaynaklı bir araç olan Hugging Face Transformers çerçevesini kullanabilirler. Pavel, geliştiricilerin sadece iki satır kodla Hugging Face Hub'dan bir model alabileceğini ve Vision AI uygulamaları için görüntü verilerini analiz etmek üzere görüntü işlemcisi gibi bir ön işleme aracına bağlayabileceğini açıkladı.

Hugging Face ile yapay zeka iş akışlarını optimize etme

Ardından Pavel, Hugging Face in yapay zeka iş akışlarını nasıl kolaylaştırabileceğini açıkladı. Ele aldığı önemli konulardan biri, derin öğrenme modellerinin temel bir özelliği olan ve girdi verilerinin en alakalı kısımlarına odaklanmasına yardımcı olan Transformers'daki dikkat mekanizmasını optimize etmekti. Bu, dil işleme ve bilgisayar görüşü içeren görevlerin doğruluğunu artırır. Ancak, yoğun kaynak gerektirebilir.

Dikkat mekanizmasını optimize etmek, hızı artırırken bellek kullanımını önemli ölçüde azaltabilir. Pavel, "Örneğin, daha verimli bir dikkat uygulamasına geçerek 1,8 kata kadar daha hızlı performans görebilirsiniz" dedi.

Hugging Face , Transformers çerçevesi içinde daha verimli dikkat uygulamaları için yerleşik destek sağlar. Geliştiriciler, bir modeli yüklerken alternatif bir dikkat uygulaması belirterek bu optimizasyonları etkinleştirebilirler.

Optimum ve Torch Derleme

Ayrıca, performansı çok fazla etkilemeden kullandıkları sayıların hassasiyetini azaltarak yapay zeka modellerini daha küçük hale getiren bir teknik olan niceleme hakkında da konuştu. Bu, modellerin daha az bellek kullanmasına ve daha hızlı çalışmasına yardımcı olarak onları akıllı telefonlar ve gömülü sistemler gibi sınırlı işlem gücüne sahip cihazlar için daha uygun hale getiriyor.

Verimliliği daha da artırmak için Pavel, modelleri optimize etmek ve dağıtmak için tasarlanmış bir dizi araç olan Hugging Face Optimum kütüphanesini tanıttı. Geliştiriciler sadece birkaç satır kodla niceleme tekniklerini uygulayabilir ve modelleri ONNX (Open Neural Network Exchange) gibi verimli formatlara dönüştürerek bulut sunucuları ve uç cihazlar da dahil olmak üzere farklı donanım türlerinde sorunsuz bir şekilde çalışmasını sağlayabilir.

Şekil 3. Pavel, Optimum kütüphanesi ve özellikleri hakkında konuştu.

Son olarak Pavel, PyTorch 'ta yapay zeka modellerinin verileri işleme şeklini optimize ederek daha hızlı ve verimli çalışmalarını sağlayan bir özellik olan PyTorch Compile'ın faydalarından bahsetti. Hugging Face , Torch Compile'ı Transformers ve Optimum kütüphanelerine entegre ederek geliştiricilerin bu performans iyileştirmelerinden minimum kod değişikliği ile yararlanmasını sağlıyor. 

Torch Compile, modelin hesaplama yapısını optimize ederek çıkarım sürelerini hızlandırabilir ve doğruluk veya kaliteden ödün vermeden kare hızlarını saniyede 29'dan 150 kareye çıkarabilir.

Hugging Face araçları ile modelleri dağıtma

Devamında Pavel, geliştiricilerin doğru modeli seçtikten ve geliştirme için en iyi yaklaşımı seçtikten sonra Hugging Face araçlarını kullanarak Vision AI modellerini nasıl genişletebileceklerine ve dağıtabileceklerine kısaca değindi.

Örneğin, geliştiriciler Gradio ve Streamlit kullanarak etkileşimli yapay zeka uygulamaları dağıtabilirler. Gradio, geliştiricilerin makine öğrenimi modelleri için web tabanlı arayüzler oluşturmasına olanak tanırken Streamlit, basit Python komut dosyalarıyla etkileşimli veri uygulamaları oluşturmaya yardımcı olur. 

Pavel ayrıca, Hugging Face in sağladığı kılavuzlara, eğitim not defterlerine ve örnek komut dosyalarına atıfta bulunarak "Her şeyi sıfırdan yazmaya başlamanıza gerek yok" dedi. Bu kaynaklar, geliştiricilerin her şeyi sıfırdan inşa etmek zorunda kalmadan hızlı bir şekilde başlamalarına yardımcı oluyor.

Şekil 4. Pavel, YV24'te Hugging Face in yeteneklerini tartışırken.

Hugging Face Hub'ına Hugging Face Faydaları 

Açılış konuşmasını tamamlayan Pavel, Hugging Face Hub kullanmanın avantajlarını özetledi. Model yönetimini ve işbirliğini nasıl basitleştirdiğini vurguladı. Ayrıca, hem yeni başlayanların hem de uzmanların yapay zeka modellerini anlamalarına ve uygulamalarına yardımcı olabilecek kılavuzların, not defterlerinin ve öğreticilerin kullanılabilirliğine dikkat çekti.

"Hub'da halihazırda pek çok harika alan var. Benzerlerini bulabilir, paylaşılan kodu klonlayabilir, birkaç satırı değiştirebilir, modeli kendi modelinizle değiştirebilir ve geri gönderebilirsiniz" diyerek geliştiricileri platformun esnekliğinden yararlanmaya teşvik etti.

Önemli çıkarımlar 

YV24'teki konuşması sırasında Pavel, Hugging Face in yapay zeka model eğitimi, optimizasyonu ve dağıtımını destekleyen araçları nasıl sağladığını paylaştı. Örneğin, Transformers, Optimum ve Torch Compile gibi yenilikler geliştiricilerin model performansını artırmasına yardımcı olabilir.

Yapay zeka modelleri daha verimli hale geldikçe, niceleme ve uç dağıtımı alanındaki gelişmeler, bu modellerin sınırlı kaynaklara sahip cihazlarda çalıştırılmasını kolaylaştırıyor. Bu gelişmeler, Hugging Face gibi araçlar ve Ultralytics YOLO11 gibi gelişmiş bilgisayarla görme modelleriyle birlikte ölçeklenebilir, yüksek performanslı Vision AI uygulamaları oluşturmanın anahtarıdır.

Büyüyen topluluğumuza katılın! Yapay zeka hakkında bilgi edinmek için GitHub depomuzu keşfedin ve Vision AI projelerinize başlamak için yolo lisanslarımıza göz atın. Sağlık hizmetlerinde bilgisayarla görme veya tarımda bilgisayarla görme gibi yeniliklerle ilgileniyor musunuz? Daha fazlasını keşfetmek için çözüm sayfalarımızı ziyaret edin!

Facebook logosuTwitter logosuLinkedIn logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın