Yeşil çek
Panoya kopyalanan bağlantı

2025'te en iyi bilgisayarla görme veri kümelerini keşfetmek

2025'in en iyi bilgisayarla görme veri kümelerine daha yakından bakarken bize katılın. Çeşitli ve yüksek kaliteli veri kümelerinin daha akıllı Vision AI çözümlerini nasıl desteklediğini öğrenin.

Verilerin günlük olarak yaptığınız neredeyse her şeyde rol oynadığını biliyor muydunuz? Bir video izlemek, fotoğraf çekmek veya Google Haritalar'ı kontrol etmek, 75 milyardan fazla bağlı cihaz tarafından yakalanan sürekli bilgi akışına katkıda bulunur. Bu veri parçaları yapay zekanın (AI) temelini oluşturur. Aslında, aşağıdaki gibi gelişmiş bilgisayarla görme modelleri Ultralytics YOLO11 kalıpları belirlemek, görüntüleri yorumlamak ve çevremizdeki dünyayı anlamlandırmak için görsel verilere güvenir.

İlginç bir şekilde, verilerin değeri sadece miktarla ilgili değildir. Ne kadar iyi organize edildiği ve hazırlandığı daha önemlidir. Bir veri kümesi dağınık veya eksikse, hatalara yol açabilir. Ancak veri kümeleri temiz ve çeşitli olduğunda, ister kalabalıktaki nesneleri tanımak ister karmaşık görselleri analiz etmek olsun, bilgisayarla görme modellerinin daha iyi performans göstermesine yardımcı olurlar. Yüksek kaliteli veri kümeleri büyük fark yaratır.

Bu makalede, 2025'in en iyi bilgisayarla görme veri kümelerini keşfedecek ve bunların daha doğru ve verimli bilgisayarla görme modelleri oluşturmaya nasıl katkıda bulunduğunu göreceğiz. Hadi başlayalım!

Bilgisayarla görme veri kümeleri nedir?

Bilgisayarla görme veri kümesi, bilgisayarla görme sistemlerinin görsel bilgileri anlamayı ve tanımayı öğrenmesine yardımcı olan bir görüntü veya video koleksiyonudur. Bu veri kümeleri, modellerin verilerdeki nesneleri, insanları, sahneleri ve desenleri tanımasına yardımcı olan etiketler veya ek açıklamalarla birlikte gelir.

Bilgisayarla görme modellerini eğitmek için kullanılabilirler ve yüzleri tanımlama, nesneleri algılama veya sahneleri analiz etme gibi görevleri geliştirmelerine yardımcı olurlar. Veri kümesi ne kadar iyi düzenlenmiş, çeşitli ve doğru olursa, Görme Yapay Zekası modeli o kadar iyi performans gösterir ve günlük yaşamda daha akıllı ve daha kullanışlı teknolojilere yol açar.

Bilgisayarla görme veri kümesi nasıl oluşturulur?

Bir bilgisayarla görme veri seti oluşturmak, birine dünyayı nasıl göreceğini ve anlayacağını öğretmek için çalışma notları hazırlamak gibidir. Her şey, geliştirmekte olduğunuz özel uygulamaya uygun görüntü ve videoları toplamakla başlar. 

İdeal bir veri kümesi, ilgilenilen nesnelerin farklı açılardan, çeşitli aydınlatma koşulları altında ve birden fazla arka plan ve ortamda çekilmiş çeşitli örneklerini içerir. Bu çeşitlilik, bilgisayarla görme modelinin desenleri doğru bir şekilde tanımayı öğrenmesini ve gerçek dünya senaryolarında güvenilir bir performans sergilemesini sağlar.

Şekil 1. Mükemmel görüş veri setinin oluşturulması. Yazar tarafından resim.

İlgili görüntü ve videoları topladıktan sonra, bir sonraki adım veri etiketlemedir. Bu süreç, yapay zekanın her bir görüntü veya videonun ne içerdiğini anlayabilmesi için verilere etiketler, ek açıklamalar veya açıklamalar eklemeyi içerir. 

Etiketler nesne adlarını, konumlarını, sınırlarını veya modelin görsel bilgileri doğru bir şekilde tanıması ve yorumlaması için eğitilmesine yardımcı olan diğer ilgili ayrıntıları içerebilir. Veri etiketleme, basit bir görüntü koleksiyonunu bir bilgisayarla görme modelini eğitmek için kullanılabilecek yapılandırılmış bir veri kümesine dönüştürür.

Model eğitimi için yüksek kaliteli veri gerekir

Bir veri kümesini yüksek kaliteli yapan şeyin ne olduğunu merak ediyor olabilirsiniz. Doğru etiketleme, çeşitlilik ve tutarlılık gibi birçok faktör söz konusudur. Örneğin, kedi kulaklarını tanımlamak için bir nesne algılama veri kümesini birden fazla kişi etiketliyorsa, biri bunları başın bir parçası olarak etiketlerken diğeri ayrı ayrı kulak olarak etiketleyebilir. Bu tutarsızlık modelin kafasını karıştırabilir ve doğru öğrenme kabiliyetini etkileyebilir.

İşte ideal bir bilgisayarla görme veri setinin niteliklerine hızlı bir genel bakış:

  • Net etiketler: Her görüntü tutarlı ve kesin etiketlerle doğru bir şekilde açıklanmıştır.
  • Çeşitli veriler: Veri seti, modelin çeşitli durumlarda iyi çalışmasına yardımcı olmak için farklı nesneler, arka planlar, aydınlatma koşulları ve açılar içerir.
  • Yüksek çözünürlüklü görüntüler: Keskin, ayrıntılı görüntüler modelin özellikleri öğrenmesini ve tanımasını kolaylaştırır.

Ultralytics çeşitli veri kümelerini destekler

YOLO11 gibi Ultralytics YOLO11 modelleri, belirli bir YOLO dosya biçimindeki veri kümeleriyle çalışmak üzere oluşturulmuştur. Kendi verilerinizi bu formata dönüştürmek kolay olsa da, hemen denemeye başlamak isteyenler için sorunsuz bir seçenek de sunuyoruz. 

Ultralytics Python paketi, çok çeşitli bilgisayarla görme veri kümelerini destekler ve nesne algılama, örnek segmentasyonu veya poz tahmini gibi görevleri kullanarak ekstra kurulum yapmadan projelere dalmanıza olanak tanır.  

Kullanıcılar COCO, DOTA-v2.0, Open Images V7 ve ImageNet gibi kullanıma hazır veri kümelerine, veri kümesi adını eğitim işlevindeki parametrelerden biri olarak belirterek kolayca erişebilirler. Bunu yaptığınızda, veri kümesi otomatik olarak indirilir ve önceden yapılandırılır, böylece modellerinizi oluşturmaya ve iyileştirmeye odaklanabilirsiniz.

2025'te en iyi 5 bilgisayarla görme veri kümesi

Görme Yapay Zekası alanındaki gelişmeler, inovasyonu teşvik eden ve atılımları mümkün kılan çeşitli, büyük ölçekli veri kümelerine dayanmaktadır. Ultralytics tarafından desteklenen ve bilgisayarla görme modellerini etkileyen en önemli veri kümelerinden bazılarına bir göz atalım.

ImageNet veri kümesi 

Fei-Fei Li ve ekibi tarafından Princeton Üniversitesi'nde 2007 yılında oluşturulan ve 2009 yılında tanıtılan ImageNet, 14 milyondan fazla etiketli görüntü içeren büyük bir veri kümesidir. Farklı nesneleri tanıma ve kategorize etme sistemlerini eğitmek için yaygın olarak kullanılmaktadır. Yapılandırılmış tasarımı, modelleri görüntüleri doğru bir şekilde sınıflandırmayı öğretmek için özellikle yararlı kılmaktadır. İyi belgelenmiş olsa da, öncelikle görüntü sınıflandırmasına odaklanır ve nesne algılama gibi görevler için ayrıntılı ek açıklamalardan yoksundur. 

ImageNet'in güçlü yönlerinden bazılarına bir göz atalım:

  • Çeşitlilik: ImageNet, 20.000'den fazla kategoriye yayılan görüntülerle, model eğitimini ve genelleştirmeyi geliştiren geniş ve çeşitli bir veri kümesi sunar.
  • Yapılandırılmış organizasyon: Görüntüler, WordNet hiyerarşisi kullanılarak titizlikle kategorize edilir, böylece verimli veri alımı ve sistematik model eğitimi kolaylaştırılır. 
  • Kapsamlı dokümantasyon: Kapsamlı araştırmalar ve yıllar süren çalışmalar ImageNet'i hem yeni başlayanlar hem de uzmanlar için erişilebilir hale getirerek bilgisayarla görme projeleri için değerli bilgiler ve rehberlik sağlar.

Ancak, her veri kümesi gibi bunun da sınırlamaları vardır. İşte dikkate alınması gereken bazı zorluklar:

  • Hesaplama talepleri: Devasa boyutu, sınırlı bilgi işlem kaynaklarına sahip daha küçük ekipler için zorluklar oluşturabilir.
  • Zamansal veri eksikliği: Sadece statik görüntüler içerdiğinden, video veya zamana dayalı veri gerektiren uygulamaların ihtiyaçlarını karşılamayabilir.
  • Eski görüntüler: Veri setindeki bazı görüntüler eskidir ve güncel nesneleri, stilleri veya ortamları yansıtmayabilir, bu da modern uygulamalar için uygunluğu azaltabilir.

DOTA-v2.0 veri kümesi

DOTA-v2.0 veri seti, DOTA'nın açılımı Havadan Görüntülerde Nesne Tespiti için Veri Seti'dir ve özellikle yönlendirilmiş sınırlayıcı kutu (OBB) nesne tespiti için oluşturulmuş kapsamlı bir hava görüntüleri koleksiyonudur. OBB tespitinde, görüntüdeki nesnelerin gerçek yönelimiyle daha doğru bir şekilde hizalanması için döndürülmüş sınırlayıcı kutular kullanılır. Bu yöntem, nesnelerin genellikle çeşitli açılarda göründüğü hava görüntülerinde özellikle işe yaramakta, daha hassas konum belirleme ve genel olarak daha iyi algılama sağlamaktadır.

Bu veri kümesi, 18 nesne kategorisinde 11.000'den fazla görüntü ve 1,7 milyondan fazla yönlendirilmiş sınırlayıcı kutudan oluşmaktadır. Görüntüler 800×800 ile 20.000×20.000 piksel arasında değişmekte ve uçaklar, gemiler ve binalar gibi nesneleri içermektedir. 

Şekil 2. DOTA-v2.0 veri setinden görüntü ve açıklama örnekleri. Resim yazara aittir.

DOTA-v2.0, ayrıntılı açıklamaları nedeniyle uzaktan algılama ve havadan gözetleme projeleri için popüler bir seçim haline gelmiştir. İşte DOTA-v2.0'ın bazı temel özellikleri:

  • Çeşitli nesne kategorileri: Araçlar, limanlar ve depolama tankları gibi birçok farklı nesne türünü kapsar ve modellerin çeşitli gerçek dünya nesnelerine maruz kalmasını sağlar.
  • Yüksek kaliteli açıklamalar: Uzman ek açıklamacılar, nesne şekillerini ve yönlerini açıkça gösteren hassas bir şekilde yönlendirilmiş sınırlayıcı kutular sağlamıştır.
  • Çok ölçekli görüntüler: Veri kümesi farklı boyutlarda görüntüler içerir ve modellerin hem küçük hem de büyük ölçeklerde nesneleri nasıl tespit edeceklerini öğrenmelerine yardımcı olur.

DOTA-v2'nin birçok güçlü yönü olsa da, işte kullanıcıların akılda tutması gereken bazı sınırlamalar:

  • Ekstra indirme adımları: DOTA veri setinin muhafaza edilme şekli nedeniyle, DOTA-v2.0 ekstra bir kurulum adımı gerektirir. Veri setini tamamlamak için önce DOTA-v1.0 görüntülerini indirmeniz ve ardından DOTA-v2.0 için ekstra görüntüleri ve güncellenmiş açıklamaları eklemeniz gerekir.
  • Karmaşık ek açıklamalar: Yönlendirilmiş sınırlayıcı kutular, model eğitimi sırasında işlemek için ekstra çaba gerektirebilir.
  • Sınırlı kapsam: DOTA-v2 hava görüntüleri için tasarlanmıştır, bu da onu bu alanın dışındaki genel nesne algılama görevleri için daha az kullanışlı hale getirir.

Roboflow 100 veri kümesi 

Roboflow 100 (RF100) veri seti, Intelin desteğiyle Roboflow tarafından oluşturulmuştur. Nesne algılama modellerinin ne kadar iyi çalıştığını test etmek ve kıyaslamak için kullanılabilir. Bu kıyaslama veri kümesi, 90.000'den fazla genel veri kümesi arasından seçilen 100 farklı veri kümesini içerir. Sağlık hizmetleri, hava görüntüleri ve oyun gibi alanlardan 224.000'den fazla görüntü ve 800 nesne sınıfına sahiptir. 

RF100 kullanmanın temel avantajlarından bazıları şunlardır:

  • Geniş alan kapsamı: Tıbbi görüntüleme, hava görüntüleri ve su altı araştırmaları gibi yedi alandan veri kümeleri içerir. 
  • Model geliştirmeyi teşvik eder: RF100'deki değişkenlik ve alana özgü zorluklar, mevcut modellerdeki boşlukları ortaya çıkararak araştırmaları daha uyarlanabilir ve sağlam nesne algılama çözümlerine yönlendirir.
  • Tutarlı görüntü formatı: Tüm görüntüler 640x640 piksel olarak yeniden boyutlandırılmıştır. Bu, kullanıcıların görüntü boyutlarını ayarlamalarına gerek kalmadan modelleri eğitmelerine yardımcı olur.

RF100, güçlü yönlerine rağmen akılda tutulması gereken bazı dezavantajlara da sahiptir:

  • Görevler açısından sınırlıdır: RF100 nesne algılama için tasarlanmıştır, bu nedenle segmentasyon veya sınıflandırma gibi görevleri yerine getiremez.
  • Kıyaslama merkezli odak: RF100, gerçek dünya uygulamaları için modelleri eğitmek yerine öncelikle bir kıyaslama aracı olarak tasarlanmıştır, bu nedenle sonuçları pratik dağıtım senaryolarına tam olarak aktarılamayabilir.
  • Açıklama değişkenliği: RF100 kitle kaynaklı veri kümelerini bir araya getirdiğinden, açıklama kalitesi ve etiketleme uygulamalarında tutarsızlıklar olabilir ve bu da model değerlendirmesini ve ince ayarı etkileyebilir.

COCO (Common objects in context) veri kümesi

COCO veri küm esi, ayrıntılı görüntü açıklamaları ile 330.000'den fazla görüntü sunan, en yaygın kullanılan bilgisayarla görme veri kümelerinden biridir. Nesne algılama, segmentasyon ve görüntü altyazılama için tasarlanmıştır, bu da onu birçok proje için değerli bir kaynak haline getirir. Sınırlayıcı kutular ve segmentasyon maskeleri de dahil olmak üzere ayrıntılı etiketleri, sistemlerin görüntüleri hassas bir şekilde analiz etmeyi öğrenmelerine yardımcı olur.

Bu veri seti esnekliği ile bilinir ve basitten karmaşık projelere kadar çeşitli görevler için kullanışlıdır. Görme Yapay Zekası alanında bir standart haline gelmiştir ve model performansını değerlendirmek için zorluklarda ve yarışmalarda sıklıkla kullanılmaktadır.

Güçlü yönlerinden bazıları şunlardır:

  • Çeşitli ve gerçekçi veriler: Veri kümesi, birden fazla nesne, oklüzyon ve çeşitli aydınlatma koşullarına sahip gerçek dünya senaryolarından görüntüler içerir.
  • Güçlü topluluk ve araştırma benimsemesi: Büyük makine öğrenimi yarışmalarında ve araştırmalarında kullanılan COCO veri seti kapsamlı belgelere, önceden eğitilmiş modellere ve aktif topluluk desteğine sahiptir.
  • Zengin ve ayrıntılı ek açıklamalar: COCO veri seti, nesne segmentasyonu, kilit noktalar ve başlıklar da dahil olmak üzere son derece ayrıntılı ek açıklamalar sunarak hassas görsel anlayış gerektiren projeler için idealdir.

Burada dikkat edilmesi gereken birkaç sınırlayıcı faktör de bulunmaktadır:

  • Yüksek hesaplama gereksinimleri: Boyutu ve karmaşıklığı nedeniyle, COCO'daki eğitim modelleri önemli hesaplama kaynakları gerektirebilir ve bu da sınırlı donanıma sahip ekipler için zorlayıcı olabilir.
  • Veri dengesizliği: Bazı nesne kategorileri diğerlerinden çok daha fazla görüntüye sahiptir ve bu da model eğitiminde yanlılığa yol açabilir.
  • Karmaşık açıklama yapısı: Veri kümesinin ayrıntılı açıklamaları değerli olmakla birlikte, yeni başlayanlar veya yapılandırılmış Vision AI veri kümeleriyle çalışma deneyimi olmayan küçük ekipler için zorlayıcı olabilir.

Open Images V7 veri seti

Open Images V7, 600 nesne kategorisi için ek açıklamalar içeren 9 milyondan fazla görüntü içeren, Google tarafından küratörlüğü yapılan devasa bir açık kaynak veri kümesidir. Çeşitli ek açıklama türleri içerir ve karmaşık bilgisayarla görme görevlerinin üstesinden gelmek için idealdir. Ölçeği ve derinliği, bilgisayarla görme modellerini eğitmek ve test etmek için kapsamlı bir kaynak sağlar.

Şekil 3. Open Images V7 veri setine bir bakış. Yazar tarafından resim.

Ayrıca, Open Images V7 veri setinin araştırma alanındaki popülerliği, kullanıcıların öğrenebileceği çok sayıda kaynak ve örnek sunmaktadır. Bununla birlikte, devasa boyutu, özellikle küçük ekipler için indirme ve işlemeyi zaman alıcı hale getirebilir. Diğer bir sorun da bazı ek açıklamaların tutarsız olabilmesi, verilerin temizlenmesi için ekstra çaba gerektirmesi ve entegrasyonun her zaman sorunsuz olmaması, yani ek hazırlık gerekebilmesidir. 

Doğru veri setini seçme 

Doğru veri kümesini seçmek, bilgisayarla görme projenizi başarıya ulaştırmanın büyük bir parçasıdır. En iyi seçim özel görevinize bağlıdır - iyi bir eşleşme bulmak modelinizin doğru becerileri öğrenmesine yardımcı olur. Ayrıca araçlarınızla kolayca entegre olabilmelidir, böylece modelinizi oluşturmaya daha fazla, sorun gidermeye daha az odaklanabilirsiniz.

Şekil 4. Doğru veri kümesini seçmek için faktörler. Yazar tarafından resim.

Önemli çıkarımlar

Yüksek kaliteli veri kümeleri, herhangi bir bilgisayarla görme modelinin bel kemiğidir ve sistemlerin görüntüleri doğru bir şekilde yorumlamayı öğrenmesine yardımcı olur. Modellerin gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağladıkları ve sınırlı veya düşük kaliteli verilerin neden olduğu hataları azalttıkları için çeşitli ve iyi açıklanmış veri kümeleri özellikle önemlidir.

Ultralytics , bilgisayarla görme veri kümelerine erişme ve bunlarla çalışma sürecini basitleştirerek projeniz için doğru verileri bulmanızı kolaylaştırır. Doğru veri kümesini seçmek, yüksek performanslı bir model oluşturmada çok önemli bir adımdır ve daha kesin ve etkili sonuçlara yol açar.

Topluluğumuza katılın ve yapay zeka hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfedin. Çözüm sayfalarımızda sağlık hizmetleri için bilgisayarla görme ve sürücüsüz araçlarda yapay zeka gibi gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarla görmeye başlamak için ilk adımı bugün atın!

Facebook logosuTwitter logosuLinkedIn logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın