2025'in en iyi bilgisayarla görme veri kümelerine daha yakından bakarken bize katılın. Çeşitli ve yüksek kaliteli veri kümelerinin daha akıllı Vision AI çözümlerini nasıl desteklediğini öğrenin.
Verilerin günlük olarak yaptığınız neredeyse her şeyde rol oynadığını biliyor muydunuz? Bir video izlemek, fotoğraf çekmek veya Google Haritalar'ı kontrol etmek, 75 milyardan fazla bağlı cihaz tarafından yakalanan sürekli bilgi akışına katkıda bulunur. Bu veri parçaları yapay zekanın (AI) temelini oluşturur. Aslında, aşağıdaki gibi gelişmiş bilgisayarla görme modelleri Ultralytics YOLO11 kalıpları belirlemek, görüntüleri yorumlamak ve çevremizdeki dünyayı anlamlandırmak için görsel verilere güvenir.
İlginç bir şekilde, verilerin değeri sadece miktarla ilgili değildir. Ne kadar iyi organize edildiği ve hazırlandığı daha önemlidir. Bir veri kümesi dağınık veya eksikse, hatalara yol açabilir. Ancak veri kümeleri temiz ve çeşitli olduğunda, ister kalabalıktaki nesneleri tanımak ister karmaşık görselleri analiz etmek olsun, bilgisayarla görme modellerinin daha iyi performans göstermesine yardımcı olurlar. Yüksek kaliteli veri kümeleri büyük fark yaratır.
Bu makalede, 2025'in en iyi bilgisayarla görme veri kümelerini keşfedecek ve bunların daha doğru ve verimli bilgisayarla görme modelleri oluşturmaya nasıl katkıda bulunduğunu göreceğiz. Hadi başlayalım!
Bilgisayarla görme veri kümesi, bilgisayarla görme sistemlerinin görsel bilgileri anlamayı ve tanımayı öğrenmesine yardımcı olan bir görüntü veya video koleksiyonudur. Bu veri kümeleri, modellerin verilerdeki nesneleri, insanları, sahneleri ve desenleri tanımasına yardımcı olan etiketler veya ek açıklamalarla birlikte gelir.
Bilgisayarla görme modellerini eğitmek için kullanılabilirler ve yüzleri tanımlama, nesneleri algılama veya sahneleri analiz etme gibi görevleri geliştirmelerine yardımcı olurlar. Veri kümesi ne kadar iyi düzenlenmiş, çeşitli ve doğru olursa, Görme Yapay Zekası modeli o kadar iyi performans gösterir ve günlük yaşamda daha akıllı ve daha kullanışlı teknolojilere yol açar.
Bir bilgisayarla görme veri seti oluşturmak, birine dünyayı nasıl göreceğini ve anlayacağını öğretmek için çalışma notları hazırlamak gibidir. Her şey, geliştirmekte olduğunuz özel uygulamaya uygun görüntü ve videoları toplamakla başlar.
İdeal bir veri kümesi, ilgilenilen nesnelerin farklı açılardan, çeşitli aydınlatma koşulları altında ve birden fazla arka plan ve ortamda çekilmiş çeşitli örneklerini içerir. Bu çeşitlilik, bilgisayarla görme modelinin desenleri doğru bir şekilde tanımayı öğrenmesini ve gerçek dünya senaryolarında güvenilir bir performans sergilemesini sağlar.
İlgili görüntü ve videoları topladıktan sonra, bir sonraki adım veri etiketlemedir. Bu süreç, yapay zekanın her bir görüntü veya videonun ne içerdiğini anlayabilmesi için verilere etiketler, ek açıklamalar veya açıklamalar eklemeyi içerir.
Etiketler nesne adlarını, konumlarını, sınırlarını veya modelin görsel bilgileri doğru bir şekilde tanıması ve yorumlaması için eğitilmesine yardımcı olan diğer ilgili ayrıntıları içerebilir. Veri etiketleme, basit bir görüntü koleksiyonunu bir bilgisayarla görme modelini eğitmek için kullanılabilecek yapılandırılmış bir veri kümesine dönüştürür.
Bir veri kümesini yüksek kaliteli yapan şeyin ne olduğunu merak ediyor olabilirsiniz. Doğru etiketleme, çeşitlilik ve tutarlılık gibi birçok faktör söz konusudur. Örneğin, kedi kulaklarını tanımlamak için bir nesne algılama veri kümesini birden fazla kişi etiketliyorsa, biri bunları başın bir parçası olarak etiketlerken diğeri ayrı ayrı kulak olarak etiketleyebilir. Bu tutarsızlık modelin kafasını karıştırabilir ve doğru öğrenme kabiliyetini etkileyebilir.
İşte ideal bir bilgisayarla görme veri setinin niteliklerine hızlı bir genel bakış:
YOLO11 gibi Ultralytics YOLO11 modelleri, belirli bir YOLO dosya biçimindeki veri kümeleriyle çalışmak üzere oluşturulmuştur. Kendi verilerinizi bu formata dönüştürmek kolay olsa da, hemen denemeye başlamak isteyenler için sorunsuz bir seçenek de sunuyoruz.
Ultralytics Python paketi, çok çeşitli bilgisayarla görme veri kümelerini destekler ve nesne algılama, örnek segmentasyonu veya poz tahmini gibi görevleri kullanarak ekstra kurulum yapmadan projelere dalmanıza olanak tanır.
Kullanıcılar COCO, DOTA-v2.0, Open Images V7 ve ImageNet gibi kullanıma hazır veri kümelerine, veri kümesi adını eğitim işlevindeki parametrelerden biri olarak belirterek kolayca erişebilirler. Bunu yaptığınızda, veri kümesi otomatik olarak indirilir ve önceden yapılandırılır, böylece modellerinizi oluşturmaya ve iyileştirmeye odaklanabilirsiniz.
Görme Yapay Zekası alanındaki gelişmeler, inovasyonu teşvik eden ve atılımları mümkün kılan çeşitli, büyük ölçekli veri kümelerine dayanmaktadır. Ultralytics tarafından desteklenen ve bilgisayarla görme modellerini etkileyen en önemli veri kümelerinden bazılarına bir göz atalım.
Fei-Fei Li ve ekibi tarafından Princeton Üniversitesi'nde 2007 yılında oluşturulan ve 2009 yılında tanıtılan ImageNet, 14 milyondan fazla etiketli görüntü içeren büyük bir veri kümesidir. Farklı nesneleri tanıma ve kategorize etme sistemlerini eğitmek için yaygın olarak kullanılmaktadır. Yapılandırılmış tasarımı, modelleri görüntüleri doğru bir şekilde sınıflandırmayı öğretmek için özellikle yararlı kılmaktadır. İyi belgelenmiş olsa da, öncelikle görüntü sınıflandırmasına odaklanır ve nesne algılama gibi görevler için ayrıntılı ek açıklamalardan yoksundur.
ImageNet'in güçlü yönlerinden bazılarına bir göz atalım:
Ancak, her veri kümesi gibi bunun da sınırlamaları vardır. İşte dikkate alınması gereken bazı zorluklar:
DOTA-v2.0 veri seti, DOTA'nın açılımı Havadan Görüntülerde Nesne Tespiti için Veri Seti'dir ve özellikle yönlendirilmiş sınırlayıcı kutu (OBB) nesne tespiti için oluşturulmuş kapsamlı bir hava görüntüleri koleksiyonudur. OBB tespitinde, görüntüdeki nesnelerin gerçek yönelimiyle daha doğru bir şekilde hizalanması için döndürülmüş sınırlayıcı kutular kullanılır. Bu yöntem, nesnelerin genellikle çeşitli açılarda göründüğü hava görüntülerinde özellikle işe yaramakta, daha hassas konum belirleme ve genel olarak daha iyi algılama sağlamaktadır.
Bu veri kümesi, 18 nesne kategorisinde 11.000'den fazla görüntü ve 1,7 milyondan fazla yönlendirilmiş sınırlayıcı kutudan oluşmaktadır. Görüntüler 800×800 ile 20.000×20.000 piksel arasında değişmekte ve uçaklar, gemiler ve binalar gibi nesneleri içermektedir.
DOTA-v2.0, ayrıntılı açıklamaları nedeniyle uzaktan algılama ve havadan gözetleme projeleri için popüler bir seçim haline gelmiştir. İşte DOTA-v2.0'ın bazı temel özellikleri:
DOTA-v2'nin birçok güçlü yönü olsa da, işte kullanıcıların akılda tutması gereken bazı sınırlamalar:
Roboflow 100 (RF100) veri seti, Intelin desteğiyle Roboflow tarafından oluşturulmuştur. Nesne algılama modellerinin ne kadar iyi çalıştığını test etmek ve kıyaslamak için kullanılabilir. Bu kıyaslama veri kümesi, 90.000'den fazla genel veri kümesi arasından seçilen 100 farklı veri kümesini içerir. Sağlık hizmetleri, hava görüntüleri ve oyun gibi alanlardan 224.000'den fazla görüntü ve 800 nesne sınıfına sahiptir.
RF100 kullanmanın temel avantajlarından bazıları şunlardır:
RF100, güçlü yönlerine rağmen akılda tutulması gereken bazı dezavantajlara da sahiptir:
COCO veri küm esi, ayrıntılı görüntü açıklamaları ile 330.000'den fazla görüntü sunan, en yaygın kullanılan bilgisayarla görme veri kümelerinden biridir. Nesne algılama, segmentasyon ve görüntü altyazılama için tasarlanmıştır, bu da onu birçok proje için değerli bir kaynak haline getirir. Sınırlayıcı kutular ve segmentasyon maskeleri de dahil olmak üzere ayrıntılı etiketleri, sistemlerin görüntüleri hassas bir şekilde analiz etmeyi öğrenmelerine yardımcı olur.
Bu veri seti esnekliği ile bilinir ve basitten karmaşık projelere kadar çeşitli görevler için kullanışlıdır. Görme Yapay Zekası alanında bir standart haline gelmiştir ve model performansını değerlendirmek için zorluklarda ve yarışmalarda sıklıkla kullanılmaktadır.
Güçlü yönlerinden bazıları şunlardır:
Burada dikkat edilmesi gereken birkaç sınırlayıcı faktör de bulunmaktadır:
Open Images V7, 600 nesne kategorisi için ek açıklamalar içeren 9 milyondan fazla görüntü içeren, Google tarafından küratörlüğü yapılan devasa bir açık kaynak veri kümesidir. Çeşitli ek açıklama türleri içerir ve karmaşık bilgisayarla görme görevlerinin üstesinden gelmek için idealdir. Ölçeği ve derinliği, bilgisayarla görme modellerini eğitmek ve test etmek için kapsamlı bir kaynak sağlar.
Ayrıca, Open Images V7 veri setinin araştırma alanındaki popülerliği, kullanıcıların öğrenebileceği çok sayıda kaynak ve örnek sunmaktadır. Bununla birlikte, devasa boyutu, özellikle küçük ekipler için indirme ve işlemeyi zaman alıcı hale getirebilir. Diğer bir sorun da bazı ek açıklamaların tutarsız olabilmesi, verilerin temizlenmesi için ekstra çaba gerektirmesi ve entegrasyonun her zaman sorunsuz olmaması, yani ek hazırlık gerekebilmesidir.
Doğru veri kümesini seçmek, bilgisayarla görme projenizi başarıya ulaştırmanın büyük bir parçasıdır. En iyi seçim özel görevinize bağlıdır - iyi bir eşleşme bulmak modelinizin doğru becerileri öğrenmesine yardımcı olur. Ayrıca araçlarınızla kolayca entegre olabilmelidir, böylece modelinizi oluşturmaya daha fazla, sorun gidermeye daha az odaklanabilirsiniz.
Yüksek kaliteli veri kümeleri, herhangi bir bilgisayarla görme modelinin bel kemiğidir ve sistemlerin görüntüleri doğru bir şekilde yorumlamayı öğrenmesine yardımcı olur. Modellerin gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağladıkları ve sınırlı veya düşük kaliteli verilerin neden olduğu hataları azalttıkları için çeşitli ve iyi açıklanmış veri kümeleri özellikle önemlidir.
Ultralytics , bilgisayarla görme veri kümelerine erişme ve bunlarla çalışma sürecini basitleştirerek projeniz için doğru verileri bulmanızı kolaylaştırır. Doğru veri kümesini seçmek, yüksek performanslı bir model oluşturmada çok önemli bir adımdır ve daha kesin ve etkili sonuçlara yol açar.
Topluluğumuza katılın ve yapay zeka hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfedin. Çözüm sayfalarımızda sağlık hizmetleri için bilgisayarla görme ve sürücüsüz araçlarda yapay zeka gibi gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarla görmeye başlamak için ilk adımı bugün atın!
Makine öğreniminin geleceği ile yolculuğunuza başlayın