Yeşil çek
Panoya kopyalanan bağlantı

Bilgisayarla Görme, Vision AI ajanlarının nasıl karar verdiğini yönlendirir

Yapay zeka ajanlarının sektörleri yeniden keşfetmek için bilgisayarla görmeyi nasıl kullandığını öğrenin. Güvenlik, sürücüsüz arabalar ve daha fazlası gibi alanlardaki uygulamalarını keşfedin.

Üretimden perakendeye kadar her sektör kendi süreç zorluklarıyla karşı karşıyadır ve bu sorunları çözmek için yenilikçi yollar bulmak, başarılı işletmeler yürütmenin her zaman anahtarı olmuştur. Son zamanlarda, yapay zeka ajanları birçok alanda popüler bir çözüm haline geldi. Bu sistemler verileri analiz etmenin ötesine geçiyor. Aynı zamanda harekete de geçebilirler. 

Örneğin, üretimdeki yapay zeka ajanları kusurları gerçek zamanlı olarak tespit edebilir ve üretimin sorunsuz bir şekilde devam etmesini sağlamak için kalite kontrol önlemlerini otomatik olarak başlatabilir. Benzer şekilde, lojistik ve perakendede, akıllı gözetim kullanarak birden fazla konumu izleyebilir ve ekipleri olağandışı faaliyetlere karşı anında uyarabilirler. 

Bu trend büyüdükçe, YZ aracıları dünya çapında sektörleri aktif olarak dönüştürüyor. Küresel YZ aracıları pazarı 2024 yılında 5,1 milyar dolara ulaştı ve 2030 yılına kadar 47,1 milyar dolara çıkması bekleniyor.

Şekil 1. Küresel yapay zeka aracıları pazar büyüklüğüne bir bakış.

Bu gelişmeleri yönlendiren kilit teknolojilerden biri bilgisayarla görmedir. Makinelerin görsel verileri işlemesini ve yorumlamasını sağlayan Vision AI, AI ajanlarının gerçek zamanlı nesne algılama, örnek segmentasyonu ve nesne izleme gibi bilgisayarla görme görevlerini inanılmaz bir doğrulukla gerçekleştirmesini mümkün kılar. Makinelerin gördükleri ile nasıl karar verdikleri arasındaki boşluğu doldurarak yapay zeka destekli birçok çözümün kritik bir parçası haline getiriyor.

Bu makalede, YZ aracılarını ve bunların bilgisayarla görmeyle ilişkisini inceleyeceğiz. Ayrıca farklı YZ aracı türlerini ve bunların görü tabanlı uygulamalarda nasıl kullanıldıklarını tartışacağız. Hadi başlayalım!

Yapay zeka ajanları nedir?

Görüş tabanlı YZ aracılarına geçmeden önce, bu sistemlerin ne kadar çok yönlü olabileceğini görmek için genel olarak YZ aracılarını anlamak için biraz zaman ayıralım.

Bir YZ ajanı, bir insanın yardımına ihtiyaç duymadan görevleri veya soruları anlayabilen ve bunlara yanıt verebilen akıllı bir sistemdir. Birçok YZ ajanı, temel soruları yanıtlamaktan karmaşık süreçleri yönetmeye kadar çok çeşitli görevleri yerine getirmek için makine öğrenimi ve doğal dil işleme (NLP) kullanır. 

Hatta bazı YZ aracıları, her güncelleme için insan girdisine dayanan geleneksel YZ sistemlerinin aksine, zaman içinde öğrenme ve gelişme yeteneğine sahiptir. Bu nedenle YZ aracıları hızla YZ'nin önemli bir parçası haline geliyor. Sürekli denetime ihtiyaç duymadan görevleri otomatikleştirebilir, kararlar alabilir ve çevreleriyle etkileşime girebilirler. Özellikle tekrarlayan ve zaman alan görevleri yönetmek için kullanışlıdırlar.

Örneğin, müşteri hizmetleri ve konaklama gibi sektörlerde yapay zeka temsilcileri bulabilirsiniz. YZ temsilcileri, müşteri hizmetlerinde geri ödemeleri işlemek ve kişiselleştirilmiş ürün önerileri sunmak için kullanılıyor. Bu arada, konaklama sektöründe, otel personelinin konuk taleplerini yönetmesine, oda servisini kolaylaştırmasına ve konuklara yakındaki turistik yerleri önermesine yardımcı olabilirler. Bu örnekler, YZ temsilcilerinin günlük süreçleri nasıl daha hızlı ve verimli hale getirdiğini göstermektedir.

Görsel yapay zeka ajanlarının nasıl çalıştığını anlama

Şimdi, YZ aracılarının nasıl çalıştığına hızlıca bir göz atalım. Her YZ ajanı benzersiz ve belirli görevler için tasarlanmış olsa da, hepsi aynı üç ana adımı paylaşır: algılama, karar verme ve eylem.

İlk olarak, algılama adımında, YZ ajanları neler olduğunu anlamak için farklı kaynaklardan bilgi toplar. Sırada karar verme var. Topladıkları bilgilere dayanarak, durumu analiz etmek ve en iyi hareket tarzına karar vermek için algoritmalarını kullanırlar. Son olarak da harekete geçerler. Bir karar verdikten sonra, bir soruyu yanıtlamak, bir görevi tamamlamak veya bir insanın ele alması için bir sorunu işaretlemek olsun, bunu gerçekleştirirler.

Kulağa basit gelebilir, ancak YZ aracısının türüne bağlı olarak, bu adımların çalışmasını sağlamak için genellikle perde arkasında çok şey olur. Karmaşık verileri analiz etmekten gelişmiş makine öğrenimi modellerini kullanmaya kadar her bir YZ ajanı, belirli görevleri kendi yöntemleriyle yerine getirmek üzere tasarlanmıştır. 

Örneğin, birçok YZ ajanı NLP aracılığıyla dili işlemeye odaklanırken, vizyon YZ ajanları olarak bilinen diğerleri görsel verileri işlemek için bilgisayar görüşünü entegre eder. Aşağıdaki gibi gelişmiş bilgisayarla görme modelleri kullanarak Ultralytics YOLO11yapay zeka ajanları daha hassas görüntü analizi gerçekleştirebilir.

Şekil 2. YOLO11 kullanarak bir görüntüdeki elmaları sayma örneği.

Sürücüsüz araçlarda vizyon yapay zeka ajanları

Gören yapay zeka ajanlarının yukarıda açıklanan üç ana adımda nasıl çalıştığını görmek için sürücüsüz arabaları örnek olarak kullanalım:

  • Algı: Sürücüsüz araçlardaki görselyapay zeka ajanları, araca takılı kamera ve sensörlerden görsel veriler toplar. Bu veriler, diğer araçlar, yayalar, trafik sinyalleri ve yol işaretleri gibi çevredeki ortamın görüntülerini ve videolarını içerir.
  • Karar Verme: Yapay zeka ajanı bu görsel verileri YOLO11 gibi modelleri kullanarak işler. Arabalar ve yayalar gibi nesneleri tanımlar, engelleri veya ani şerit değişikliklerini tespit eder ve trafik akışı ve sinyal durumları gibi kalıpları tanır. Bu, aracın yol koşullarını gerçek zamanlı olarak anlamasına yardımcı olur.
  • Eylem: Yapay zeka ajanı, analizine dayanarak bir engelden kaçınmak için direksiyonu kırmak, hızı ayarlamak veya kırmızı ışıkta durmak gibi eylemlerde bulunur. Bu kararlar, güvenli ve verimli sürüş sağlamak için hızlı bir şekilde alınır.

Waymo'nun sürücüsüz araçları bu teknolojinin harika bir örneğidir. Çevrelerini anlamak, gerçek zamanlı kararlar almak ve insan girdisi olmadan yollarda güvenli ve verimli bir şekilde gezinmek için vizyon yapay zeka ajanlarını kullanıyorlar.

Şekil 3. Waymo'nun yapay zeka aracı tabanlı sürücüsüz taksisi.

Görsel yapay zeka aracı türleri 

YZ aracılarının nasıl çalıştığını ve bilgisayarla görmeyi nasıl kullandıklarını gördüğümüze göre, şimdi farklı YZ aracı türlerine bakalım. Her tür, basit eylemlerden daha karmaşık karar verme ve öğrenmeye kadar belirli görevler için tasarlanmıştır.

Basit refleks ajanları

Basit refleks ajanları en temel yapay zeka ajanı türüdür. Belirli girdilere önceden tanımlanmış eylemlerle yanıt verirler, herhangi bir geçmişi veya gelecekteki sonuçları dikkate almadan yalnızca mevcut duruma dayanırlar. Bu ajanlar tipik olarak davranışlarını yönlendirmek için basit "eğer-o zaman" kurallarını kullanırlar.

Görüntü analiziyle ilgili olarak, basit bir refleks ajanı belirli bir rengi (kırmızı gibi) tespit etmek ve anında bir eylemi (kırmızı nesneleri vurgulamak veya saymak gibi) tetiklemek üzere programlanabilir. Bu basit görevler için işe yarayabilirken, ajan önceki deneyimlerden öğrenmediği veya uyum sağlamadığı için daha karmaşık ortamlarda yetersiz kalır.

Model tabanlı refleks ajanları

Model tabanlı refleks ajanları basit refleks ajanlarından daha gelişmişlerdir çünkü durumu daha iyi anlamak için çevrelerinin dahili bir modelini kullanırlar. Bu model, eksik veya tamamlanmamış bilgileri ele almalarını ve daha bilinçli kararlar vermelerini sağlar. 

Örneğin yapay zekalı güvenlik kamera sistemlerini ele alalım. Bu sistemlere entegre edilen yapay zeka ajanları, gerçek zamanlı olarak neler olup bittiğini analiz etmek için bilgisayar görüşünü kullanabilir. Hareketleri ve eylemleri normal davranış modeliyle karşılaştırabilir, hırsızlık gibi olağandışı faaliyetleri tespit etmelerine ve potansiyel güvenlik tehditlerini daha doğru bir şekilde işaretlemelerine yardımcı olabilirler.

Şekil 4. Hırsızlığı tespit etmek için bilgisayarla görmenin kullanılmasına bir örnek.

Fayda temelli aracılar

Mahsul izleme için kullanılan kamu hizmeti tabanlı bir drone düşünün. Engellerden kaçınırken daha fazla alanı kapsayacak şekilde uçuş yolunu ayarlar ve iş için en iyi rotayı seçer. Bu, dronun hangi alana öncelik verileceği veya verimli bir şekilde nasıl gezinileceği gibi birden fazla potansiyel eylemi değerlendirdiği ve etkinliğini en üst düzeye çıkaran eylemi seçtiği anlamına gelir. 

Benzer şekilde, fayda tabanlı ajanlar, en büyük faydayı veya sonucu elde etmek için çeşitli seçenekler arasından en iyi eylemi seçmek üzere tasarlanmıştır. Bunun için tasarlanan görsel yapay zeka ajanları, görüntüler veya sensör verileri gibi farklı görsel girdileri işleyip analiz edebilir ve önceden tanımlanmış kriterlere göre en faydalı sonucu seçebilir. 

Şekil 5. Hizmete dayalı dronlar mahsul izleme için kullanılabilir.

Hedef tabanlı ajanlar

Hedef tabanlı ajanlar fayda tabanlı ajanlara benzer çünkü her ikisi de belirli hedeflere ulaşmayı amaçlar. Ancak, hedef tabanlı ajanlar yalnızca kendilerini tanımlanmış hedeflerine yaklaştıran eylemlere odaklanır. Her bir eylemi, genel değer veya ödünleşimler gibi diğer faktörleri tartmadan, hedeflerine ulaşmalarına nasıl yardımcı olduğuna göre değerlendirirler.

Örneğin, sürücüsüz bir otomobil, amacı bir hedefe ulaşmak olduğunda hedefe dayalı bir aracı olarak çalışır. Engellerden kaçınmak, trafik sinyallerine uymak ve rotada kalmak için doğru dönüşleri seçmek gibi kararlar almak için yapay zeka kameralarından ve sensörlerden gelen verileri işler. Bu kararlar tamamen hedefe güvenli ve verimli bir şekilde ulaşma amacıyla ne kadar uyumlu olduklarına göre yönlendirilir. Fayda temelli aracıların aksine, hedef temelli aracılar verimlilik veya optimizasyon gibi ek kriterleri dikkate almadan yalnızca hedefe ulaşmaya odaklanır.

Şekil 6. Çevresindeki nesneleri tanımlamak için bilgisayar görüşü kullanan bir sürücüsüz araç.

Öğrenme ajanları

Bilgisayarla görmeye aşinaysanız, modellerin yeni verilerden öğrenerek geliştiği bir süreç olan ince ayarı duymuş olabilirsiniz. Öğrenen aracılar da benzer şekilde çalışır, deneyim kazandıkça zaman içinde adapte olur ve gelişir. Görüntü tabanlı kalite kontrol gibi uygulamalarda, bu aracılar her denetimde kusurları tespit etmede daha iyi hale gelir. Performanslarını iyileştirme yeteneği, güvenlik ve hassasiyetin hayati önem taşıdığı havacılık gibi alanlarda özellikle hayati önem taşımaktadır.

Hiyerarşik ajanlar

Hiyerarşik aracılar karmaşık görevleri daha küçük, daha yönetilebilir adımlara bölerek basitleştirir. Üst düzey bir aracı, stratejik kararlar alarak genel süreci denetlerken, alt düzey aracılar belirli görevleri yerine getirir. Birden fazla adım ve ayrıntılı yürütme içeren işlemler söz konusu olduğunda daha verimlidir.

Örneğin, otomatik bir depoda, üst düzey bir robot, hangi öğelerin hangi alanlara gitmesi gerektiğine karar vererek sıralama sürecini planlayabilir. Aynı zamanda, alt düzey robotlar bilgisayar görüşü kullanarak öğeleri tanımlamaya, boyut, şekil veya etiket gibi özellikleri analiz etmeye ve bunları doğru kutulara yerleştirmeye odaklanır. Sorumlulukların net bir şekilde paylaştırılması sistemin sorunsuz çalışmasına yardımcı olur.

Şekil 7. Paketleri sıralayan bir robotik yapay zeka ajanı örneği.

Bir vizyon yapay zeka ajanı oluşturmaya nasıl başlanır?

Görme yeteneklerine sahip bir yapay zeka ajanının çekirdeği bir bilgisayar görme modelidir. Günümüzde mevcut olan en yeni ve en güvenilir bilgisayarla görme modellerinden biri Ultralytics YOLO11 'dur. YOLO11 gerçek zamanlı verimliliği ve doğruluğu ile bilinir, bu da onu bilgisayarla görme görevleri için mükemmel kılar.

İşte YOLO11'un yetenekleri ile kendi yapay zeka ajanınızı oluşturmanın içerdiği farklı süreçler:

  • Hazırlayın veri kümesi: Yapay zeka aracınızın gerçekleştireceği görevle ilgili etiketli görüntüleri toplayın ve önceden işleyin.
  • Özel tren model: Benzersiz uygulamanızın doğruluğunu ve performansını artırmak için YOLO11 adresini veri kümeniz üzerinde özel olarak eğitin.
  • Bir karar verme çerçevesi ile entegre edin: Eğitilmiş modeli, yapay zeka ajanının görsel girdilere dayalı kararlar almasını sağlayan bir sisteme bağlayın.
  • Test edin ve iyileştirin: YZ aracısını dağıtın, performansını test edin, geri bildirim toplayın ve doğruluğu ve güvenilirliği artırmak için modeli ayarlayın.

Önemli çıkarımlar

Bilgisayar görüşü ile entegre yapay zeka ajanları - vizyon yapay zeka ajanları - görevleri otomatikleştirerek, süreçleri daha hızlı hale getirerek ve karar verme sürecini iyileştirerek sektörleri değiştiriyor. Trafiği kontrol eden akıllı şehirlerden yüz tanıma kullanan güvenlik sistemlerine kadar, bu ajanlar yaygın sorunlara yeni çözümler getiriyor. 

Ayrıca zaman içinde öğrenmeye ve gelişmeye devam edebilirler, bu da onları değişen ortamlarda kullanışlı hale getirir. YOLO11 gibi araçlarla, bu yapay zeka aracılarını oluşturmak ve kullanmak daha kolaydır ve daha akıllı, daha verimli çözümlere yol açar.

Topluluğumuza katılın ve yapay zeka hakkında bilgi edinmek için GitHub depomuza göz atın. Çözüm sayfalarımızda sağlık hizmetlerinde bilgisayarla görmenin ve tarımda yapay zekanın çeşitli uygulamalarını keşfedin. Başlamak için mevcut lisanslama seçeneklerine bir göz atın!

Facebook logosuTwitter logosuLinkedIn logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın