Öklid dışı verileri işlemek için Grafik Sinir Ağlarını (GNN) keşfedin. GNN'lerin, gelişmiş Görsel Yapay Zeka için Ultralytics ile birlikte ilişkisel muhakemeyi nasıl geliştirdiğini öğrenin.
Grafik Sinir Ağı (GNN), grafik olarak temsil edilen verileri işlemek için tasarlanmış özel bir derin öğrenme mimarisi sınıfıdır. Geleneksel modeller, örneğin Konvolüsyonel Sinir Ağları (CNN'ler) görüntüler gibi ızgara benzeri yapılar için optimize edilmiştir ve Tekrarlayan Sinir Ağları (RNN'ler) metin veya Zaman Serisi Analizi gibi sıralı verilerde üstünlük sağlarken, GNN'ler Öklid dışı verileri işleme konusunda benzersiz bir yeteneğe sahiptir. Bu, GNN'lerin düğümler (varlıklar) ve kenarlar (ilişkiler) tarafından tanımlanan veri kümeleri üzerinde çalıştıkları ve gerçek dünya ağlarını karakterize eden karmaşık karşılıklı bağımlılıklardan öğrenmelerine olanak tanıdıkları anlamına gelir. GNN'ler, hem bireysel veri noktalarının özelliklerini hem de bunlar arasındaki yapısal bağlantıları yakalayarak, ilişkilerin varlıklar kadar önemli olduğu alanlarda güçlü içgörüler sağlar.
GNN'nin arkasındaki temel mekanizma, genellikle "mesaj aktarımı" veya komşuluk toplaması olarak adlandırılan bir süreçtir. Bu çerçevede, grafikteki her düğüm, yakın komşularından bilgi toplayarak kendi temsilini günceller. Model eğitimi sırasında, ağ düğümün özelliklerini yerel komşuluğunun topolojisiyle birlikte kodlayan etkili gömüler(yoğun vektör temsilleri) üretmeyi öğrenir.
Birden fazla işleme katmanı sayesinde, bir düğüm sonunda grafikte daha uzak mesafelerden gelen bilgileri dahil edebilir ve böylece "algılama alanını" etkili bir şekilde genişletebilir. Bu, modelin daha büyük yapı içindeki bir düğümün bağlamını anlamasını sağlar . PyTorch ve Deep Graph Library (DGL) gibi modern çerçeveler, bu karmaşık mesaj aktarım şemalarının uygulanmasını kolaylaştırarak, geliştiricilerin sıfırdan başlamadan sofistike grafik tabanlı uygulamalar oluşturmalarını sağlar .
GNN'lerin kendine özgü rolünü anlamak için, bunları AI alanında bulunan diğer yaygın sinir ağı (NN) türlerinden ayırmak yararlıdır:
Keyfi ilişkileri modelleme yeteneği, GNN'leri çeşitli yüksek etkili endüstrilerde vazgeçilmez kılmaktadır:
Grafik Sinir Ağları, çok modlu boru hatlarına giderek daha fazla entegre edilmektedir. Örneğin, kapsamlı bir sistem, görüntü segmentasyonunu kullanarak bir sahnedeki farklı nesneleri tanımlayabilir ve ardından bir GNN kullanarak bu nesneler arasındaki uzamsal ilişkileri (genellikle "Sahne Grafiği" olarak adlandırılır) analiz edebilir. Bu, görsel algı ile mantıksal akıl yürütme arasındaki boşluğu doldurur.
Aşağıdaki Python , Vision AI ile grafik yapıları arasında köprü kurmayı göstermektedir. Bu örnekte
Ultralytics YOLO26 detect için model,
düğüm görevi görür ve temel bir grafik yapısı hazırlar. torch.
import torch
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image to find entities (nodes)
results = model("https://ultralytics.com/images/bus.jpg")
# Extract box centers to serve as node features
# Format: [center_x, center_y] derived from xywh
boxes = results[0].boxes.xywh[:, :2].cpu()
x = torch.tensor(boxes.numpy(), dtype=torch.float)
# Create a hypothetical edge index connecting the first two objects
# In a real GNN, edges might be defined by distance or interaction
edge_index = torch.tensor([[0, 1], [1, 0]], dtype=torch.long)
print(f"Graph constructed: {x.size(0)} nodes (objects) and {edge_index.size(1)} edges.")
Bu karmaşık süreçler için gerekli veri kümelerini yönetmek isteyen geliştiriciler, sistemin görme bileşenleri için açıklama ve eğitim iş akışlarını basitleştiren Ultralytics kullanabilirler. Mühendisler, sağlam görme modellerini GNN'lerin ilişkisel muhakemesi ile birleştirerek, çevrelerindeki dünyayı daha iyi anlayan bağlam farkında otonom sistemler oluşturabilirler. GNN'ler, yapay zeka sistemlerinin karmaşık verileri anlamasına ve yorumlamasına olanak tanıyan güçlü araçlardır. Bu teknolojinin, gelecekte daha akıllı ve verimli sistemler geliştirilmesinde önemli bir rol oynayacağına inanıyoruz.