AMD'nin Ultra Ethernet Hazır Pollara 400Gbps Ağ Kartı ve Zettascale AI Kümeleri
Platformumuzdaki en çok okunan ve popüler makaleleri görmek için Trendler bölümüne geçebilirsiniz.
AMD, yüksek performanslı bilgi işlem (HPC) ve yapay zeka kümeleri için tasarlanmış Ultra Ethernet destekli ilk ağ kartı olan Pollara 400Gbps NIC'i piyasaya sürdü. Bu ağ kartı, yüksek bant genişliği ve düşük gecikme süreleriyle HPC ortamlarında veri iletimini optimize etmeyi amaçlıyor.
Pollara 400Gbps NIC ve Ultra Ethernet Teknolojisi
Pollara ağ kartları, RoCEv2 (RDMA over Converged Ethernet v2) protokolü üzerinde çalışan gelişmiş donanım ve yazılım özelliklerine sahip. Bu özellikler arasında:
Paket düzeyinde kaynak portu ayarlaması: Yukarı akış anahtar bağlantılarının sayısına göre kaynak portu değiştirilerek ECMP (Equal-Cost Multi-Path) karma algoritması için entropi artırılır ve paketlerin farklı yollar üzerinden dağıtılması sağlanır.
Bellek işaretçilerinin paketlere eklenmesi: Bu, tek bir paketin yeniden iletimine olanak tanır, böylece tüm veri akışının değil sadece kaybolan paketin tekrar gönderilmesi mümkün olur.
Seçici onaylama ve tıkanıklık kontrolü: Ağ üzerindeki paketlerin sırasız teslimatı ve yeniden iletimi yönetilir.
Ultra Ethernet, bu temel üzerine inşa edilen ve çoklu satıcı uyumluluğu hedefleyen bir standart olarak konumlanıyor. Bu teknoloji, standart Ethernet ağlarında RoCEv2'nin performansını artırmak için ECN (Explicit Congestion Notification) yapılandırmasını gerektiriyor.
Ayrıca Bakınız
Ethernet ve HPC Ortamları
Ethernet, fiziksel bağlantı türü olarak fiber optik ve bakır kablolar üzerinde çalışabilen bir veri bağlantı katmanı protokolüdür. HPC ortamlarında:
Bakır DAC (Direct Attach Copper) kablolar: Genellikle sunucu rafları içinde kullanılır.
Fiber optik kablolar: Raflar arası bağlantılar için tercih edilir.
Ethernet, HPC'de ana interconnect protokolü olarak değil, daha çok çerçeveleme ve veri iletim katmanı olarak görev yapar. İnfiniband ve Slingshot gibi teknolojiler, Ethernet'in modifiye edilmiş versiyonları olarak yüksek performanslı ağlar sağlar. Slingshot, özellikle dünyanın en hızlı süper bilgisayarlarında kullanılan gelişmiş bir Ethernet tabanlı ağdır ve 200GbE ile 400GbE hızlarını destekler.
Performans ve Maliyet Değerlendirmesi
Pollara 400Gbps NIC, Nvidia'nın CX7 ve Broadcom'un Thor2 çözümlerine kıyasla sırasıyla %10 ve %20 daha yüksek RDMA performansı sunuyor. RDMA (Remote Direct Memory Access), verinin doğrudan uygulama belleğine CPU veya işletim sistemi müdahalesi olmadan aktarılmasını sağlar ve bu da gecikmeyi azaltır.
Maliyet açısından, HPC kümelerinde ağ donanımı toplam sistem maliyetinin küçük bir bölümünü oluşturur. Depolama ve işlem kaynakları genellikle çok daha yüksek maliyetlidir. Pollara'nın sunduğu gelişmiş paket yönetimi ve düşük gecikme özellikleri, toplam sistem verimliliğini artırarak ağ maliyetlerinin görece önemsiz kalmasını sağlar.
Gecikme ve Ağ Optimizasyonları
Pollara kartları, TCP yerine UDP tabanlı RDMA kullanarak gecikmeyi azaltır. UDP üzerinden çalışan RDMA, gelişmiş QoS (Quality of Service) ve tıkanıklık kontrol mekanizmaları (PFC - Priority Flow Control, ECN - Explicit Congestion Notification) ile kayıpsız veri iletimini garanti eder. Ayrıca, ağ anahtarlarında cut-through switching gibi teknikler veri iletim hızını artırır.
Sonuç
AMD'nin Pollara 400Gbps Ultra Ethernet hazır ağ kartı, HPC ve yapay zeka kümeleri için optimize edilmiş yüksek performanslı bir çözüm sunuyor. RoCEv2 protokolü ve gelişmiş paket işleme özellikleri sayesinde, yüksek bant genişliği ve düşük gecikme gereksinimlerini karşılayarak zettascale seviyesindeki AI kümelerinin ağ altyapısını güçlendiriyor. Ethernet'in uzun ömürlü ve evrimleşen yapısı, fiber ve bakır kablo altyapılarıyla birleşerek HPC dünyasında kritik bir rol oynamaya devam ediyor.
"AMD, Pollara 400GbE kartının Nvidia ve Broadcom çözümlerine kıyasla daha yüksek RDMA performansı sunduğunu iddia ediyor."











