Son MLPerf sonuçlarına göre Nvidia, yeni Blackwell B200 GPU serisinin H100’e kıyasla büyük bir performans artışı sağladığını açıkladı. Nvidia’nın MLPerf’e sunduğu verilere göre, B200 sistemleri, H100’ün sunduğu eğitim performansının tam 2.2 katını sunarak büyük bir gelişme gösterdi.
Blackwell B200 ile H100 Arasındaki Farklar
Nvidia’nın Nyx süper bilgisayarında kullanılan DGX B200 sistemleri, FP8, FP16, BF16 ve TF32 hassasiyetlerinde H100 sistemlerine göre 2.27 kat daha yüksek bir pik nokta performansı sağlıyor. Özellikle, Llama 2 70B gibi büyük dil modellerini (LLM) ince ayarlarken B200, H100’e göre 2.2 kat daha yüksek performans sundu. Benzer şekilde, GPT-3 175B modelinin ön eğitiminde de iki kat performans artışı sağlandı.
Ancak performanstaki bu artış sadece işlem gücü ile sınırlı değil. Blackwell’in geliştirilmiş HBM3e bellek bant genişliği – 8 TBps’ye kadar çıkabiliyor – bu performans artışında önemli bir rol oynuyor. Hopper ile aynı performansı elde etmek için 256 GPU gerekirken, Blackwell ile bu benchmark sadece 64 GPU ile tamamlandı.
B200 ve GB200 Arasındaki Farklılıklar
Nvidia’nın B200 serisi, kağıt üzerinde 9 petaFLOPS FP8 performansı sunarken, GB200 serisi GPU’lar ise 10 petaFLOPS sağlayarak daha güçlü bir seçenek sunuyor. Geleneksel DGX sistemleri genellikle sekiz GPU barındırıyor ve NVLink bağlantısı ile destekleniyordu, ancak Blackwell ile bu alan 72 hızlandırıcıya genişletildi.
Bu yeni genişleme, özellikle büyük modelleri eğitme süresinde önemli bir performans iyileştirmesi sağlayabilir. NVLink’in, InfiniBand bağlantısına göre birkaç kat daha hızlı olması, eğitim süresinde ciddi farklar yaratabilir.
Yazılım ve Ağ Altyapısındaki Gelişmelerle Daha Fazla Performans Artışı Bekleniyor
Nvidia’nın yeni nesil ConnectX-8 SuperNIC’leri, InfiniBand bant genişliğini 800 Gbps’ye çıkaracak. Ayrıca, yazılım optimizasyonları ve diğer yükseltmeler, Hopper serisinin MLPerf sıralamasına ilk kez girmesinden bu yana dikkate değer performans artışları sağladı. Blackwell’in eğitim sonuçları, Nvidia’nın platform için MLPerf’te paylaştığı ilk sonuçlardan sadece birkaç ay sonra geldi. Bu performans artışı, yazılım ve donanımdaki yeniliklerin yanında, yüksek hızdaki NVLink ve ConnectX-8 SuperNIC gibi teknolojik gelişmelerle destekleniyor.
Sonuç
Nvidia’nın yeni Blackwell B200 serisi, H100’e kıyasla belirgin bir performans artışı sunuyor. Özellikle büyük dil modellerinin eğitim sürecinde gereken GPU sayısının düşmesi ve bellek hızındaki iyileştirmeler sayesinde, Blackwell serisi gelecekte daha da yüksek performans sunacak gibi görünüyor. Bu gelişmeler, yapay zeka eğitiminde Nvidia’nın bir adım önde olduğunu kanıtlıyor.