H Company, bilgisayar kullanımını kökten değiştirmeyi hedefleyen yeni çok modlu yapay zeka modeli Holotron-12B’yi duyurdu. NVIDIA’nın Nemotron-Nano-2 VL modeli temel alınarak geliştirilen bu teknoloji, özellikle karmaşık dijital ortamlarda karar verme ve aksiyon alma yeteneğiyle dikkat çekiyor.

İşlem Hızında Yeni Bir Dönem

Holotron-12B'yi rakiplerinden ayıran en önemli özellik, sunduğu yüksek performanslı çalışma kapasitesi. Geleneksel modellerin aksine, bu model hibrit bir Durum-Uzay Modeli (SSM) mimarisi kullanıyor. Bu tasarım, standart modellerin yaşadığı yüksek bellek tüketimi sorununu ortadan kaldırıyor. Özellikle çok sayıda görselin işlendiği ve uzun süreli etkileşimlerin yaşandığı süreçlerde, model çok daha az bellek harcayarak verimliliği zirveye taşıyor.

Yapılan testlerde, tek bir H100 ekran kartı üzerinde Holotron-12B, önceki nesil modellere göre iki kat daha fazla işlem hacmi sağladı. Saniyede 8.900 token hızına ulaşabilen model, verilerin işlenmesi ve otomatik yanıt oluşturulması gibi yoğun iş yüklerinde rakiplerini geride bırakıyor.

Eğitim Süreci ve Başarı Kriterleri

H Company ekibi, modeli iki aşamalı bir süreçten geçirdi. NVIDIA’nın temel modelini aldıktan sonra, şirketin kendi geliştirdiği özel veri setleriyle ekran okuma, nesne konumlama ve arayüz etkileşimi üzerine yoğun bir eğitim süreci uygulandı. Bu süreçte yaklaşık 14 milyar token işlenerek modelin gerçek dünya senaryolarına tam uyum sağlaması hedeflendi.

Neden Önemli?

WebVoyager gibi zorlu testlerde başarı oranını %35’ten %80’in üzerine taşıyan Holotron-12B, sadece bir araştırma projesi olmanın ötesine geçiyor. Modelin sunduğu avantajlar şu şekilde sıralanıyor:

  • Düşük bellek kullanımı: Uzun süreli işlemlerde sistemin şişmesini engelliyor.
  • Yüksek ölçeklenebilirlik: Aynı donanım üzerinde çok daha fazla işlemi aynı anda yapabiliyor.
  • Gelişmiş navigasyon: İnternet sitelerinde kullanıcı gibi hareket ederek hedeflenen görevleri başarıyla tamamlıyor.

H Company, bu teknolojiyi şimdiden Hugging Face üzerinden geliştiricilerin kullanımına açmış durumda. Şirket, Nemotron 3 Omni ile bu alandaki yetenekleri bir üst seviyeye taşımak için şimdiden çalışmalara başladığını da müjdeledi.