Z.AI platformu, ajans tabanlı mühendislik görevleri için tasarlanan ve otonom kodlama ajanı yetenekleriyle öne çıkan amiral gemisi GLM-5.1 yapay zeka modelini yayımladı. SWE-Bench Pro üzerinde sektör lideri performans gösteren GLM-5.1, NL2Repo ve Terminal-Bench 2.0 gibi gerçek dünya terminal görevlerinde de önceki sürümleri geride bırakıyor. Bu sistem, aynı zamanda açık kaynaklı yapay zeka ekosistemine yüksek kapasiteli bir kodlama aracı sunuyor.

Mimari Verimlilik Ve Hız

GLM-5.1'in temelinde, eğitim ve çıkarım maliyetlerini azaltırken uzun bağlam sadakatini koruyan DSA (Deep Sequential Attention) teknolojisi yer alıyor. Sistem, DSA ile birleştirilmiş bir Uzman Karışımı (MoE) mimarisi kullanıyor. MoE modelleri her ileri geçişte parametrelerinin yalnızca bir alt kümesini etkinleştirerek çıkarım sürecini ciddi oranda hızlandırıyor.

Eğitim tarafında ise model, üretim süreçlerini eğitimden ayırarak eğitim sonrası verimliliği artıran yeni bir eşzamansız pekiştirmeli öğrenme altyapısı uyguluyor. Bu yapı, veri işleme hızını doğrudan etkiliyor.

Ajans Modellerinde Plato Sorununa Çözüm

Modeli farklı kılan en önemli özelliklerden biri, büyük dil modellerindeki birincil başarısızlık noktası olan plato sorununu aşmasıdır. Önceki sistemler, hızlı başlangıç kazanımları için bilinen teknikleri uyguladıktan sonra belli bir aşamada durma eğilimi gösteriyordu. Bu durum, LLM'leri kodlama ajanı olarak kullanan geliştiriciler için yapısal bir sınırlama yaratıyordu.

GLM-5.1, belirsiz sorunları daha iyi muhakeme yeteneğiyle ele alarak uzun oturumlarda üretkenliğini koruyor. Karmaşık problemleri parçalara ayırarak, deneyler yaparak ve engelleri hassasiyetle tanımlayarak binlerce araç çağrısı boyunca kesintisiz optimizasyon sağlıyor.

Kıyaslama Testlerinde Lider Performans

Model, SWE-Bench Pro üzerinde 58.4 puan alarak GPT-5.4, Claude Opus 4.6 ve Gemini 3.1 Pro'yu geride bırakıyor. Sistem ayrıca AIME 2026'da 95.3, lisansüstü düzey bilim muhakeme kıyaslaması olan GPQA-Diamond'da ise 86.2 puan elde ediyor. Ajans kıyaslamalarında ise CyberGym'de 68.7, BrowseComp'ta 68.0 ve MCP-Atlas'ta 71.8 puana ulaşıyor.

Akıl yürütme, kodlama, ajanlar ve araç kullanımını kapsayan 12 temsili kıyaslamada sistem, dengeli bir yetenek profili sergiliyor. Elde edilen metrikler, modelin tek bir alanda değil; gerçek dünya kodlaması ve karmaşık görev yürütme alanlarında eş zamanlı ilerlemeler kaydettiğini kanıtlıyor.

8 Saat Kesintisiz Otonom Yürütme

Sistemin en önemli mühendislik farkı, tek bir görev üzerinde 8 saate kadar otonom olarak çalışabilmesidir. Model; planlama, yürütme, test etme, düzeltme ve teslimat sürecinin tamamını insan müdahalesi olmadan bitirebiliyor. Geliştiriciler modele karmaşık bir hedef vererek tam bir deney-analiz-optimize et döngüsünü otonom şekilde devrediyor.

Örneğin GLM-5.1, 8 saat içinde sıfırdan eksiksiz bir Linux masaüstü ortamı oluşturabiliyor ve bir vektör veritabanı görevinde 178 tur otonom yineleme ile performansı 1.5 katına çıkarabiliyor. Sistem ayrıca bir CUDA çekirdeğini optimize ederek hızı 35.7 kata kadar yükseltiyor. Bu performans, insan mühendislerin günlerce sürecek manuel optimizasyon çalışmasını tek bir oturuma sığdırıyor.

Model Özellikleri Ve Dağıtım

HuggingFace üzerinde MIT lisansı ile yayımlanan 754 milyar parametreli model, 200K bağlam penceresi ve 128K maksimum çıktı jetonu desteği barındırıyor. Bu yüksek bellek kapasitesi, büyük kod tabanlarını veya uzun muhakeme zincirlerini işlemek için kullanılıyor. Sistem; düşünme modları, akışlı çıktı, fonksiyon çağırma ve bağlam önbellekleme özelliklerini doğal olarak destekliyor.

GLM-5.1'in uzun süreli otonom görev yürütme kapasitesi, çok aşamalı mühendislik projelerinin tamamen otomatik sistemlere devredilmesine olanak tanıyor. Problem çözme stratejilerini sürekli revize eden bu mimari, ekiplere kendi otonom yazılım fabrikalarını kurma altyapısı veriyor. Geliştiriciler, modeli SGLang gibi açık kaynaklı çerçeveler üzerinden sunucularına entegre ederek devasa kod tabanlarının hata ayıklama ve yeniden yazım süreçlerini insan gözetimi olmadan otomatize edebilir.