İçeriğe geç

Tenyx’in Llama-3 benzeri yapay zeka dil modeli

AI startup Tenyx, Meta’nın açık kaynaklı Llama-3 dil modelini, OpenAI’nin GPT-4’ünü bazı alanlarda geçecek şekilde başarıyla optimize ettiğini duyurdu. Tenyx’in kurucusu ve CEO’su Itamar Arel, bu başarının, bir açık kaynak modelinin ilk kez özel bir standart olan GPT-4’ü geçtiği anlamına geldiğini belirtti. Arel, modelin üzerine inşa edildiği temel özelliklerin ötesinde eğitilmesine olanak tanıyan bir teknoloji geliştirdiklerini ifade etti. Modelin büyük modellerdeki bazı fazlalıkları kullanarak sürekli veya artımsal öğrenmeyi mümkün kıldığı açıklandı.

70 milyar parametreli Llama-3 modelini, 100 GPU kullanarak yalnızca 15 saatte ince ayar yapma yeteneğine sahipler. Tenyx tarafından geliştirilen bu model, matematik ve kodlama görevlerinde GPT-4’ü geçmeyi başardı ve tüm yeteneklerde temel Llama 3 modelini de geride bıraktı.

Tenyx, bu ince ayarlı modeli orijinal Llama-3 ile aynı lisans altında Tenyx-70B adıyla yayınlama kararı aldı. Arel, açık kaynak modellere olan inançlarını ve toplulukla paylaşılan ilerlemelerin herkes için daha iyi sonuçlar doğuracağını vurguladı.

Son Yapay Zeka Haberleri