Türkiye'de LLM Benchmark Sistemi ve Değerlendirme Standartları - JUDEX LANSMAN

Türkiye’de yapay zeka ekosistemi hızla büyüyor. Ama hâlâ çok kritik bir problem var: modelleri gerçekten nasıl değerlendireceğimizi bilmiyoruz. Doğru çalışan model neye göre belirleniyor? Türkçe performansı nasıl ölçülüyor? Hallucination, güvenilirlik, tutarlılık ve benchmark standartları nasıl oluşturuluyor? LLM Turkey Hareketi kapsamında gerçekleştireceğimiz bu lansman etkinliğinde, Türkiye’de geliştirilen LLM benchmark sistemi JUDEX’i ilk kez detaylı şekilde konuşacağız. Bu etkinlikte: • LLM benchmark mantığını • Değerlendirme standartlarını • Gerçek kullanım senaryolarını • Türkiye’de neden bağımsız AI evaluation sistemlerine ihtiyaç olduğunu • Topluluk odaklı bir AI kalite ekosisteminin nasıl kurulacağını ele alacağız. Ayrıca LLM Turkey hareketinin vizyonunu, neden ortaya çıktığını ve bu yapının içinde nasıl yer alınabileceğini paylaşacağız. Konuşmacılar: • Yasemin Arslan • Buse Mağden • Atıl Samancıoğlu • Çağla Öztürk 📅 21 Mayıs 2025 🕗 20:00 📍 Online — Google Meet Bu sadece bir etkinlik değil. Türkiye’de yapay zeka değerlendirme standartlarını birlikte inşa etmek isteyen insanların ilk buluşmalarından biri. LLM Turkey Hareketi’ne siz de katılın.