AI Agentlərinin Peşəkar Tapşırıqlarda Sürətli İnkişafı

UX/UI
6-7 dəq. oxuma vaxtı
Paylaş:
     Keçən ay Mercor-un hüquq və korporativ analiz kimi peşəkar sahələrdə AI agentlərinin bacarıqlarını ölçən yeni göstəricisi haqqında yazmışdım. O vaxt nəticələr kifayət qədər zəif idi — bütün böyük laboratoriyalar 25%-dən aşağı nəticə göstərmişdi və buna görə hüquqşünasların hələlik AI tərəfindən əvəz olunmayacağı qənaətinə gəlmişdik.

     Lakin süni intellektin imkanları bir neçə həftə ərzində ciddi şəkildə dəyişə bilər.

     Bu həftə Anthropic şirkətinin Opus 4.6 modelinin təqdimatı reytinqləri dəyişdirdi. Yeni model bir cəhdlik testdə təxminən 30%-ə yaxın nəticə göstərdi, bir neçə əlavə cəhd imkanı verildikdə isə orta nəticə 45%-ə çatdı. Buraxılışa “agent swarms” kimi yeni agent əsaslı funksiyalar da daxil edilib ki, bu da çoxmərhələli problemlərin həllində effektivliyi artırmış ola bilər.

     Hər halda, bu nəticə əvvəlki ən yaxşı göstərici ilə müqayisədə böyük sıçrayışdır və əsas (foundation) modellər üzrə inkişafın davam etdiyini göstərir. Mercor-un CEO-su Brendan Foody bu irəliləyişi belə qiymətləndirib: “Bir neçə ay ərzində 18.4%-dən 29.8%-ə yüksəlmək inanılmazdır.”
Dərc edildi: 07.02.2026

Sənin üçün seçdiklərimiz

Microsoft oyun bölməsində AI siyasəti: Asha Sharma “pis AI”-ya dözümsüzdür
6-7 dəq. oxuma vaxtı
25.02.2026

Microsoft oyun bölməsində AI siyasəti: Asha Sharma “pis AI”-ya dözümsüzdür

   Keçən həftə Phil Spencer-in Microsoft-dan gözlənilməz istefası sonrası, Asha Sharma şirkətin oyun bölməsinin rəhbəri...

Microsoft-un Silinən Bloqu: Harry Potter Məlumatları və Süni İntellekt Mübahisəsi
6-7 dəq. oxuma vaxtı
20.02.2026

Microsoft-un Silinən Bloqu: Harry Potter Məlumatları və Süni İntellekt Mübahisəsi

     Hacker News platformasında yaranan tənqidlərdən sonra Microsoft tənqidçilərin fikrincə, tərtibatçıları Harry P...

OpenAI GPT-5.3-Codex-Spark modelini Cerebras çiplərində işə saldı
6-7 dəq. oxuma vaxtı
16.02.2026

OpenAI GPT-5.3-Codex-Spark modelini Cerebras çiplərində işə saldı

     Cümə axşamı OpenAI Nvidia avadanlığı olmadan işləyən ilk istehsal süni intellekt modelini təqdim etdi. Yeni GP...

Rəqəmsal Dövrdə Z Qurşağı və AI Reallığı
7-8 dəq
16.02.2026

Rəqəmsal Dövrdə Z Qurşağı və AI Reallığı

Süni İntellektin Z Qurşağına Təsiri Gəlin bir anlıq düşünək. Bugünkü uşaqlar niyə texnologiyanı bizdən daha rahat anlayır? Niyə o...

Ödənişsiz sınaq dərsinə qoşul!

Formu doldur, biz səninlə əlaqə saxlayaq və dərs üçün uyğun vaxtı təyin edək. Bu fürsəti qaçırma, təhsilə ilk addımını at!

+994