SkillsBench: Sun'iy intellekt agentlarining mahoratini baholashda yangi standart e'lon qilindi
ArXiv platformasida e'lon qilingan yangi tadqiqot AI agentlarining turli xil murakkab topshiriqlarni bajarish qobiliyatini tekshiruvchi "SkillsBench" benchmarkini taqdim etdi.





