في كل يوم أحد، يجذب برنامج “لغز الأحد” الذي تبثه إذاعة NPR آلاف المستمعين لحل تحديات عقلية صعبة، ويبدو أن هذه الألغاز لم تعد مخصصة للبشر فقط، بل أصبحت معيارًا جديدًا لاختبار قدرات الذكاء الاصطناعي.
ففي دراسة حديثة، استخدم باحثون من عدة جامعات أميركية، بالتعاون مع شركة Cursor الناشئة، ألغاز البرنامج لمعايرة أداء نماذج الذكاء الاصطناعي في الاستدلال المنطقي.
النتائج كانت مفاجئة، إذ أظهرت أن بعض النماذج المتقدمة،