برترین عناوین خبری

خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

7 ماه پیش

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

7 ماه پیش

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

7 ماه پیش

واکنش آمریکا به تیراندازی مرگبار در سیدنی

7 ماه پیش

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

7 ماه پیش

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

7 ماه پیش

حتی جی‌پی‌تی‑۵ در آزمون توجه انسانی مردود شد؛ نقطه کور هوش مصنوعی

زمان انتشار: 30 ژوئن 2026 ساعت 12:06

دسته بندی: فناوری اطلاعات

شناسه خبر: 2969270

زمان مطالعه: 4 دقیقه

حتی جی‌پی‌تی‑۵ در آزمون توجه انسانی مردود شد؛ نقطه کور هوش مصنوعی

یک آزمون کلاسیک روانشناسی، نقطه ضعف شگفت‌آوری را در برخی از پیشرفته‌ترین سامانه‌های هوش مصنوعی امروزی آشکار ساخته است که نشان می‌دهد نحوه توجه در هوش مصنوعی ممکن است به طور اساسی با توجه انسانی متفاوت باشد.

به گزارش سیلاد و به نقل از SciTechDaily، پژوهشگران چگونگی عملکرد مدل‌های زبانی بزرگ را در مواجهه با چالش شناختی معروفی به نام «تکلیف استروپ» مورد بررسی قرار دادند.

گفتنی است تکلیف استروپ، یک آزمایش روانشناسی کلاسیک است که دهه‌ها برای مطالعه توجه و کنترل ذهنی استفاده می‌شود.

در این آزمون، به شرکت‌کنندگان کلماتی که نام رنگ‌ها را نشان می‌دهند، در جوهر رنگی نمایش داده می‌شود. گاهی کلمه و رنگ جوهر با هم مطابقت دارند و گاهی در تضاد هستند و از شرکت‌کننده خواسته می‌شود رنگ جوهر را نادیده بگیرد و کلمه را شناسایی کند.

انسان‌ها معمولاً کمی زمان بیشتری برای پاسخ‌دهی در موارد ناهماهنگ نیاز دارند، اما حتی زمانی که کار طولانی می‌شود، دقت بالایی را حفظ می‌کنند.

برای بررسی عملکرد سامانه‌های هوش مصنوعی مدرن، پژوهشگران چندین مدل زبانی پیشرو را با فهرست‌هایی از کلمات رنگی آزمایش کردند.

زمانی که فهرست‌های کوتاه ارائه شد، مدل‌ها عملکرد شگفت‌آوری خوبی داشتند؛ جی‌پی‌تی‑۴او به دقت ۹۱ درصد و کلود ۳٫۵ سونت نیز عملکرد قوی نشان داد.

با افزایش طول فهرست‌ها، وضعیت به شدت تغییر کرد. دقت جی‌پی‌تی‑۴او از ۹۱ درصد برای پنج کلمه به ۵۷ درصد برای ده کلمه کاهش یافت و با رسیدن فهرست به ۴۰ کلمه، دقت به تنها ۱۵ درصد سقوط کرد.

کلود ۳٫۵ سونت مقاومت بیشتری نشان داد، اما آن نیز با کاهش شدید مواجه شد و دقت آن به ۲۴ درصد رسید.

پژوهشگران الگوهای مشابهی را در جی‌پی‌تی‑۵، کلود اپوس ۴٫۱ و جمینی ۲٫۵ مشاهده کردند. عملکرد زمانی بدتر شد که کلمات هماهنگ و ناهماهنگ با هم در یک فهرست ظاهر شدند و دقت در موارد ناهماهنگ به نزدیک صفر رسید.

اخبار مرتبط

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

لینکهای پیشنهادی

فاماسرور | دانلود رایگان نرم افزار | کلاس آنلاین

سرتیتر خبرها

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

واکنش نتانیاهو به حمله استرالیا

حماس ترور فرمانده ارشد القسام را تایید کرد

عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

واکنش آمریکا به تیراندازی مرگبار در سیدنی

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

حتی جی‌پی‌تی‑۵ در آزمون توجه انسانی مردود شد؛ نقطه کور هوش مصنوعی

اخبار مرتبط

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

لینکهای پیشنهادی