سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

5 ماه پیش
واکنش نتانیاهو به حمله استرالیا

واکنش نتانیاهو به حمله استرالیا

5 ماه پیش
حماس ترور فرمانده ارشد القسام را تایید کرد

حماس ترور فرمانده ارشد القسام را تایید کرد

5 ماه پیش
عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

5 ماه پیش
غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

5 ماه پیش
واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

5 ماه پیش
مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

5 ماه پیش
واکنش آمریکا به تیراندازی مرگبار در سیدنی

واکنش آمریکا به تیراندازی مرگبار در سیدنی

5 ماه پیش
رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

5 ماه پیش
ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

5 ماه پیش

Home » هوش مصنوعی و چالش‌های مبتدیانه: ناتوانی در خواندن ساعت و تقویم

هوش مصنوعی و چالش‌های مبتدیانه: ناتوانی در خواندن ساعت و تقویم

زمان انتشار: 26 مارس 2025 ساعت 13:32

دسته بندی: فناوری اطلاعات

شناسه خبر: 2808167

زمان مطالعه: 5 دقیقه

هوش مصنوعی و چالش‌های مبتدیانه: ناتوانی در خواندن ساعت و تقویم

هوش مصنوعی و چالش‌های مبتدیانه: ناتوانی در خواندن ساعت و تقویم

مطالعه‌ای جدید از دانشگاه ادینبرو نشان داده است که بسیاری از مدل‌های پیشرفته هوش مصنوعی مولد همچنان در انجام وظایف ساده‌ای مانند خواندن ساعت‌های آنالوگ و تفسیر تقویم‌ها دچار مشکل هستند.

به گزارش سیلاد و به نقل از تک‌اسپات، این تحقیق که بر روی مدل‌های مطرحی از جمله GPT-4o، جمینای 2.0، کلاود 3.5 Sonnet و لاما a 3.2-11B-Vision-Instruct انجام شده، نشان داد که این سیستم‌ها کمتر از ۲۵٪ مواقع زمان را به درستی تشخیص می‌دهند.

محققان این سیستم‌ها را با انواع مختلف ساعت‌ها آزمایش کردند؛ از جمله ساعت‌هایی با اعداد رومی، عقربه‌های ثانیه‌شمار و صفحه‌های رنگی. نتایج نشان داد که این مدل‌ها در خواندن ساعت‌هایی با اعداد رومی و عقربه‌های طراحی‌شده خاص دچار مشکل بیشتری هستند. حتی حذف عقربه ثانیه‌شمار نیز باعث بهبود عملکرد مدل‌ها نشد، که نشان می‌دهد مشکل اصلی در شناسایی زاویه عقربه‌ها و تفسیر کلی صفحه ساعت است.

در بخش دوم تحقیق، این مدل‌ها با تصاویر ۱۰ سال از تقویم‌ها آزمایش شدند. محققان سوالاتی مانند «روز اول سال نو چه روزی از هفته است؟» و «۱۵۳مین روز سال چه روزی است؟» مطرح کردند. حتی بهترین مدل‌ها نیز ۲۰٪ مواقع پاسخ‌های اشتباه ارائه دادند. در این میان، Gemini 2.0 در تست ساعت‌ها عملکرد بهتری داشت، درحالی‌که GPT-01 در پاسخ‌های تقویمی ۸۰٪ موفقیت داشت.
 

هوش مصنوعی و چالش‌های مبتدیانه: ناتوانی در خواندن ساعت و تقویم
روهیت ساکسنا، نویسنده ارشد این مطالعه، معتقد است که این یافته‌ها نشان‌دهنده ضعف هوش مصنوعی در انجام وظایف ساده‌ای است که برای انسان‌ها کاملاً بدیهی هستند. او تأکید کرد که این مشکلات باید برطرف شوند تا سیستم‌های هوش مصنوعی بتوانند در کاربردهای حساس به زمان مانند برنامه‌ریزی و فناوری‌های کمکی به کار گرفته شوند. آریو گما، دیگر محقق این پروژه، نیز بیان کرد که تحقیقات هوش مصنوعی امروزه بر وظایف استدلالی پیچیده تمرکز دارد، اما هنوز بسیاری از سیستم‌ها در انجام کارهای روزمره و ساده ناتوان هستند.

این پژوهش در یک مقاله علمی بررسی‌شده منتشر شده و در کارگاه استدلال و برنامه‌ریزی برای مدل‌های زبانی بزرگ در کنفرانس ICLR 2024 در سنگاپور ارائه خواهد شد.

جالب اینجاست که این تنها مطالعه اخیر در مورد ضعف‌های هوش مصنوعی نیست. بررسی Tow Center for Digital Journalism نشان داده است که ۸ موتور جستجوی هوش مصنوعی به‌طور متوسط ۶۰٪ مواقع پاسخ‌های نادرست می‌دهند. بدترین عملکرد مربوط به Grok-3 بود که ۹۴٪ مواقع خطا داشت.

برچسب ها
ChatGPT
اشتراک گذاری

اخبار مرتبط

  • سفر دو ساعته از ژاپن به آمریکا: پایان عصر پروازهای ۱۰ ساعته؟
    سفر دو ساعته از ژاپن به آمریکا: پایان عصر پروازهای ۱۰ ساعته؟ 20 ساعت پیش
  • وقتی غول تبلیغات، سازنده محتوا می‌شود: داستان اپ‌لاوین و گیست
    وقتی غول تبلیغات، سازنده محتوا می‌شود: داستان اپ‌لاوین و گیست 20 ساعت پیش
  • گام اول بازگشت اینترنت
    گام اول بازگشت اینترنت 20 ساعت پیش
  • خداحافظی مایکروسافت با پیامک‌های تأیید؛ گامی علیه کلاهبرداری سایبری
    خداحافظی مایکروسافت با پیامک‌های تأیید؛ گامی علیه کلاهبرداری سایبری 20 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 15657
  • اقتصاد 11559
  • بازار مالی 2388
  • بین الملل 14490
  • تبلیغات 31
  • جامعه 10132
  • دانش 7584
  • عمومی 1926
  • فناوری اطلاعات 7893
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1767
  • ورزش 23778

جدیدترین مقالات

  • کمک ۳۰۰ میلیاردی وزارت ورزش به فدراسیون فوتبال
    کمک ۳۰۰ میلیاردی وزارت ورزش به فدراسیون فوتبال 10 ساعت پیش
  • ساماندهی پسماند آمل باید به نتیجه نهایی برسد
    ساماندهی پسماند آمل باید به نتیجه نهایی برسد 10 ساعت پیش
  • پایان نبرد شبانه با حادثه در خط انتقال آب چالوس
    پایان نبرد شبانه با حادثه در خط انتقال آب چالوس 10 ساعت پیش
  • توافق 100 مگاواتی دانشگاه علوم پزشکی استان سمنان با بخش خصوصی
    توافق 100 مگاواتی دانشگاه علوم پزشکی استان سمنان با بخش خصوصی 10 ساعت پیش
  • ترافیک سنگین در جاده‌های ورودی استان مازندران
    ترافیک سنگین در جاده‌های ورودی استان مازندران 10 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار |  کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور