سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

5 ماه پیش
واکنش نتانیاهو به حمله استرالیا

واکنش نتانیاهو به حمله استرالیا

5 ماه پیش
حماس ترور فرمانده ارشد القسام را تایید کرد

حماس ترور فرمانده ارشد القسام را تایید کرد

5 ماه پیش
عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

5 ماه پیش
غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

5 ماه پیش
واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

5 ماه پیش
مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

5 ماه پیش
واکنش آمریکا به تیراندازی مرگبار در سیدنی

واکنش آمریکا به تیراندازی مرگبار در سیدنی

5 ماه پیش
رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

5 ماه پیش
ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

5 ماه پیش

Home » قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

زمان انتشار: 25 آوریل 2025 ساعت 13:30

دسته بندی: فناوری اطلاعات

شناسه خبر: 2817520

زمان مطالعه: 4 دقیقه

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

OpenAI اخیراً مدل‌های جدیدی از سری o3 و o4-mini را معرفی کرده که در زمینه استدلال، ریاضیات و کدنویسی عملکرد قابل توجهی دارند. با این حال، آزمایش‌های داخلی نشان می‌دهد که این مدل‌ها نسبت به نسخه‌های قبلی بیشتر دچار «توهم» می‌شوند؛ یعنی اطلاعات نادرست تولید می‌کنند.

به گزارش سیلاد و به نقل از تک‌کرانچ، در گذشته، هر نسل جدید از مدل‌های هوش مصنوعی معمولاً بهبودهایی در کاهش توهم داشت. اما در مدل‌های جدید OpenAI نه‌تنها این روند متوقف شده، بلکه وضعیت بدتر نیز شده است. برای مثال، مدل o3 در آزمون PersonQA، که دقت اطلاعات درباره افراد را می‌سنجد، در ۳۳٪ موارد پاسخ نادرست داده است؛ در حالی که مدل‌های o1 و o3-mini به ترتیب ۱۶٪ و ۱۴/۸٪ توهم داشتند. مدل o4-mini حتی عملکرد بدتری داشته و در ۴۸٪ موارد دچار خطا شده است.

OpenAI اذعان کرده که علت این افزایش هنوز مشخص نیست و نیاز به تحقیقات بیشتر دارد. تئوری این است که روش یادگیری تقویتی خاص در این مدل‌ها ممکن است مشکلاتی را تقویت کند که قبلاً با مراحل پایانی آموزش تا حدی کنترل می‌شدند.
 

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini
آزمایش‌های مستقل نیز این نتایج را تأیید می‌کنند. موسسه Transluce نشان داده که مدل o3 گاهی اقداماتی را ادعا می‌کند که اصلاً قادر به انجام آنها نیست، مانند اجرای کد روی لپ‌تاپ فیزیکی. همچنین، مدل در برخی موارد لینک‌هایی ارائه می‌دهد که وجود خارجی ندارند.

اگرچه برخی ویژگی‌های این مدل‌ها برای شرکت‌ها جذاب است، اما میزان بالای توهم، استفاده آنها را در حوزه‌هایی که به دقت بالا نیاز دارند — مانند حقوق یا سلامت — با مشکل روبه‌رو می‌کند. یکی از راه‌حل‌های پیشنهادی، افزودن توانایی جست‌وجو در وب است که می‌تواند به کاهش توهم کمک کند.

با تمرکز روزافزون صنعت هوش مصنوعی بر مدل‌های استدلالی، حل مشکل توهم به یک اولویت اساسی تبدیل شده است.

برچسب ها
هوش مصنوعی
اشتراک گذاری

اخبار مرتبط

  • سفر دو ساعته از ژاپن به آمریکا: پایان عصر پروازهای ۱۰ ساعته؟
    سفر دو ساعته از ژاپن به آمریکا: پایان عصر پروازهای ۱۰ ساعته؟ 20 ساعت پیش
  • وقتی غول تبلیغات، سازنده محتوا می‌شود: داستان اپ‌لاوین و گیست
    وقتی غول تبلیغات، سازنده محتوا می‌شود: داستان اپ‌لاوین و گیست 20 ساعت پیش
  • گام اول بازگشت اینترنت
    گام اول بازگشت اینترنت 20 ساعت پیش
  • خداحافظی مایکروسافت با پیامک‌های تأیید؛ گامی علیه کلاهبرداری سایبری
    خداحافظی مایکروسافت با پیامک‌های تأیید؛ گامی علیه کلاهبرداری سایبری 20 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 15657
  • اقتصاد 11559
  • بازار مالی 2388
  • بین الملل 14490
  • تبلیغات 31
  • جامعه 10132
  • دانش 7584
  • عمومی 1926
  • فناوری اطلاعات 7893
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1767
  • ورزش 23778

جدیدترین مقالات

  • کمک ۳۰۰ میلیاردی وزارت ورزش به فدراسیون فوتبال
    کمک ۳۰۰ میلیاردی وزارت ورزش به فدراسیون فوتبال 10 ساعت پیش
  • ساماندهی پسماند آمل باید به نتیجه نهایی برسد
    ساماندهی پسماند آمل باید به نتیجه نهایی برسد 10 ساعت پیش
  • پایان نبرد شبانه با حادثه در خط انتقال آب چالوس
    پایان نبرد شبانه با حادثه در خط انتقال آب چالوس 10 ساعت پیش
  • توافق 100 مگاواتی دانشگاه علوم پزشکی استان سمنان با بخش خصوصی
    توافق 100 مگاواتی دانشگاه علوم پزشکی استان سمنان با بخش خصوصی 10 ساعت پیش
  • ترافیک سنگین در جاده‌های ورودی استان مازندران
    ترافیک سنگین در جاده‌های ورودی استان مازندران 10 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار |  کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور