سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری

سرتیتر خبرها

المیادین: جنگ علیه ایران… قماری که شکست‌ خورد

المیادین: جنگ علیه ایران… قماری که شکست‌ خورد

9 ساعت پیش
کابل: هر حمله خارجی پاسخی درس‌آموز در پی خواهد داشت

کابل: هر حمله خارجی پاسخی درس‌آموز در پی خواهد داشت

9 ساعت پیش
دستور نتانیاهو برای حملات شدید و فوری به نوار غزه

دستور نتانیاهو برای حملات شدید و فوری به نوار غزه

9 ساعت پیش

ببینید | ساسان کریمی: اینکه بگوییم با ترامپ هیچکاری نمی‌شود کرد، بدترین ایده است

9 ساعت پیش
تاکید ایران بر پایان محاصره بدون قید و شرط کوبا

تاکید ایران بر پایان محاصره بدون قید و شرط کوبا

9 ساعت پیش
عضو حماس: پنهان کردن اجساد اسرای صهیونیست سودی برای مقاومت ندارد

عضو حماس: پنهان کردن اجساد اسرای صهیونیست سودی برای مقاومت ندارد

9 ساعت پیش
همسر مکرون و حاشیه‌های جنسیت او

همسر مکرون و حاشیه‌های جنسیت او

9 ساعت پیش
نتانیاهو آمریکا را در جریان تجاوز به غزه قرار داد

نتانیاهو آمریکا را در جریان تجاوز به غزه قرار داد

9 ساعت پیش
مقام آمریکایی: حماس توافق را نقض نکرده است

مقام آمریکایی: حماس توافق را نقض نکرده است

9 ساعت پیش
رئیس‌جمهور کلمبیا: آمریکا با حملاتش مردم را ترور می‌کند

رئیس‌جمهور کلمبیا: آمریکا با حملاتش مردم را ترور می‌کند

9 ساعت پیش

Home » قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

زمان انتشار: 25 آوریل 2025 ساعت 13:30

دسته بندی: فناوری اطلاعات

شناسه خبر: 2817520

زمان مطالعه: 4 دقیقه

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

OpenAI اخیراً مدل‌های جدیدی از سری o3 و o4-mini را معرفی کرده که در زمینه استدلال، ریاضیات و کدنویسی عملکرد قابل توجهی دارند. با این حال، آزمایش‌های داخلی نشان می‌دهد که این مدل‌ها نسبت به نسخه‌های قبلی بیشتر دچار «توهم» می‌شوند؛ یعنی اطلاعات نادرست تولید می‌کنند.

به گزارش سیلاد و به نقل از تک‌کرانچ، در گذشته، هر نسل جدید از مدل‌های هوش مصنوعی معمولاً بهبودهایی در کاهش توهم داشت. اما در مدل‌های جدید OpenAI نه‌تنها این روند متوقف شده، بلکه وضعیت بدتر نیز شده است. برای مثال، مدل o3 در آزمون PersonQA، که دقت اطلاعات درباره افراد را می‌سنجد، در ۳۳٪ موارد پاسخ نادرست داده است؛ در حالی که مدل‌های o1 و o3-mini به ترتیب ۱۶٪ و ۱۴/۸٪ توهم داشتند. مدل o4-mini حتی عملکرد بدتری داشته و در ۴۸٪ موارد دچار خطا شده است.

OpenAI اذعان کرده که علت این افزایش هنوز مشخص نیست و نیاز به تحقیقات بیشتر دارد. تئوری این است که روش یادگیری تقویتی خاص در این مدل‌ها ممکن است مشکلاتی را تقویت کند که قبلاً با مراحل پایانی آموزش تا حدی کنترل می‌شدند.
 

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini
آزمایش‌های مستقل نیز این نتایج را تأیید می‌کنند. موسسه Transluce نشان داده که مدل o3 گاهی اقداماتی را ادعا می‌کند که اصلاً قادر به انجام آنها نیست، مانند اجرای کد روی لپ‌تاپ فیزیکی. همچنین، مدل در برخی موارد لینک‌هایی ارائه می‌دهد که وجود خارجی ندارند.

اگرچه برخی ویژگی‌های این مدل‌ها برای شرکت‌ها جذاب است، اما میزان بالای توهم، استفاده آنها را در حوزه‌هایی که به دقت بالا نیاز دارند — مانند حقوق یا سلامت — با مشکل روبه‌رو می‌کند. یکی از راه‌حل‌های پیشنهادی، افزودن توانایی جست‌وجو در وب است که می‌تواند به کاهش توهم کمک کند.

با تمرکز روزافزون صنعت هوش مصنوعی بر مدل‌های استدلالی، حل مشکل توهم به یک اولویت اساسی تبدیل شده است.

برچسب ها
هوش مصنوعی
اشتراک گذاری

اخبار مرتبط

  • اپل زیر فشار اروپا؛ احتمال خاموشی App Tracking Transparency در قاره سبز
    اپل زیر فشار اروپا؛ احتمال خاموشی App Tracking Transparency در قاره سبز 10 ساعت پیش
  • جدیدترین قیمت رمزارزها
    جدیدترین قیمت رمزارزها 10 ساعت پیش
  • تراشه «مغز مایکروویو» کرنل، انقلابی در محاسبات و هوش مصنوعی
    تراشه «مغز مایکروویو» کرنل، انقلابی در محاسبات و هوش مصنوعی 10 ساعت پیش
  • رمزگشایی از یک نقل‌قول جنجالی: هشدار بیل گیتس را جدی بگیریم؟
    رمزگشایی از یک نقل‌قول جنجالی: هشدار بیل گیتس را جدی بگیریم؟ 10 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 7469
  • اقتصاد 6762
  • بازار مالی 1491
  • بین الملل 12970
  • تبلیغات 27
  • جامعه 7753
  • دانش 5594
  • عمومی 1926
  • فناوری اطلاعات 6857
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1026
  • ورزش 19344

جدیدترین مقالات

  • وزیر ورزش تعیین کرد؛ برگزاری دربی در مشهد یا شیراز
    وزیر ورزش تعیین کرد؛ برگزاری دربی در مشهد یا شیراز 5 ساعت پیش
  • عکس| ماشین لوکس بسکتبالیست معروف را دزد برد!
    عکس| ماشین لوکس بسکتبالیست معروف را دزد برد! 5 ساعت پیش
  • فوتبالی‌ها و دیداری دیگر با رییس جمهور
    فوتبالی‌ها و دیداری دیگر با رییس جمهور 5 ساعت پیش
  • پایان طلسم 10 ساله تکواندوی ایران در دنیا با طلای زندی
    پایان طلسم 10 ساله تکواندوی ایران در دنیا با طلای زندی 5 ساعت پیش
  • وخامت حال صابر کاظمی؛ همه در انتظار معجزه
    وخامت حال صابر کاظمی؛ همه در انتظار معجزه 5 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار | تجهیزات آزمایشگاهی | کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور