سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

3 روز پیش
واکنش نتانیاهو به حمله استرالیا

واکنش نتانیاهو به حمله استرالیا

3 روز پیش
حماس ترور فرمانده ارشد القسام را تایید کرد

حماس ترور فرمانده ارشد القسام را تایید کرد

3 روز پیش
عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

3 روز پیش
غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

3 روز پیش
واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

3 روز پیش
مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

3 روز پیش
واکنش آمریکا به تیراندازی مرگبار در سیدنی

واکنش آمریکا به تیراندازی مرگبار در سیدنی

3 روز پیش
رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

3 روز پیش
ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

3 روز پیش

Home » قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

زمان انتشار: 25 آوریل 2025 ساعت 13:30

دسته بندی: فناوری اطلاعات

شناسه خبر: 2817520

زمان مطالعه: 4 دقیقه

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini

OpenAI اخیراً مدل‌های جدیدی از سری o3 و o4-mini را معرفی کرده که در زمینه استدلال، ریاضیات و کدنویسی عملکرد قابل توجهی دارند. با این حال، آزمایش‌های داخلی نشان می‌دهد که این مدل‌ها نسبت به نسخه‌های قبلی بیشتر دچار «توهم» می‌شوند؛ یعنی اطلاعات نادرست تولید می‌کنند.

به گزارش سیلاد و به نقل از تک‌کرانچ، در گذشته، هر نسل جدید از مدل‌های هوش مصنوعی معمولاً بهبودهایی در کاهش توهم داشت. اما در مدل‌های جدید OpenAI نه‌تنها این روند متوقف شده، بلکه وضعیت بدتر نیز شده است. برای مثال، مدل o3 در آزمون PersonQA، که دقت اطلاعات درباره افراد را می‌سنجد، در ۳۳٪ موارد پاسخ نادرست داده است؛ در حالی که مدل‌های o1 و o3-mini به ترتیب ۱۶٪ و ۱۴/۸٪ توهم داشتند. مدل o4-mini حتی عملکرد بدتری داشته و در ۴۸٪ موارد دچار خطا شده است.

OpenAI اذعان کرده که علت این افزایش هنوز مشخص نیست و نیاز به تحقیقات بیشتر دارد. تئوری این است که روش یادگیری تقویتی خاص در این مدل‌ها ممکن است مشکلاتی را تقویت کند که قبلاً با مراحل پایانی آموزش تا حدی کنترل می‌شدند.
 

قدرت بیشتر، دقت کمتر؟ چالش تازه مدل‌های o3 و o4-mini
آزمایش‌های مستقل نیز این نتایج را تأیید می‌کنند. موسسه Transluce نشان داده که مدل o3 گاهی اقداماتی را ادعا می‌کند که اصلاً قادر به انجام آنها نیست، مانند اجرای کد روی لپ‌تاپ فیزیکی. همچنین، مدل در برخی موارد لینک‌هایی ارائه می‌دهد که وجود خارجی ندارند.

اگرچه برخی ویژگی‌های این مدل‌ها برای شرکت‌ها جذاب است، اما میزان بالای توهم، استفاده آنها را در حوزه‌هایی که به دقت بالا نیاز دارند — مانند حقوق یا سلامت — با مشکل روبه‌رو می‌کند. یکی از راه‌حل‌های پیشنهادی، افزودن توانایی جست‌وجو در وب است که می‌تواند به کاهش توهم کمک کند.

با تمرکز روزافزون صنعت هوش مصنوعی بر مدل‌های استدلالی، حل مشکل توهم به یک اولویت اساسی تبدیل شده است.

برچسب ها
هوش مصنوعی
اشتراک گذاری

اخبار مرتبط

  • آمریکا بررسی پنج سال سابقه شبکه‌های اجتماعی مسافران خارجی را الزامی می‌کند
    آمریکا بررسی پنج سال سابقه شبکه‌های اجتماعی مسافران خارجی را الزامی می‌کند 22 ساعت پیش
  • پایان نظارت گوگل: ابزار رایگان رصد دارک وب بازنشسته می‌شود
    پایان نظارت گوگل: ابزار رایگان رصد دارک وب بازنشسته می‌شود 22 ساعت پیش
  • گوگل: دقت واقعی چت‌بات‌های هوش مصنوعی از ۷۰ درصد عبور نمی‌کند
    گوگل: دقت واقعی چت‌بات‌های هوش مصنوعی از ۷۰ درصد عبور نمی‌کند 22 ساعت پیش
  • جدیدترین قیمت رمزارزها
    جدیدترین قیمت رمزارزها 22 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 9771
  • اقتصاد 8026
  • بازار مالی 1765
  • بین الملل 14490
  • تبلیغات 29
  • جامعه 9361
  • دانش 6795
  • عمومی 1926
  • فناوری اطلاعات 7311
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1161
  • ورزش 21748

جدیدترین مقالات

  • پوریا محمدی و مرتضی صداقت؛ نمایندگان کراسفیت ایران در کویت چمپیونشیپ
    پوریا محمدی و مرتضی صداقت؛ نمایندگان کراسفیت ایران در کویت چمپیونشیپ 8 ساعت پیش
  • بازسازی آزادی؛ پروژه‌ای بزرگ با جیب کوچک!
    بازسازی آزادی؛ پروژه‌ای بزرگ با جیب کوچک! 8 ساعت پیش
  • حسرت بزرگ اسکوچیچ برابر پرسپولیس
    حسرت بزرگ اسکوچیچ برابر پرسپولیس 8 ساعت پیش
  • عکس| آبروریزی عجیب ستاره استقلال/ استوری که خیلی زود پاک شد
    عکس| آبروریزی عجیب ستاره استقلال/ استوری که خیلی زود پاک شد 8 ساعت پیش
  • سیدورف برای مدیران استقلال شرط گذاشت
    سیدورف برای مدیران استقلال شرط گذاشت 8 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار |  کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور