سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

2 روز پیش
واکنش نتانیاهو به حمله استرالیا

واکنش نتانیاهو به حمله استرالیا

2 روز پیش
حماس ترور فرمانده ارشد القسام را تایید کرد

حماس ترور فرمانده ارشد القسام را تایید کرد

2 روز پیش
عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

2 روز پیش
غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

2 روز پیش
واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

2 روز پیش
مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

2 روز پیش
واکنش آمریکا به تیراندازی مرگبار در سیدنی

واکنش آمریکا به تیراندازی مرگبار در سیدنی

2 روز پیش
رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

2 روز پیش
ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

2 روز پیش

Home » گوگل: دقت واقعی چت‌بات‌های هوش مصنوعی از ۷۰ درصد عبور نمی‌کند

گوگل: دقت واقعی چت‌بات‌های هوش مصنوعی از ۷۰ درصد عبور نمی‌کند

زمان انتشار: 17 دسامبر 2025 ساعت 11:09

دسته بندی: فناوری اطلاعات

شناسه خبر: 2906477

زمان مطالعه: 7 دقیقه

گوگل: دقت واقعی چت‌بات‌های هوش مصنوعی از ۷۰ درصد عبور نمی‌کند

گوگل: دقت واقعی چت‌بات‌های هوش مصنوعی از ۷۰ درصد عبور نمی‌کند

گوگل در ارزیابی تازه‌ای به این جمع‌بندی رسیده است که چت‌بات‌های هوش مصنوعی، حتی در بهترین حالت، تنها به حدود ۶۹ درصد دقت دست پیدا می‌کنند.

این شرکت با انتشار گزارشی صریح درباره میزان قابل‌اعتماد بودن چت‌بات‌های هوش مصنوعی فعلی، تصویری نه‌چندان امیدوارکننده ارائه داده است. بر اساس نتایج به‌دست‌آمده از مجموعه معیارهای جدید FACTS، حتی پیشرفته‌ترین مدل‌های هوش مصنوعی نیز برای عبور از آستانه دقت واقعی ۷۰ درصد با دشواری مواجه‌ هستند.

در این میان، Gemini 3 Pro به‌عنوان دقیق‌ترین مدل بررسی‌شده، موفق به ثبت دقت کلی ۶۹ درصدی شده است. سایر مدل‌های پیشرو متعلق به شرکت‌هایی مانند OpenAI، Anthropic و xAI نیز عملکرد ضعیف‌تری از خود نشان داده‌اند. جمع‌بندی این یافته‌ها ساده اما نگران‌کننده است: این چت‌بات‌ها، حتی زمانی که پاسخ‌های خود را با اطمینان ارائه می‌کنند، به‌طور میانگین از هر سه پاسخ، یکی نادرست است.

به گزارش سیلاد و به نقل از Digitaltrends، اهمیت این معیار از آن‌جا ناشی می‌شود که بسیاری از آزمون‌های رایج هوش مصنوعی، بیشتر بر توانایی انجام یک وظیفه تمرکز دارند تا صحت واقعی اطلاعات تولیدشده. این شکاف، به‌ویژه در حوزه‌هایی مانند امور مالی، مراقبت‌های بهداشتی و خدمات حقوقی، می‌تواند پیامدهای پرهزینه‌ای به همراه داشته باشد. پاسخ‌هایی که روان و قانع‌کننده به نظر می‌رسند اما حاوی خطا هستند، در شرایطی که کاربران به درستی اطلاعات اعتماد می‌کنند، می‌توانند خسارت‌های جدی ایجاد کنند.
 

آزمون دقت گوگل چه چیزی را نشان می‌دهد؟

مجموعه بنچمارک FACTS توسط تیم FACTS گوگل و با همکاری پلتفرم Kaggle طراحی شده است تا دقت واقعی مدل‌های هوش مصنوعی را در چهار سناریوی کاربردی دنیای واقعی به‌طور مستقیم ارزیابی کند.

در یکی از این آزمون‌ها، «دانش پارامتری» سنجیده می‌شود؛ یعنی بررسی می‌شود که آیا مدل می‌تواند صرفاً بر اساس دانسته‌های آموخته‌شده در زمان آموزش، به پرسش‌های مبتنی بر واقعیت پاسخ دهد یا خیر.
 

گوگل: دقت واقعی چت‌بات‌های هوش مصنوعی از ۷۰ درصد عبور نمی‌کند

آزمون دوم، عملکرد جست‌وجو را مورد ارزیابی قرار می‌دهد و میزان توانایی مدل‌ها در استفاده از ابزارهای وب برای بازیابی اطلاعات دقیق را می‌سنجد. آزمون سوم بر «پایبندی به منبع» تمرکز دارد؛ به این معنا که آیا مدل بدون افزودن جزئیات نادرست، به سند ارائه‌شده وفادار می‌ماند یا خیر. آزمون چهارم نیز به درک چندوجهی اختصاص دارد و توانایی مدل‌ها در تفسیر صحیح نمودارها، دیاگرام‌ها و تصاویر را بررسی می‌کند.

نتایج به‌دست‌آمده، اختلاف قابل‌توجهی میان مدل‌ها را نشان می‌دهد. Gemini 3 Pro با امتیاز ۶۹ درصد در صدر جدول FACTS قرار گرفته و پس از آن، Gemini 2.5 Pro و ChatGPT-5 از OpenAI با حدود ۶۲ درصد جایگاه‌های بعدی را به خود اختصاص داده‌اند.

مدل Claude 4.5 Opus با نزدیک به ۵۱ درصد و Grok 4 با حدود ۵۴ درصد در رتبه‌های پایین‌تر قرار دارند. در این میان، وظایف چندوجهی ضعیف‌ترین عملکرد را در کل جدول به ثبت رسانده‌اند و دقت آن‌ها در بسیاری موارد به کمتر از ۵۰ درصد رسیده است.

این موضوع از آن جهت حائز اهمیت است که چنین وظایفی شامل تفسیر نمودارها، دیاگرام‌ها و تصاویر می‌شوند؛ حوزه‌هایی که در آن‌ها یک چت‌بات ممکن است با اطمینان کامل، نمودار فروش را اشتباه بخواند یا عدد نادرستی را از یک سند استخراج کند و در نهایت، خطاهایی ایجاد شود که تشخیص آن‌ها دشوار اما جبرانشان پرهزینه است.

در نهایت، پیام اصلی این گزارش آن نیست که چت‌بات‌های هوش مصنوعی ابزارهایی بی‌فایده هستند، بلکه تأکید بر این نکته است که اعتماد بی‌چون‌وچرا به آن‌ها می‌تواند خطرناک باشد. داده‌های منتشرشده از سوی گوگل نشان می‌دهد که هرچند هوش مصنوعی در مسیر پیشرفت قرار دارد، اما همچنان پیش از آن‌که بتوان آن را به‌عنوان منبعی قابل‌اتکا برای حقیقت در نظر گرفت، به تأیید، نظارت و مداخله انسانی نیازمند است.

برچسب ها
چت‌بات
اشتراک گذاری

اخبار مرتبط

  • آمریکا بررسی پنج سال سابقه شبکه‌های اجتماعی مسافران خارجی را الزامی می‌کند
    آمریکا بررسی پنج سال سابقه شبکه‌های اجتماعی مسافران خارجی را الزامی می‌کند 1 ساعت پیش
  • پایان نظارت گوگل: ابزار رایگان رصد دارک وب بازنشسته می‌شود
    پایان نظارت گوگل: ابزار رایگان رصد دارک وب بازنشسته می‌شود 1 ساعت پیش
  • جدیدترین قیمت رمزارزها
    جدیدترین قیمت رمزارزها 1 ساعت پیش
  • چرا گلکسی S26 Ultra می‌تواند بهترین گوشی اندرویدی 2026 باشد
    چرا گلکسی S26 Ultra می‌تواند بهترین گوشی اندرویدی 2026 باشد 1 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 9743
  • اقتصاد 8026
  • بازار مالی 1765
  • بین الملل 14490
  • تبلیغات 29
  • جامعه 9361
  • دانش 6795
  • عمومی 1926
  • فناوری اطلاعات 7311
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1161
  • ورزش 21722

جدیدترین مقالات

  • آسیب دیدگی ۲۵۰۰ کنتور آب لرستانی ها به دلیل یخ‌زدگی در سال گذشته
    آسیب دیدگی ۲۵۰۰ کنتور آب لرستانی ها به دلیل یخ‌زدگی در سال گذشته 4 ساعت پیش
  • کاهش ۲۴درصدی پرونده‌های خشونت در قزوین
    کاهش ۲۴درصدی پرونده‌های خشونت در قزوین 4 ساعت پیش
  • صدور بسته‌های سرمایه‌گذاری بی‌نام در قزوین آغاز شد
    صدور بسته‌های سرمایه‌گذاری بی‌نام در قزوین آغاز شد 4 ساعت پیش
  • استاندار گیلان:توسعه فرودگاه سردار جنگل رشت ضرورتی فراتر از نیاز استانی است
    استاندار گیلان:توسعه فرودگاه سردار جنگل رشت ضرورتی فراتر از نیاز استانی است 4 ساعت پیش
  • مدیرکل هواشناسی گیلان:هوای گیلان تا ۱۲ درجه سردتر می شود
    مدیرکل هواشناسی گیلان:هوای گیلان تا ۱۲ درجه سردتر می شود 4 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار |  کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور