سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

6 ماه پیش
واکنش نتانیاهو به حمله استرالیا

واکنش نتانیاهو به حمله استرالیا

6 ماه پیش
حماس ترور فرمانده ارشد القسام را تایید کرد

حماس ترور فرمانده ارشد القسام را تایید کرد

6 ماه پیش
عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

6 ماه پیش
غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

6 ماه پیش
واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

6 ماه پیش
مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

6 ماه پیش
واکنش آمریکا به تیراندازی مرگبار در سیدنی

واکنش آمریکا به تیراندازی مرگبار در سیدنی

6 ماه پیش
رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

6 ماه پیش
ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

6 ماه پیش

Home » گذر از آزمون تورینگ؛ موفقیتی تاریخی برای GPT-4.5

گذر از آزمون تورینگ؛ موفقیتی تاریخی برای GPT-4.5

زمان انتشار: 5 می 2025 ساعت 13:31

دسته بندی: فناوری اطلاعات

شناسه خبر: 2820567

زمان مطالعه: 7 دقیقه

گذر از آزمون تورینگ؛ موفقیتی تاریخی برای GPT-4.5

گذر از آزمون تورینگ؛ موفقیتی تاریخی برای GPT-4.5

این مطالعه که در تاریخ ۳۱ مارس در پایگاه پیش‌چاپ arXiv منتشر شده (و هنوز مورد داوری همتا قرار نگرفته)، نشان می‌دهد که GPT-4.5 در آزمونی سه‌نفره توانسته در ۷۳ درصد مواقع انسان‌ها را قانع کند که یک انسان واقعی است.

پژوهشگران در این آزمایش، چند مدل مختلف هوش مصنوعی را با یکدیگر مقایسه کرده‌اند.
 
به گزارش سیلاد و به نقل از لایوساینس، پیش از این نیز گروهی دیگر از پژوهشگران ادعا کرده بودند که GPT-4 در آزمون دوطرفهٔ تورینگ موفق شده است؛ اما این نخستین‌بار است که یک مدل زبانی بزرگ (LLM) در نسخهٔ اصلی و پیچیده‌تر «بازی تقلید» که توسط آلن تورینگ طراحی شده بود، سربلند بیرون آمده است.
 
«آیا مدل‌های زبانی بزرگ از آزمون تورینگ عبور می‌کنند؟ ما فکر می‌کنیم شواهد این مطالعه بسیار قوی است. انسان‌ها در تشخیص تفاوت بین انسان واقعی و مدل‌های GPT-4.5 و LLaMa (با استفاده از پرامپت شخصیتی) عملکردی بهتر از حد تصادف نداشتند. حتی جالب‌تر آنکه GPT-4.5 بیشتر از انسان‌های واقعی به‌عنوان انسان شناسایی شده بود!»
 
این سخنان را «کامرون جونز» (پژوهشگر آزمایشگاه زبان و شناخت دانشگاه سن‌دیگو و از نویسندگان این تحقیق) در شبکهٔ اجتماعی X بیان کرده است.
 
گفتنی است در این مطالعه، مدل GPT-4.5 پیشتاز بوده، اما مدل LLaMa-3.1 متعلق به شرکت متا نیز در ۵۶ درصد مواقع توسط شرکت‌کنندگان به‌عنوان انسان تشخیص داده شده که از پیش‌بینی کلاسیک تورینگ مبنی بر موفقیت کمتر از ۷۰ درصد در پنج دقیقه پرسش‌وپاسخ فراتر رفته است.

 

گذر از آزمون تورینگ؛ موفقیتی تاریخی برای GPT-4.5

عبور از مرزهای تقلید
 آزمون تورینگ صرفاً به دنبال اثبات توانایی تفکر ماشین نیست، بلکه هدف اصلی آن سنجش توانایی ماشین در تقلید رفتاری انسان‌گونه است؛ به همین دلیل است که آن را «بازی تقلید» نیز می‌نامند.
 
در طرح اصلی تورینگ، یک انسان به‌عنوان بازجو، با دو موجود ناشناس وارد گفت‌وگو می‌شود: یکی انسان و دیگری ماشین. بازجو با طرح پرسش‌هایی تلاش می‌کند تشخیص دهد کدام‌یک انسان است. اگر ماشین بتواند به‌گونه‌ای پاسخ دهد که بازجو را فریب دهد، آزمون را با موفقیت پشت‌ سر گذاشته است.
 
مدل‌های زبانی در گذشته توانسته بودند در سناریوی دونفره، بازجو را فریب دهند؛ اما در حالت سه‌نفره که شامل یک انسان، یک مدل زبانی و یک بازجو است، موفقیت چشمگیری نداشتند — تا اینکه پژوهشگران دانشگاه سن‌دیگو وارد میدان شدند.
 
آن‌ها ۱۲۶ دانشجوی دورهٔ کارشناسی و ۱۵۸ فرد دیگر را از پلتفرم آنلاین Prolific انتخاب کردند و در قالب گفت‌وگوهای سه‌نفره پنج‌دقیقه‌ای، مورد آزمایش قرار دادند. مدل‌ها موظف بودند انسان بودن خود را القا کنند. پرامپت اولیه به مدل چنین بود: «در آستانهٔ شرکت در آزمون تورینگ هستی. هدف تو این است که بازجو را قانع کنی که انسان هستی.»
 
در گام دوم، پرامپت شخصیتی نیز به آن‌ها داده شد: شخصی درون‌گرا، آشنا با فرهنگ اینترنت، و دارای سبک گفتاری همراه با اصطلاحات عامیانه. نتایج نشان داد مدل‌هایی که هر دو پرامپت را دریافت کرده بودند، موفق‌تر عمل کردند.
 
تحلیل بیش از ۱٬۰۲۳ بازی با میانگین هشت پیام و مدت زمان ۴.۲ دقیقه نشان داد که استفاده از شخصیت‌پردازی تأثیر بسزایی در موفقیت مدل‌ها داشته است. در مقابل، مدل‌هایی که صرفاً پرامپت پایه را داشتند، عملکرد ضعیف‌تری داشتند؛ که بر اهمیت طراحی دقیق پرامپت برای بهره‌گیری بهتر از مدل‌های زبانی تأکید دارد.
 
پژوهشگران می‌نویسند: «در نسخهٔ سه‌نفرهٔ آزمون، هر داده یک مقایسهٔ مستقیم بین انسان و مدل است. مدل باید نه‌فقط انسان‌نما باشد، بلکه بیش از انسانِ واقعی انسانی به نظر برسد.»
 
وقتی از شرکت‌کنندگان پرسیده شد چرا یک پاسخ‌دهنده را انسان یا هوش مصنوعی تشخیص داده‌اند، بسیاری به سبک زبانی، روانی گفت‌وگو و عوامل احساسی مانند شخصیت اشاره کردند — نه دانش یا استدلال منطقی. در واقع، تصمیم‌گیری‌ها بیشتر براساس «حس» کلی از گفت‌وگو بوده تا تحلیل منطقی پاسخ‌ها.

برچسب ها
آزمون تورینگ
اشتراک گذاری

اخبار مرتبط

  • آفرود بدون بنزین؛ رنج‌روور الکتریک با معماری ۸۰۰ ولتی در راه است
    آفرود بدون بنزین؛ رنج‌روور الکتریک با معماری ۸۰۰ ولتی در راه است 5 ساعت پیش
  • پایان دردسر ارسال فایل در خانواده؟ قابلیت جدید Quick Share افشا شد
    پایان دردسر ارسال فایل در خانواده؟ قابلیت جدید Quick Share افشا شد 5 ساعت پیش
  • ترفندهای مخفی کوپایلوت برای افزایش بهره‌وری
    ترفندهای مخفی کوپایلوت برای افزایش بهره‌وری 5 ساعت پیش
  • پشت پرده درآمد میلیاردی خانواده ترامپ از ارزهای دیجیتال
    پشت پرده درآمد میلیاردی خانواده ترامپ از ارزهای دیجیتال 5 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 16314
  • اقتصاد 11908
  • بازار مالی 2471
  • بین الملل 14490
  • تبلیغات 31
  • جامعه 10132
  • دانش 7584
  • عمومی 1926
  • فناوری اطلاعات 7990
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1923
  • ورزش 23778

جدیدترین مقالات

  • قزوین میزبان نمایش ۱۰۰ اثر برگزیده جشنواره رضوی
    قزوین میزبان نمایش ۱۰۰ اثر برگزیده جشنواره رضوی 8 ساعت پیش
  • کارگاه «تجربه‌نگاری جنگ» در جهاددانشگاهی قزوین برگزار می‌شود
    کارگاه «تجربه‌نگاری جنگ» در جهاددانشگاهی قزوین برگزار می‌شود 8 ساعت پیش
  • آغاز طرح کنترل و آزمون‌ ترازوهای بازار قزوین
    آغاز طرح کنترل و آزمون‌ ترازوهای بازار قزوین 8 ساعت پیش
  • تحویل ۲۲۴واحد نهضت ملی مسکن مهرگان در استان قزوین تا یک ماه آینده
    تحویل ۲۲۴واحد نهضت ملی مسکن مهرگان در استان قزوین تا یک ماه آینده 8 ساعت پیش
  • بهسازی و آسفالت محور روستایی گلابان ۱ در شهرستان چگنی
    بهسازی و آسفالت محور روستایی گلابان ۱ در شهرستان چگنی 8 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار |  کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور