سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

2 ماه پیش
واکنش نتانیاهو به حمله استرالیا

واکنش نتانیاهو به حمله استرالیا

2 ماه پیش
حماس ترور فرمانده ارشد القسام را تایید کرد

حماس ترور فرمانده ارشد القسام را تایید کرد

2 ماه پیش
عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

2 ماه پیش
غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

2 ماه پیش
واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

2 ماه پیش
مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

2 ماه پیش
واکنش آمریکا به تیراندازی مرگبار در سیدنی

واکنش آمریکا به تیراندازی مرگبار در سیدنی

2 ماه پیش
رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

2 ماه پیش
ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

2 ماه پیش

Home » صدای انسان‌گونه‌تر، ترجمه همزمان و تعامل واقعی‌تر؛ تحول تازه در نسخه صوتی ChatGPT

صدای انسان‌گونه‌تر، ترجمه همزمان و تعامل واقعی‌تر؛ تحول تازه در نسخه صوتی ChatGPT

زمان انتشار: 13 ژوئن 2025 ساعت 13:31

دسته بندی: فناوری اطلاعات

شناسه خبر: 2832022

زمان مطالعه: 7 دقیقه

صدای انسان‌گونه‌تر، ترجمه همزمان و تعامل واقعی‌تر؛ تحول تازه در نسخه صوتی ChatGPT

صدای انسان‌گونه‌تر، ترجمه همزمان و تعامل واقعی‌تر؛ تحول تازه در نسخه صوتی ChatGPT

شرکت OpenAI در تازه‌ترین به‌روزرسانی خود، قابلیت‌های صوتی دستیار هوشمند ChatGPT را به‌طور چشمگیری ارتقاء داده است؛ ارتقایی که نه‌تنها به طبیعی‌تر شدن صدا کمک می‌کند، بلکه امکان ترجمه همزمان مکالمات را نیز در اختیار کاربران قرار می‌دهد.
 
به گزارش سیلاد و به نقل از The Decoder، بر اساس اطلاعات رسمی منتشرشده از سوی OpenAI، نسخه جدید «حالت پیشرفته صوتی» (Advanced Voice Mode) اکنون توانایی بیشتری در بازتولید صداهایی با لحن طبیعی، حس همدلی، طعنه، مکث‌های انسانی و حتی بیان عاطفی دارد.

این یعنی ChatGPT می‌تواند مانند یک گوینده واقعی احساسات را در صدایش منعکس کند؛ چه در لحن دلسوزانه پاسخ دهد، چه با طعنه سخن بگوید.
 

ترجمه همزمان در لحظه، بدون توقف

 
یکی از مهم‌ترین ویژگی‌های افزوده‌شده در این نسخه، امکان «ترجمه همزمان گفت‌وگو» بین زبان‌های مختلف است. کاربران می‌توانند از ChatGPT بخواهند تا مکالمه‌ای میان دو زبان خاص را به‌صورت زنده ترجمه کند.
 
شرکتOpenAI پیشنهاد می‌کند که این ویژگی می‌تواند در موقعیت‌های عملی مانند سفارش غذا در رستورانی خارجی، جلسات کاری چندزبانه یا حتی مکالمه با یک گردشگر در خیابان، کارایی بالایی داشته باشد.
 

صدای انسان‌گونه‌تر، ترجمه همزمان و تعامل واقعی‌تر؛ تحول تازه در نسخه صوتی ChatGPT

گفتنی است شرکت‌هایی مانند گوگل نیز اخیراً ویژگی‌های مشابهی را در اپلیکیشن Gemini ارائه داده‌اند، اما OpenAI در تلاش است با تمرکز بر کیفیت صوت، تطابق عاطفی و تعامل طبیعی، تجربه‌ای متفاوت و کاربرمحورتر خلق کند.
 

مشکلاتی که هنوز پابرجا هستند

 
با وجود این پیشرفت‌ها، OpenAI صراحتاً اذعان می‌کند که هنوز برخی نقص‌ها در عملکرد صوتی این سیستم باقی مانده‌اند. یکی از این ایرادات، «افت کیفیت صدا» به‌صورت مقطعی است که ممکن است با تغییر ناگهانی زیر و بمی (pitch) یا شدت صدا (volume) همراه باشد. این مشکل در برخی از صداهای انتخابی کاربران بیشتر به چشم می‌آید.
 
مشکل دیگر، پدیده‌ای موسوم به «توهم صوتی» (audio hallucination) است—حالتی که در آن ChatGPT صداهایی تولید می‌کند که اصلاً از آن خواسته نشده‌اند. این صداها گاه به شکل نویزهای بی‌معنا، گاه قطعه‌ای از موسیقی پس‌زمینه، و حتی گاهی شبیه به تبلیغات رادیویی ظاهر می‌شوند.
 
در یکی از موارد گزارش‌شده توسط کاربران، ChatGPT در میانه یک مکالمه ناگهان صدای تبلیغی پخش کرد؛ آن هم در شرایطی که OpenAI اصولاً هیچ تبلیغی در پلتفرم خود ارائه نمی‌دهد. این موضوع سؤالاتی درباره منشأ این صداها و نقش داده‌های آموزشی در ایجاد چنین رفتارهایی مطرح کرده است.
 

از گفت‌وگوی ماشینی تا همراهی انسانی

 
قابلیت صوتی پیشرفته ChatGPT نخستین‌بار در مه ۲۰۲۴ به‌صورت آزمایشی عرضه شد و از اکتبر همان سال، دامنه دسترسی آن به کاربران اتحادیه اروپا نیز گسترش یافت.
 

صدای انسان‌گونه‌تر، ترجمه همزمان و تعامل واقعی‌تر؛ تحول تازه در نسخه صوتی ChatGPT

گفته می‌شود هدف اصلی OpenAI از توسعه این قابلیت، فراهم‌کردن بستر مکالمه‌ای روان، طبیعی و زنده میان انسان و ماشین بود؛ مکالمه‌ای که در آن کاربر بتواند مانند گفت‌وگوی تلفنی، حرف دستیار هوشمند را قطع کند، یا احساسات خود را منتقل کند و در عوض، پاسخ‌هایی با رنگ‌وبوی انسانی بشنود.
 
از دیگر امکانات این نسخه می‌توان به توانایی ChatGPT در تفسیر بصری اشاره کرد. اگر کاربر دوربین دستگاه را روشن کند، هوش مصنوعی می‌تواند به‌صورت زنده اشیای موجود در تصویر یا محیط اطراف را شناسایی کرده و درباره آن‌ها اظهار نظر کند؛ قابلیتی که کاربردهای متنوعی از آموزش گرفته تا راهنمایی مسافران را در برمی‌گیرد.
 

آینده‌ای نزدیک با مترجمان هوشمند و همراهان صوتی

 
به نظر می‌رسد با پیشرفت چنین قابلیت‌هایی، فاصله میان انسان و هوش مصنوعی به‌سرعت در حال کم شدن است. اگر تا دیروز ترجمه همزمان یا صدای طبیعی تنها در فیلم‌های علمی‌تخیلی قابل تصور بود، امروز این امکانات در گوشی هوشمند هر کاربری قابل دسترسی‌اند.
 
با این حال، کارشناسان هوش مصنوعی هشدار می‌دهند که نباید از یاد برد این ابزارها هنوز از درک واقعی زبان و احساسات انسانی بی‌بهره‌اند و بیشتر براساس الگوهای آماری کار می‌کنند. بنابراین استفاده آگاهانه، همراه با درک محدودیت‌ها، شرط اصلی بهره‌برداری مؤثر از چنین فناوری‌هایی است.

برچسب ها
ChatGPT
اشتراک گذاری

اخبار مرتبط

  • طرح جاه‌طلبانه ایلان ماسک برای یکپارچه‌سازی تسلا، اسپیس‌ایکس و هوش مصنوعی
    طرح جاه‌طلبانه ایلان ماسک برای یکپارچه‌سازی تسلا، اسپیس‌ایکس و هوش مصنوعی 16 ساعت پیش
  • سیستم MASAI؛ هوش مصنوعی روسی که احساسات انسان را می‌خواند
    سیستم MASAI؛ هوش مصنوعی روسی که احساسات انسان را می‌خواند 16 ساعت پیش
  • مقابله پرچمدار سامسونگ با «دزدان شانه‌ای» در گلکسی S26 اولترا
    مقابله پرچمدار سامسونگ با «دزدان شانه‌ای» در گلکسی S26 اولترا 17 ساعت پیش
  • ناسا ابررایانه قدرتمند آتنا را معرفی کرد: قادر به انجام ۲۰ کوادریلیون محاسبه در ثانیه
    ناسا ابررایانه قدرتمند آتنا را معرفی کرد: قادر به انجام ۲۰ کوادریلیون محاسبه در ثانیه 17 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 11574
  • اقتصاد 9043
  • بازار مالی 2055
  • بین الملل 14490
  • تبلیغات 29
  • جامعه 10132
  • دانش 7584
  • عمومی 1926
  • فناوری اطلاعات 7523
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1354
  • ورزش 23415

جدیدترین مقالات

  • برگزاری چهل و چهارمین جشنواره فیلم فجر در استان کردستان
    برگزاری چهل و چهارمین جشنواره فیلم فجر در استان کردستان 7 ساعت پیش
  • پروژه دوربرگردان غیرهمسطح میثم؛ هدیه مدیریت شهری شیراز به مردم
    پروژه دوربرگردان غیرهمسطح میثم؛ هدیه مدیریت شهری شیراز به مردم 7 ساعت پیش
  • افتتاح یک هزار و ۷۰۲ واحد مسکونی در دهه فجر ۱۴۰۴ /افتتاح ۲ مدرسه در سایت‌های مسکن مهر از محل اعتبار وزارت راه و شهرسازی
    افتتاح یک هزار و ۷۰۲ واحد مسکونی در دهه فجر ۱۴۰۴ /افتتاح ۲ مدرسه در سایت‌های مسکن مهر از محل اعتبار وزارت راه و شهرسازی 7 ساعت پیش
  • انجام ۳۹۴ پرواز در فرودگاه بین‌المللی کیش طی یک هفته
    انجام ۳۹۴ پرواز در فرودگاه بین‌المللی کیش طی یک هفته 7 ساعت پیش
  • مدیرکل بنیاد مسکن استان خبر داد:صدور بالغ بر ۱۸۹ هزار برگ سند مالکیت شهری و روستایی در گیلان
    مدیرکل بنیاد مسکن استان خبر داد:صدور بالغ بر ۱۸۹ هزار برگ سند مالکیت شهری و روستایی در گیلان 7 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار |  کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور