سرتیتر خبرها

ببینید | ساسان کریمی: اینکه بگوییم با ترامپ هیچکاری نمی‌شود کرد، بدترین ایده است

12 ساعت پیش

تاکید ایران بر پایان محاصره بدون قید و شرط کوبا

12 ساعت پیش

عضو حماس: پنهان کردن اجساد اسرای صهیونیست سودی برای مقاومت ندارد

12 ساعت پیش

همسر مکرون و حاشیه‌های جنسیت او

12 ساعت پیش

نتانیاهو آمریکا را در جریان تجاوز به غزه قرار داد

12 ساعت پیش

مقام آمریکایی: حماس توافق را نقض نکرده است

12 ساعت پیش

رئیس‌جمهور کلمبیا: آمریکا با حملاتش مردم را ترور می‌کند

12 ساعت پیش

تحولی در فناوری گفتار مصنوعی: بازگشت صدای بیماران فلج با هوش مصنوعی

زمان انتشار: 6 آوریل 2025 ساعت 13:31

دسته بندی: فناوری اطلاعات

شناسه خبر: 2811565

زمان مطالعه: 4 دقیقه

تحولی در فناوری گفتار مصنوعی: بازگشت صدای بیماران فلج با هوش مصنوعی

گروهی از محققان دانشگاه‌های کالیفرنیا در برکلی و سان‌فرانسیسکو موفق به توسعه‌ی یک رابط مغز و کامپیوتر (BCI) شده‌اند که می‌تواند گفتار طبیعی را برای افراد دارای فلج شدید بازگرداند. این سیستم که پیشرفت بزرگی در زمینه پروتزهای عصبی گفتاری محسوب می‌شود، با استفاده از هوش مصنوعی قادر است سیگنال‌های مغزی را تقریباً به‌صورت هم‌زمان به گفتار شنیداری تبدیل کند.

به گزارش سیلاد و به نقل از تک‌اسپات، یکی از چالش‌های اساسی در فناوری‌های مشابه، تأخیر در پردازش گفتار بوده است. اما این تیم تحقیقاتی با بهره‌گیری از الگوریتم‌های مشابه دستیارهای صوتی مانند الکسا و سیری، توانسته این تأخیر را کاهش داده و جریان پیوسته‌ای از گفتار را ایجاد کند.

این فناوری روی بیماری به نام آن که پس از سکته مغزی ۱۸ سال پیش توانایی تکلم خود را از دست داده بود، آزمایش شد. با کاشت الکترودهایی روی سطح مغز او، سیگنال‌های عصبی هنگام تلاش برای بیان کلمات ثبت و توسط مدل هوش مصنوعی آموزش‌دیده با صدای قبلی آن به گفتار تبدیل شدند. نتایج نشان داد که این روش نه‌تنها زمان تأخیر را به کمتر از یک ثانیه کاهش داده، بلکه دقت بالایی نیز در بازتولید گفتار دارد.

پژوهشگران همچنین توانایی این مدل در تولید کلمات جدید خارج از مجموعه داده‌های آموزشی را بررسی کردند. استفاده از کلماتی مانند Alpha و Bravo نشان داد که سیستم می‌تواند الگوهای صوتی جدید را شبیه‌سازی کند. علاوه بر این، آزمایش‌ها نشان دادند که تجربه شنیدن صدای خود در زمان واقعی می‌تواند احساس ارتباط بیشتر فرد با هویت خود را تقویت کند.

این سیستم با انواع فناوری‌های حسگر مغزی، از جمله آرایه‌های میکروالکترودی (MEA) و حسگرهای الکترومایوگرافی سطحی (sEMG)، سازگار است و می‌تواند کاربردهای گسترده‌تری در آینده داشته باشد. این تیم تحقیقاتی در حال کار بر روی افزایش قابلیت‌های احساسی و طبیعی‌تر شدن گفتار با ترکیب ویژگی‌هایی مانند لحن، زیر و بمی و بلندی صدا است.

این فناوری هنوز در مراحل آزمایشی است اما با حمایت مالی مؤسساتی مانند مؤسسه ملی ناشنوایی و اختلالات ارتباطی آمریکا (NIDCD) و برنامه Moonshot ژاپن، می‌تواند در دهه آینده به‌طور گسترده در دسترس قرار گیرد.