تحولی در فناوری گفتار مصنوعی: بازگشت صدای بیماران فلج با هوش مصنوعی

تحولی در فناوری گفتار مصنوعی: بازگشت صدای بیماران فلج با هوش مصنوعی
به گزارش سیلاد و به نقل از تکاسپات، یکی از چالشهای اساسی در فناوریهای مشابه، تأخیر در پردازش گفتار بوده است. اما این تیم تحقیقاتی با بهرهگیری از الگوریتمهای مشابه دستیارهای صوتی مانند الکسا و سیری، توانسته این تأخیر را کاهش داده و جریان پیوستهای از گفتار را ایجاد کند.
این فناوری روی بیماری به نام آن که پس از سکته مغزی ۱۸ سال پیش توانایی تکلم خود را از دست داده بود، آزمایش شد. با کاشت الکترودهایی روی سطح مغز او، سیگنالهای عصبی هنگام تلاش برای بیان کلمات ثبت و توسط مدل هوش مصنوعی آموزشدیده با صدای قبلی آن به گفتار تبدیل شدند. نتایج نشان داد که این روش نهتنها زمان تأخیر را به کمتر از یک ثانیه کاهش داده، بلکه دقت بالایی نیز در بازتولید گفتار دارد.
این سیستم با انواع فناوریهای حسگر مغزی، از جمله آرایههای میکروالکترودی (MEA) و حسگرهای الکترومایوگرافی سطحی (sEMG)، سازگار است و میتواند کاربردهای گستردهتری در آینده داشته باشد. این تیم تحقیقاتی در حال کار بر روی افزایش قابلیتهای احساسی و طبیعیتر شدن گفتار با ترکیب ویژگیهایی مانند لحن، زیر و بمی و بلندی صدا است.
این فناوری هنوز در مراحل آزمایشی است اما با حمایت مالی مؤسساتی مانند مؤسسه ملی ناشنوایی و اختلالات ارتباطی آمریکا (NIDCD) و برنامه Moonshot ژاپن، میتواند در دهه آینده بهطور گسترده در دسترس قرار گیرد.