ترجمه مستقیم سیگنال های مغز افراد معلول به گفتار

پیشرفت رابط های مغز و رایانه وعده های فراوانی را به افرادی که دارای محدودیت و یا عدم توانایی صحبت کردن هستند می دهد.
در ابتدا از نظر علمی، مهندسین علوم اعصاب سیستمی را طراحی کردند که فکر را به سخنی قابل فهم و تشخیص تبدیل می کند. تکنولوژی با نظارت بر فعالیت های مغز یک شخص می تواند کلماتی را که شخص می شنود را به صورت کاملا واضح بازسازی کند. این پیشرفت غیر منتظره که قدرت ترکیب سخن و هوش مصنوعی را نشان می دهد، می تواند راه های جدیدی را برای کامپیوتر ها فراهم کند تا به صورت مستقیم به مغز متصل شوند.همچنین این زمینه را برای افرادی که نمی توانند صحبت کنند همانند بیماران سکلروز جانبی آمیوتروفیک(ALS) و یا افرادی که دچار سکته مغزی شده اند فراهم می کند تا دوباره توانایی خود را به دست آورند.
در زیر یافته های گزارش های علمی که امروز منتشر شده اند نوشته شده است.
نیما مسگرانی، دکترای علمی و نویسنده ارشد و محقق مقاله رفتار ذهنی مورتیمر بوک دانشگاه کلمبیا می گوید: صدای ما کمک می کند با خانواده ، دوستانمان وهمچنین جهان اطراف در ارتباط باشیم که دلیل ویرانگر بودن از دست دادن قدرت صدا به علت بیماری و یا صدمه نیز همین است. با مطالعات امروزه یک راه بالقوه برای بازگرداندن نیرو داریم. ما نشان دادیم که با تکنولوژی صحیح، افکار این افراد می تواند رمزگشایی شود و توسط هر شنونده ای فهمیده شود.
دهه های تحقیقاتی نشان داده است که وقتی مردم صحبت می کنند و یا حتی زمانی که صحبت کردن را تصور می کنند، الگوهای ذهنی در ذهنشان نقش می بندد. الگوهای متفاوت (اما قابل تشخیص) سیگنال ها هم هنگامی که به صحبت های شخصی گوش می دهیم، نمایان می شود.. کارشناسان تلاش می کنند که این الگو ها را ضبط و رمزگشایی کنند. به زودی آینده ای را می بینید که در آن افکار درون مغز پنهان نمی مانند و در عوض می توانند تبدیل به سخن شوند.
اما انجام این امر چالش هایی را به وجود آورده است.تلاش های اولیه دکتر مسگرانی و همراهانش برای رمزگشایی سیگنال ها بر روی مدل های ساده ی کامپیوتری انجام شد که اسپکتروگرام هایی را آنلایز کردند که نمایانگر تصویر بصری فرکانس های صوتی است.

توانایی حرف زدن با AI
اما به خاطر این که این رویکرد در تولید چیزی شبیه به سخن قابل فهم شکست خورد، دکتر مسگرانی و تیم او از یک vocoder استفاده کردند. Vocoder یک الگوریتم کامپیورتری است که می تواند سخن را بعد از این که در  صحبت ضبط شده افراد تعلیم داده شد، ترکیب کند.
این همان تکنولوژی است که توسط اکو آمازون و سیری اپل برای پاسخ به سوال های ما استفاده می شود. این گفته دکتر مسگرانی، دکترای مهندسی برق از دانشکده مهندسی و علوم کاربردی کلمبیا است.
نتیجه نهایی یک صدای رباتیک بود که دنباله ای اعداد را می خواند.برای آزمایش صحت ضبط آن، دکتر مسگرانی و همکارانش موظف شدند تا هر یک به تنهایی به آن گوش کنند و چیزی را که شنیده اند بیان کنند.
دکتر مسگرانی گفت:ما متعجب شده ایم که افراد 75% صداها را می توانند بشوند و تکرار کنند که از موارد قبلی خیلی بهتر است.قابلیت فهم افراد در ظاهر بسیار بهتر از ضبط های قبلی که مبتنی بر اسپکتوگرام بود گزارش شده بود.این vocoder حساس با شبکه های عصبی قدرتمند نشان دهنده صداهایی بود که بیماران در ابتدا به درستی شنیده بودند.

بهبود حرف زدن با هوش مصنوعی
دکتر مسگرانی و همکارانش تصمصم گرفتند تا کلمات و عبارات پیچیده تری را آزمایش کنند و همان آزمایش ها را زمانی که فرد صحبت می کند یا تصور می کند که حرف می زند روی سیگنال های مغزی اجرا کنند. در نهایت آن ها امیدوارند که سیستم آن ها بتواند بخشی از یک implant باشد و یا شبیه آنهایی باشد که بیماران صرع می پوشیدند که افکار آن هارا مستقیما به کلمه ترجمه کند.
دکتر مسگرانی گفت:"در این پروژه  اگر آزمایش شوندگان فکر کنند < من یک لیوان آب نیاز دارم> سیستم ما می تواند سیگنال های مغزی را که توسط افکار تولید شده اند دریافت کنند و آن ها را به کلام تبدیل کنند.این می تواند یک بازی تعویض کننده باشد.این سیستم می تواند به کسانی که قدرت کلام خود را چه بر اثر آسیب و یا بیماری از دست داده اند این شانس را بدهد تا با اطرافیان ارتباط برقرار کنند.

 

برای درج نظر و یا طرح سوالات خود لطفا در سایت ثبت نام کنید و یا وارد سایت شوید

نظرات کاربران

برای این مطلب تاکنون نظری ارسال نشده است. شما اولین نفر باشید