چگونه خودروهای خودران نقاط کور را توسط هوش مصنوعی شناسایی می کنند؟

1398/1/4 --- 163

 تشخیص نقاط کور توسط اتوموبیل های خودران
مدل جدیدی که توسط MIT و محققان مایکروسافت ایجاد شده است، مواردی را مشخص کرده که در آن سیستم های خودران با آن چه که در دنیای واقعی اتفاق می افتد هماهنگی ندارند. مهندسان می توانند از این موارد برای بهبود ایمنی سیستم های هوش مصنوعی مانند وسایل نقلیه بدون راننده و ربات های خودکار استفاده کنند.
برای مثال خودروهای بدون راننده ای که از سیستم هوش مصنوعی استفاده می کنند، در شبیه سازی های مجازی آموزش دیده اند تا خود را برای هر رویدادی در جاده آماده کنند. اما گاهی اوقات خودرو باعث اشتباه غیر منتظره ای می شود چرا که در دنیای واقعی اتفاقی که باید بیفتد می افتد، اما ماشین رفتار خود را تغییر نمی دهد.
یک ماشین بدون راننده را در نظر بگیرید که تحت آموزش قرار نگرفته است، و مهم تر از همه سنسورهای لازم برای درک تفاوت صحنه ها را ندارد، مانند اتوموبیل های بزرگ سفید رنگ و آمبولانس هایی با چراغ های قرمز و چشمک زن در جاده. در این صورت اگر ماشین در بزرگراه باشد و سیستم سرعت را روی حالت کروز قرار داده باشد، زمانی که آمبولانسی را مشاهده می کند، از سرعت خود نمی کاهد و ماشین را به کنار جاده هدایت نمی کند چرا که برای او تفاوتی بین آمبولانس و ماشین بزرگ سفید رنگ تعریف نشده است.
همانند رویکردهای سنتی، محققان سیستم هوش مصنوعی را در یک شبیه سازی مجازی آموزش می دهند. اما پس از آن، انسان اقدامات سیستم را همانطور که در دنیای واقعی عمل می کند، نظارت می کند و زمانی که سیستم ساخته شد و یا در حال ساخت بود،  بازخورد آن را ارائه می دهد. سپس محققان داده هایی که از طریق آموزش به دست آمده را با بازخوردهای انسانی ترکیب می کنند تا تکنیک های یادگیری ماشین را برای ایجاد مدلی استفاده کنند که در واقع موقعیت هایی را مشخص می کند که سیستم به احتمال زیاد نیاز به اطلاعات بیشتری درمورد عملکرد صحیح دارد.
محققان روش خود را با استفاده از بازی های ویدیویی ارزیابی کردند. اما قدم بعدی ترکیب مدل سنتی و تست دست آوردها برای ماشین های خودران و ربات ها با بازخورد انسانی است.
 پیش بینی نقاط کور توسط هوش مصنوعی
Ramya Ramakriishnan، دانشجوی کارشناسی ارشد علوم رایانه و آزمایشگاه هوش مصنوعی می گوید: این مدل به سیستم های خودران کمک می کند آنچه را که نمی دانند پیدا کنند. در بیشتر مواقع آنچه برای آن ها شبیه سازی شده است با محیط واقعی مطابقت ندارد و ممکن است اشتباهاتی مانند تصادف را به وجود آورد. این ایده ای است که می توان برای پر کردن شکاف بین شبیه سازی و دنیای واقعی استفاده کرد. بنابراین می توانیم خطاها را کاهش دهیم.

گرفتن بازخورد

بعضی از روش های آموزش سنتی بازخورد افراد را فقط برای به روز رسانی اقدامات سیستم، در حین آزمون واقعی ارائه می دهد. اما این بازخوردها نقاط کور را که در دنیای واقعی اهمیت بسیاری دارند، شامل نمی شود.
در این رویکرد محققان ابتدا سیستم هوش مصنوعی را در آموزش مجازی قرار دادند که خط مشی را ایجاد می کند و در نتیجه در هر موقعیت بهترین اقدامی را که در طول شبیه سازی می تواند انجام دهد ارائه می کند. سپس سیستم را در دنیا واقعی مستقر می کنند و در آن جا انسان ها سیگنال های خطا را در مناطقی که اقدامات سیستم غیر قابل قبول است ثبت می کنند.
انسان ها می توانند داده ها را به روش های مختلفی از جمله نمایش و همچنین اصلاح خطاها تولید کنند. در نمایش، انسان در دنیای واقعی کار می کند، در حالی که سیستم اقدامات انسانی را با آن چیزی که اگر در آن بود انجام می داد، می بیند و مقایسه می کند. به عنوان مثال، برای ماشین های بدون سرنشین، انسان می تواند کنترل ماشین را در صورتی که سیستم سیگنالی تولید کند که مغایر با رفتار برنامه ریزی شده برای انسان باشد، بدست بگیرد. این انطباق ها و یا عدم انطباق ها با رفتار انسان نشانه هایی را به وجود می آورد که مشخص می کند سیستم در چه زمانی رفتار معقولی داشته است.
در عوض می توان اصلاحات را با نظارت انسانی بر سیستم در دنیای واقعی ارائه کرد. انسان می تواند روی صندلی راننده نشسته در حالی که ماشین در مسیر برنامه ریزی شده اش حرکت می کند. اگر اقدامات ماشین صحیح باشد، انسان هیچ کاری نمی کند. اگر اقدامات نادرست باشد انسان کنترل را در دست می گیرد وسیگنالی ارسال می کند به این معنی که سیستم در وضعیت خاصی غیر قابل قبول عمل کرده است.
هنگامی که این اطلاعات از انسان جمع آوری می شود، سیستم لیستی از موقعیت ها را به همراه برچسب هایی که نشان می دهد اقدامات قابل قبول و یا غیر قابل قبول است، دارد. یک وضعیت واحد می تواند بسیاری از سیگنال های مختلف را دریافت کند، زیرا سیستم بسیاری از موقعیت ها را یکسان می بیند. برای مثال ممکن است سیستم بارها در کنار ماشین بزرگی در حالت کروز بدون آن که نیاز به کم کردن سرعت داشته باشد، حرکت کرده باشد. اما زمانی که با آمبولانسی مواجه می شود چون شرایط را یکی می بیند طبیعتا اقدام درستی نخواهد کرد.
Ramakrishnan می گوید: در آن لحظه سیستم چندین سیگنال متناقض را از انسان دریافت می کند: در بعضی با یک ماشین بزرگ در کنار آن که عملکرد آن خوب بوده است، و یکی زمانی که آمبولانس در همان مکان قرار داشته ولی عملکرد او خوب نبوده است. سیستم یادداشتی کوچکی را ثبت می کند که کاری را اشتباه انجام داده است اما دلیل آن را نمی داند. از آن جایی که نماینده تمام این سیگنال ها را دریافت می کند، قدم بعدی ترکیب همه اطلاعات است تا بتواند بپرسد چگونه در این وضعیتی که سیگنال دریافت کرده ام، اشتباه می کنم؟
 

جمع آوری هوشمند

هدف نهایی این است که این شرایط مبهم را به عنوان نقاط کور بنامیم. اما این چیزی فراتر از جدا کردن اقدامات به دو دسته قابل قبول و غیر قابل قبول است. برای مثال اگر سیستم در شرایط آمبولانس اقدامات را 9 بار از 10 بار صحیح انجام داد، به راحتی می توان این وضعیت را ایمن دانست.
Ramakrishnan می گوید: اما از آنجایی که اقدامات غیر قابل قبول بسیار کمتر از اقدامات قابل قبول هستند، سیستم در نهایت می آموزد که همه شرایط را به عنوان شرایط ایمن پیش بینی کند که این می تواند خطرناک باشد.
به این ترتیب محققان از الگوریتم Dawid-Skene، یک روش یادگیری ماشین برای برچسب ها استفاده می کنند. الگوریتم یک لیست از موقعیت ها را به عنوان ورودی می گیرد که هرکدام برچسب قابل قبول و یا غیر قابل قبول دارند. سپس تمام اطلاعات را جمع آوری و محاسبه می کند تا الگوهای موجود در برچسب نقاط کور پیش بینی شده و نقاط ایمن را شناسایی کند. استفاده از این اطلاعات یک سیگنال امن و یا نقطه کور را برای هر وضعیت و سطح اطمینان آن برچسب تولید می کند. الگوریتم می تواند در شرایطی که ممکن است داشته باشد در 90 درصد موارد درست عمل کند، اما وضعیت همچنان می تواند نقطه کور باشد.
در آخر، الگوریتم نوعی نقشه اولویت تولید می کند که در آن هر موقعیتی از آموزش های اصلی سیستم برای نقطه کور بودن از میزان احتمال کم تا زیاد تعیین می شوند. 
Ramakrishnan می گوید: هنگامی که سیستم در دنیای واقعی عمل می کند، می تواند از این مدل برای اعمال محتاطانه تر و هوشمندانه تر استفاده کند. اگر مدل آموخته شده شرایطی را برای نقطه کور بودن با احتمال بالا پیش بینی کند، سیستم می تواند از یک انسان برای اقدام قابل قبول پرس و جو کند و یا به او اجازه دهد برای اقدام ایمن تر کنترل را در دست بگیرد.