فرارو-بیشتر رباتهای خودمختار باید به طور دقیق توسط انسان برنامهریزی شوند و یا بارها در سناریوهای شبیهسازی شده آزمایش شوند تا بتوانند بخوبی از پس انجام وظایف دنیای واقعی بربیایند؛ مانند بالا رفتن از یک تپه سنگی یا یک شیب لغزنده.
به گزارش فرارو، «سرگی لوین» و همکارانش از دانشگاه کالیفرنیا با استفاده از نوعی یادگیری ماشینی به نام یادگیری تقویتی عمیق توانسته اند نحوه راه رفتن در محیطهای مختلف را تنها در مدت ۲۰ دقیقه به یک ربات بیاموزند.
این ربات از الگوریتمی به نام یادگیری Q استفاده میکند که نیازی به مدلسازی از محیط اطراف ندارد. چنین الگوریتمهای یادگیری ماشینی معمولاً در شبیه سازی استفاده میشوند. لوین میگوید: «نیازی نیست که بدانیم یک محیط چگونه است. ما فقط ربات را در یک محیط قرار میدهیم و آن را روشن میکنیم.»
این ربات بسته به میزان موفقیت خود در انجام هر عمل، پاداش مشخصی دریافت میکند. او در حالی که انجام کار خود را با موفقیتهای قبلی مقایسه میکند، این روند را به طور مداوم تکرار میکند، تا زمانی که بخوبی راه رفتن را در محیط جدید یاد بگیرد. «ایلیا کوستریکوف» یکی از اعضای این تیم میگوید: «یادگیری این ربات از جهاتی به انسان شباهت دارد. او با محیط تعامل میکند و با فکر کردن به تجربیات گذشته خود در عبور از این مسیر، سعی میکند تشخیص دهد که چه چیزی میتوانست بهبود یابد.»
منبع: newscientist