Кубик Рубика. За гранями головоломки, или Природа творческой мысли (Рубик) - страница 98

Когда статья с результатами исследования была опубликована, она привлекла внимание многих ученых. До этого компьютеры хорошо справлялись с такими играми, как шахматы и го, но найти решение для Куба было гораздо сложнее. ИИ научился играть и побеждать в этих настольных играх с помощью системы положительного подкрепления. Когда машина делала правильный ход, она вознаграждалась за правильные действия, тем самым получая сигнал, что играет успешно.

С Кубом все гораздо сложнее, потому что для многих вариантов ходов невозможно точно сказать, приближает ли он к конечной цели.

Калифорнийским ученым удалось преодолеть этот барьер, научив машину самостоятельно оценивать ходы. Удивительно, но перед каждым следующим ходом она сравнивает свое текущее состояние с собранным Кубом, а работая в обратном направлении, оценивает, приблизит ли ее этот шаг к цели. В июне 2018 года журнал Массачусетского технологического института MIT Technology Review анонсировал их достижение словами: «Еще один бастион человеческих навыков и интеллекта пал под натиском машин. Новый тип машины глубокого обучения научился собирать кубик Рубика без какой-либо помощи человека».

У роботов две главные характеристики – механическая суть и наличие «мозга». Когда ученые попытались научить робота ходить, они столкнулись с большими сложностями, связанными с механикой процесса ходьбы. Не случайно мы не умеем ходить с рождения. Нам нужно время, чтобы научиться координировать части тела и балансировать, совершая сложные движения, и это даже не касается нашего взаимодействия с окружающей средой, поднимаемся ли мы по лестнице или перепрыгиваем яму.

Когда роботов познакомили с Кубом, одной из самых сложных и одновременно главных начальных задач было научить их делать поворот грани.

Я видел ролик, где искусственная рука вращала Куб, и был восхищен ее ловкостью. Другая задача заключалась в разработке программы, способной управлять механической машиной, собирающей Куб. Такая машина должна иметь некоторые способности восприятия. Каждый Куб в любом состоянии имеет определенный шаблон, задающий этап сборки.

Для сборки Куба создавались специальные роботы. У RuBot была голова и механическая рука; он мог говорить, идти и очень медленно собирать Куб. Это был специализированный робот, созданный для решения одной задачи, сродни промышленным роботам, используемым в автомобилестроении. Он отличался от универсальных многозадачных роботов. Во время соревнований специализированных роботов по сборке Куба роботу-победителю удалось это сделать менее чем за 0,4 секунды! Всего лишь миг, неуловимый для человеческого глаза, и все готово. Разглядеть на экране детали сборки становится возможно только при воспроизведении записи в тридцатикратном замедлении.