Совместимость. Как контролировать искусственный интеллект (Рассел) - страница 198

На первую страницу

знания обо всем в мире. Очевидно, это невозможно. Например, я понятия не имею, кто живет в соседнем номере моего ничем не примечательного цюрихского отеля, не говоря уже о нынешнем местонахождении и занятиях большинства из 8 млрд жителей Земли. У меня нет ни малейшего представления о том, что творится в остальной Вселенной за пределами Солнечной системы. Моя неопределенность в отношении текущего положения дел является одновременно громадной и неизбежной.

Базовым методом отслеживания состояния неопределенного мира является Байесово обновление. Его алгоритмы обычно включают два шага: шаг прогнозирования, когда агент предсказывает текущее состояние мира с учетом своего самого недавнего действия, и последующий шаг обновления, когда он получает новые сенсорные входные данные и соответствующим образом обновляет свои представления. Для понимания того, как это работает, рассмотрим проблему, с которой сталкивается робот при выяснении того, где находится. На рис. 21(а) показан типичный случай. Робот находится в центре комнаты, пребывая в некоторой неопределенности относительно своего точного местоположения, и хочет выйти в дверь. Он дает своим колесам команду продвинуться на полтора метра в направлении двери. К сожалению, у него старые разболтанные колеса, и прогноз робота о том, где он закончит движение, является довольно неопределенным, как показано на рис. 21(б). Если он теперь попытается продолжить движение, то может врезаться в дверь. К счастью, у него есть эхолокатор, и он может измерить расстояние до дверного косяка. Как представлено на рис. 21(в), измерения позволяют предположить, что робот находится в 70 см от левого косяка и в 85 см от правого. Наконец, робот обновляет свое состояние уверенности, объединяя прогноз (б) с измерениями (в) и получая новое состояние уверенности, продемонстрированное на рис. 21(г).

Алгоритм отслеживания доверительного состояния может быть использован для работы с определенностью не только в отношении местоположения, но и самой карты. Так был получен метод «Одновременная локализация и картирование» (Simultaneous localization and mapping, SLAM). Этод метод — основной компонент многих ИИ-приложений, от систем дополненной реальности до автомобилей с полным автопилотом и планетоходов.

Приложение Г. Обучение на опыте

Обучение — это повышение результативности на основе опыта. Для системы зрительного восприятия это может означать обучение распознаванию большего числа категорий объектов с опорой на наблюдаемые примеры этих категорий. Для систем, основанных на опыте, само приобретение дополнительного знания является обучением, потому что означает, что система сумеет ответить на большее количество вопросов. Для прогностической системы принятия решений, такой как AlphaGo, обучение может означать повышение ее способности оценивать игровую позицию или исследовать полезные части дерева возможностей.

Следующая страница

Перейти на страницу