Почему роботы и люди думают по-разному
Комментирует научный сотрудник института № 8 «Компьютерные науки и прикладная математика» МАИ, директор департамента цифровой трансформации в компании BetBoom Юрий Чайников.
С появлением в середине прошлого века промышленных роботов писатели-фантасты и футуристы стали мечтать о том, как роботы полностью заменят человека и избавят его как от бытовых забот, так и от рисков по освоению космоса. Однако практические шаги в этом направлении всё больше показывают, что искусственный интеллект может далеко не всё и не во всём может заменить человека, по крайней мере пока.
— Мало кто задумывается над этим, но задачи, которые легко решают люди, как раз очень трудны для алгоритмической реализации в искусственном интеллекте. И задачи для нас самые банальные, которые мы решаем автоматически, не задумываясь: мы ходим, свободно ориентируемся в незнакомом физическом пространстве, не задеваем плечами стены, способны в доли секунды сообразить, как открыть дверь. Все эти тривиальные для нас вещи невероятно трудно реализовать в электронном «мозге» и механике движения робота. И в то же время мы довольно трудно складываем в столбик, запоминаем длинные ряды цифр или прогнозируем, как продлится ряд чисел, что для компьютеров не составляет никакого труда, — рассказывает Юрий Чайников.
Поэтому, с одной стороны, искусственный интеллект очень сильно помогает человеку, компенсируя его слабые места, но, с другой, его собственные ограничения сужают спектр его практического использования.
Но почему так происходит? Комментирует эксперт:
— Люди — это биологические организмы, которые, если вести счёт с клеток, прошли путь эволюции длиною в миллиарды лет. Все эти многие сотни миллионов лет бесчисленные поколения живых существ находились под жесточайшим давлением естественного отбора, который за нас осуществляет сама физика нашего мира. Например, если ты упал, споткнувшись, и не выставил вперёд руку, то рискуешь сломать себе голову. Если ты прыгнул с ветки на ветку и не долетел, то рискуешь упасть вниз и быть съеденным дикими зверями. Если ты в хаосе световых пятен фотонов, которые летят в сторону сетчатки твоего глаза, не умеешь распознавать паттерн поведения хищника, то вероятность твоего выживания гораздо ниже, чем у того, кто умеет. Те, у кого всё это получалось хуже, те просто не выжили, поэтому у нас на очень низком уровне прошита история сотен миллионов поколений, которые внутри себя моделировали физику реального мира. За все эти бесчисленные века в некотором смысле наш мозг всё время занимается предсказанием того, что с нами произойдёт в следующие мгновения и как нам поступить. И чем точнее у нас работает наш внутренний предиктор, тем больше шансов у нас убежать от хищника, найти плод, победить в конкурентной борьбе — те, у кого это получалось хуже, те умерли. Поэтому складывать числа могут крайне небольшое количество видов на Земле, а вот обращаться с физикой этого мира имеют все живые на текущий момент существа. Даже амёба ползёт в сторону сахара и прочь от горячего. Всё это совершенно не очевидно для искусственного интеллекта робота, — отмечает эксперт.
Зато для искусственного интеллекта робота, который сам по себе представляет класс вычислительных алгоритмов, родным является как раз мир цифр. И это не удивительно: другого мира искусственный интеллект просто не знает.
— Возьмём для примера ребёнка. Обычно к двум годам ребёнок уже сносно ходит. Почему? Потому что он два года непрерывно учился на потоке данных о физической реальности. Два года — это большой срок. Насколько мне известно, ни одну нейросеть не учили два года подряд работать с физическим пространством, — рассказывает Юрий Чайников.
Но и в этом отношении мы уже недалеко, стоим на пороге этого следующего шага.
— Современные нейросети много учатся, получают много видеоданных об окружающей среде и текстовых описаний того, как устроен мир. Тем самым, нейросети получают множественные описания устройства нашего мира. Если отпустить предмет, он падает, если наклонить чашку, то из неё вытечет содержимое, если долго оставить на газу чайник, то он выкипит и расплавится. Эти текстовые описания, которыми мы «кормим» мультимодальные модели, и изображения (фото и видео) того, что происходит, приводят к интеграции внутри нейросети разных видов «знания», накоплению закономерностей, которые оседают в связях между слоями нейронов. Это позволяет им лучше планировать действия, давать сигналы эффектором, чтобы достигать долгосрочной цели. Это в конечном счёте и позволит роботу с искусственным интеллектом пройти «кофейный тест»: понять, чего хочет пользователь, сориентироваться в пространстве, пойти, не задев двери, открыть дверцу шкафа, найти кофе, найти воду и сварить кофе, — отмечает эксперт.
Материал подготовлен при поддержке Минобрнауки России