В исследовательском институте Toyota (TRI) при помощи генеративного искусственного ума научили ботов неким способностям изготовления завтрака. И это не потребовало сотен часов программирования и предстоящей работы над ошибками и исправлением их. Заместо этого исследователи оснастили ботов особыми датчиками, обеспечивающими чувство осязания, подключили их к модели искусственного ума, а потом проявили системе, что необходимо созодать, пишет The Verge.
Исследователи отметили, что осязание является «одним из главных причин» в обучении. Благодаря осязанию бот может «ощущать», что он делает, получая больше инфы. Это упрощает выполнение сложных задач по сопоставлению с внедрением лишь одних камер.
По словам сотрудника лаборатории TRI Бена Берчфилда (Ben Burchfiel), «любопытно созидать, как они (боты) ведут взаимодействие с окружающей средой». Поначалу «учитель» показывает набор способностей, а потом «в течение нескольких часов» модель обучается в фоновом режиме. «Мы обычно обучаем бота днём, позволяем ему обучаться всю ночь (то есть темное время суток), а на последующее утро приступаем к новенькому рабочему поведению», — объяснил Берчфилд.
Исследователи поведали, что они пробуют сделать так именуемые «огромные модели поведения» (Large Behavior Models, LBM). Подобно тому, как огромные языковые модели (LLM) учатся, отмечая закономерности в тексте, модели LBM Toyota обучаются путём наблюдения, а потом «обобщают, применяя новейший навык, которому их никогда не учили», гласит Расс Тедрейк (Russ Tedrake), доктор робототехники Массачусетского технологического института и вице-президент по исследованиям в области робототехники TRI. Используя этот способ, исследователи обучили ботов наиболее чем 60 сложным способностям, таковым как «разлив жидкостей, внедрение инструментов и манипулирование деформируемыми объектами». Исследователи TRI планируют научить ботов к концу 2024 года до 1000 способностей.
В аналогичном направлении работает Google, создавшая ИИ-модель RT-2 (Robotics Transformer 2) класса «зрение-язык-действие» (Vision-Language-Action — VLA). Подобно разработке Toyota, боты на базе RT-2 употребляют приобретенный опыт, чтоб созодать выводы, как действовать. На теоретическом уровне, боты, обученные искусственным умом, сумеют в итоге делать задачки фактически без каких-то инструкций, не считая общих указаний, которые обычно дают человеку, к примеру, «очистить пол от пятна».
Как отметила The New York Times, такового рода работа (создание модели схожей RT) обычно «неспешная и трудоёмкая», и предоставить достаточное количество обучающих данных еще труднее, чем просто передать в модель ИИ массу данных, которые можно скачать из веба.