Это видео с роботом, готовящим кофе, может говорить об огромном шаге в будущее робототехники с искусственным интеллектом. Но почему?

Это видео с роботом, готовящим кофе, может говорить об огромном шаге в будущее робототехники с искусственным интеллектом. Но почему?

1 мин


Компания, занимающаяся робототехникой, выпустила видео, в котором якобы показано, как человекоподобный робот готовит чашку кофе после наблюдения за тем, как это делают люди, одновременно исправляя допущенные ошибки в режиме реального времени. В рекламном материале флагманская модель компании Figure.ai, получившая название «Figure 01», берёт кофейную капсулу, вставляет её в кофейный аппарат, закрывает крышку и включает аппарат.

И хотя неясно, какие системы работают под капотом, компания Figure заключила коммерческое соглашение с BMW о поставке своих человекоподобных роботов для автомобильного производства — об этом было объявлено 18 января в пресс-релизе.

Эксперты также рассказали Live Science, что, вероятно, происходит внутри, предполагая, что видео действительно показывает то, что утверждает компания.

В настоящее время робототехника на базе искусственного интеллекта (ИИ) зависит от конкретной предметной области — это означает, что эти машины хорошо выполняют что-то одно, а не всё подряд. Они начинают с запрограммированного набора правил и набора данных, используемых для самообучения. Однако, компания Figure.ai утверждает, что Figure 01 этому научился, просмотрев всего 10 часов видео.

Чтобы робот мог готовить кофе или косить газон, это означало бы встраивание опыта в несколько областей, которые слишком громоздки для программирования. Правила для каждой возможной ситуации должны быть предвидены и закодированы в его программное обеспечение — например, конкретные инструкции о том, что делать, когда он дойдёт до конца лужайки. Таким образом, приобретение опыта во многих областях, просто наблюдая, стало бы серьёзным прорывом.

Новый тип робототехники

Первая часть головоломки заключается в том, что Figure 01 должен видеть, что он должен повторить.

«Визуальная обработка информации позволяет распознавать важные шаги и детали процесса», — рассказал Live Science Макс Мэйбери (Max Maybury), предприниматель в области искусственного интеллекта и совладелец AI Product Reviews.

Роботу нужно будет взять видеоданные и разработать внутреннюю прогнозирующую модель физических действий и порядка этих действий, рассказал Live Science Кристоф Семпер (Christoph Cemper), генеральный директор AIPRM, сайта, который разрабатывает подсказки для ввода в системы искусственного интеллекта, такие как ChatGPT. Ему нужно будет перевести то, что он видит, в понимание того, как двигать конечностями и захватами для выполнения тех же движений, добавил он.

Кроме того, есть архитектура нейронных сетей, говорит Клэр Уолш (Clare Walsh), эксперт по анализу данных и искусственному интеллекту из Института аналитики в Великобритании, — это тип модели машинного обучения, вдохновлённый тем, как работает мозг. Для создания сигнала подключается большое количество взаимосвязанных отдельных узлов. Если желаемый результат достигается, когда сигналы приводят к действию (например, вытягиванию руки или смыканию захвата), обратная связь усиливает нейронные связи, которые его достигли, ещё больше внедряя его в «известные» процессы.

«Примерно до 2016 года вероятность успешного распознавания объектов, таких как различение кошек и собак на фотографиях, составляла около 50%, — рассказала Уолш Live Science. — Как только нейронные сети были усовершенствованы и заработали, результаты подскочили до 80–90% практически за одну ночь — обучение путём наблюдения с помощью надёжного метода обучения масштабировалось невероятно хорошо.»

По мнению Уолш, существует сходство между Figure 01 и автономными транспортными средствами, что стало возможным благодаря методам обучения, основанным на вероятности, а не на правилах. Она отметила, что самообучающееся обучение позволяет собирать данные достаточно быстро для работы в сложных условиях.

Почему самокоррекция является важной вехой

Несмотря на то, насколько легко большинству людей готовить кофе, моторика, точное воздействие и знание последовательности событий чрезвычайно сложны для машины в процессе изучения и выполнения. Это делает способность самостоятельно исправлять ошибки чрезвычайно важной — особенно если Figure 01 переходит от приготовления кофе к поднятию тяжелых объектов рядом с людьми или выполнению спасательных работ, спасающих жизни.

«Острота зрения робота выходит за рамки наблюдения за тем, что происходит в процессе приготовления кофе, — сказал Мэйбери. — Он не просто наблюдает за этим, он анализирует процесс, чтобы убедиться, что всё максимально точно.»

Это означает, что робот знает, как не переполнить чашку и как правильно вставить капсулу. Если он видит какое-либо отклонение от заученного поведения или ожидаемых результатов, он интерпретирует это как ошибку и корректирует свои действия, пока не достигнет желаемого результата. Это достигается посредством обучения с подкреплением, при котором осознание желаемой цели развивается методом проб и ошибок при навигации в неопределённой среде.

Уолш добавила, что правильные данные для обучения означают, что движения робота, подобные человеческим, могут быстро «масштабироваться и разнообразиться». «Количество движений впечатляет, а точность и возможности самокоррекции означают, что это может стать предвестником будущих разработок в этой области», — сказала она.

Но Мона Кирстейн (Mona Kirstein), эксперт по искусственному интеллекту с докторской степенью в области обработки естественного языка, предупредила, что Figure 01 выглядит скорее как отличный первый шаг, чем как продукт, готовый к выходу на рынок.

«Для достижения гибкости на уровне человека с новыми контекстами, выходящими за пределы узко определённой задачи, всё ещё необходимо решить проблемы, такие как вариации в окружающей среде, — сказала Кирстейн в интервью журналу Live Science. — Таким образом, хотя это сочетает в себе отличную инженерию с ультрасовременным глубоким обучением, вероятно, преувеличивают прогресс, рассматривая это как создание в целом интеллектуальной гуманоидной робототехники.»


Понравилось? Поделитесь с друзьями!

Комментарии

- комментариев

Включить уведомления Да Спасибо, не надо