Самокорректирующийся гуманоидный робот, который научился готовить чашку кофе, просто просмотрев видеозапись, на которой это делает человек, теперь, благодаря его интеграции с технологией OpenAI, может отвечать на вопросы.
В новом рекламном ролике техник просит Figure 01 выполнить ряд простых задач в минималистской тестовой среде, напоминающей кухню. Сначала он просит робота чего-нибудь поесть, и ему передаётся яблоко. Затем он попросил Figure 01 объяснить, почему тот передал ему яблоко, когда он поднимал мусор. Робот отвечает на все вопросы роботизированным, но достаточно дружелюбным голосом.
With OpenAI, Figure 01 can now have full conversations with people
-OpenAI models provide high-level visual and language intelligence
-Figure neural networks deliver fast, low-level, dexterous robot actionsEverything in this video is a neural network: pic.twitter.com/OJzMjCv443
— Figure (@Figure_robot) March 13, 2024
В своём видео компания заявила, что разговор основан на интеграции с технологией OpenAI — именно это компания стоит за производством ChatGPT. Однако маловероятно, что на Figure 01 используется сам ChatGPT, поскольку этот инструмент искусственного интеллекта обычно не использует слова с паузами, такие как «гм», как это делает данный робот.
Если все в видео работает так, как заявлено, это означает прогресс в двух ключевых областях робототехники. Так, первый прогресс заключается в механической инженерии захватывающих, самокорректирующих движений, подобных тем, которые выполняются людьми. Это означает очень точные моторы, приводы и захваты, вдохновлённые суставами или мышцами, а также управление мотором для их манипулирования для выполнения задачи и аккуратного удержания предметов.
Даже для того, чтобы взять чашку — то, о чём люди почти не задумываются сознательно, — используется интенсивная встроенная обработка, позволяющая ориентировать мышцы в точной последовательности.
Второе усовершенствование — это обработка естественного языка в реальном времени (NLP) благодаря добавлению движка OpenAI, который должен быть таким же быстрым и отзывчивым, как ChatGPT, когда вы вводите в него запрос. Также требуется программное обеспечение для преобразования этих данных в аудио или речь. NLP — это область компьютерных наук, целью которой является наделение машин способностью понимать и передавать речь.