Обзор четырех шагов в структуре Text2Robot. Кредит: arxiv (2024). Doi: 10.48550/arxiv.2406.19963
Когда впервые были изобретены персональные компьютеры, только небольшая группа людей, которые понимали языки программирования, могла их использовать. Сегодня любой может искать местную погоду, сыграть свою любимую песню или даже генерировать код с несколькими нажатиями.
Этот сдвиг принципиально изменил то, как люди взаимодействуют с технологиями, делая мощные вычислительные инструменты доступными для всех. Теперь достижения в области искусственного интеллекта (ИИ) расширяют эту простоту взаимодействия в мир робототехники через платформу под названием Text2Robot.
Разработанный инженерами в Университете Дьюка, Text2Robot — это новая структура вычислительного дизайна роботов, которая позволяет любому проектировать и создавать робота, просто вводя несколько слов, описывающих, как он должен выглядеть и как он должен функционировать. Его новые способности будут продемонстрированы на предстоящей Международной конференции IEEE по робототехнике и автоматизации (ICRA 2025) 19–23 мая, в Атланте, штат Джорджия.
В прошлом году проект занял первое место в категории инноваций в конкурсе Virtual Creatures, которая проходила в течение 10 лет на конференции Artificial Life в Копенгагене, Дания. Бумага команды доступна на arxiv Сервер препринта.
«Создание функционального робота традиционно было медленным и дорогим процессом, требующим глубокого опыта в области инженерии, искусственного интеллекта и производства», — сказал Бойуан Чен, доцент факультета Дикинсона в области машиностроения и материаловедения, электротехники и компьютерных наук и компьютерных наук в Университете Дьюка. «Text2Robot предпринимает начальные шаги к радикально улучшению этого процесса, позволяя пользователям создавать функциональные роботы, используя только естественный язык».
Кредит: Университет Дьюка
Text2Robot использует новые технологии ИИ для преобразования описаний пользовательского текста в физические роботы. Процесс начинается с генеративной модели текста к 3D, которая создает трехмерный физический дизайн тела робота на основе описания пользователя.
Этот базовый конструкция тела затем преобразуется в движущуюся модель робота, способную выполнять задачи путем включения реальных производственных ограничений, таких как размещение электронных компонентов и функциональность и размещение суставов.
Система использует эволюционные алгоритмы и обучение подкреплению для кооптимизации формы, способностей движения и контроля робота, обеспечивая эффективную и эффективную выполнение задач.
«Это не только создание прохладных роботов»,-сказал Райан Ринглет, соучастник газеты и студент-студент в лаборатории Чена. «ИИ понимает физику и биомеханику, создавая проекты, которые фактически являются функциональными и эффективными».
Например, если пользователь просто использует краткое описание, такое как «робот-лягушка, который отслеживает мою скорость по команде» или «энергоэффективный робот для ходьбы, который выглядит как собака», Text2Robot генерирует производственный дизайн робота, который напоминает конкретный запрос в течение нескольких минут и имеет его ходьбу в течение часа. Менее чем за день пользователь может 3D-напечаток, собирать и смотреть, как их робот оживает.
Новая платформа Text2Robot может разработать и 3D-печать широкий спектр мобильных роботов, вдохновленных животными, основанные исключительно на запросе пользователя. Кредит: Университет Дьюка
«Эта быстрая способность создает новые возможности для дизайна и производства роботов, что делает его доступным для всех, у кого есть компьютер, 3D-принтер и идею»,-сказал Захари Чарлрик, автор бумаги и студент-студент в лаборатории Чен. «Магия текста2Robot заключается в его способности преодолеть разрыв между воображением и реальностью».
Text2Robot может революционизировать различные аспекты нашей жизни. Представьте себе, что дети проектируют своих собственных домашних животных или художников, создающих интерактивные скульптуры, которые могут двигаться и реагировать. Дома роботы могут быть разработаны на заказ, чтобы помочь с домашними делами, такими как мусор, который проводит конкретную планировку дома и препятствия, чтобы опустошить себя по команде. В наружной среде, таких как сценарий реагирования на стихийные бедствия, респонденты могут желать различных типов роботов, которые могут выполнять различные задачи в неожиданных условиях окружающей среды.
В настоящее время структура фокусируется на квадратных роботах, но будущие исследования расширят свои возможности до более широкого спектра роботизированных форм и интегрируют автоматизированные процессы сборки для дальнейшей оптимизации конвейера дизайна к реальности.
Сборные кусочки мобильного робота с AI и 3D-печатью собраны. Кредит: Университет Дьюка
«Это только начало»,-сказал Джиаксун Лю, соповочный автор газеты и доктор философии второго курса. Студент в лаборатории Чена. «Наша цель состоит в том, чтобы расширить возможности роботов не только понимать и реагировать на потребности человека через их умный« мозг », но и адаптировать их физическую форму и функциональность, чтобы наилучшим образом удовлетворить эти потребности, предлагая плавную интеграцию интеллекта и физических возможностей».
На данный момент роботы ограничены основными задачами, такими как ходьба, путем отслеживания команд скорости или ходьбы по грубой местности. Но группа изучает добавление датчиков и других гаджетов в способности платформы, которые откроют дверь для подъема по лестнице и избегали динамических препятствий.
«Будущее робототехники — это не только машины; речь идет о том, как люди и машины сотрудничают, чтобы сформировать наш мир», — добавил Чен. «Используя силу генеративного ИИ, эта работа приближает нас к будущему, где роботы — это не просто инструменты, но и партнеры в области творчества и инноваций».
Больше информации:
Райан П. Рингель и др., Text2Robot: эволюционный дизайн робота из описания текста, arxiv (2024). Doi: 10.48550/arxiv.2406.19963
Информация журнала:
Arxiv предоставлен Университетом Дьюка
Цитирование: Платформа Text2Robot использует генеративное ИИ для проектирования и доставки функциональных роботов только с несколькими произнесенными словами (2025, 10 апреля), полученные 10 апреля 2025 года из этого документа подлежат авторским праву. Помимо каких -либо справедливых сделок с целью частного исследования или исследования, никакая часть не может быть воспроизведена без письменного разрешения. Контент предоставляется только для информационных целей.