Как агенты ИИ начинают автоматизировать предприятие

До сих пор 2025 год был годом агентов ИИ, где генеративная технология ИИ используется для автоматизации действий. Мы видели дебют оператора Openai, демонстрируя прототип агента, который может просматривать Интернет и выполнять для вас задачи. Теперь новая компания под названием Orby привносит тот же подход к предприятию, с типом модели ИИ, который она называет моделью крупной действия (LAM).

Я поговорил с соучредителем Орби и техническим директором Уиллом Лу, о агентах на предприятии. До Орби Лу был инженерным лидером в Google Cloud AI.

Так что же такое лам и чем именно он отличается от LLM? Лу объяснил, что — в отличие от LLMS, какой текст обрабатывает текст или изображения в качестве ввода и генерируют текст или изображения в качестве вывода — LAM разработаны специально для задач автоматизации в средах предприятия. Он упомянул Salesforce и SAP в качестве примеров ИТ -программных продуктов, которые изучил LAM, чтобы определить задачи, которые могут быть автоматизированы.

LAMS предпринимает действия в качестве ввода, он продолжил — приведя в качестве примеров скриншоты приложения, контент HTML Web -страницы, пользовательские взаимодействия (такие как клики мыши и входы клавиатуры). Он говорит, что LAM Орби может использовать этот контекст для автоматизации сложных рабочих процессов.

Диаграмма Actio Plowing; через вспашку

Следы предприятия программного обеспечения

Лу использовал слово «следы», чтобы описать данные рабочего процесса, которые собирает его основополагающий LAM, называемый Actio. Он сказал, что он собрал «более миллиона трассов, и обычно след может быть длиной от 10 до 50 шагов».

В электронном письме после уточнения LU расширил определение «трассировки»:

«… След — это последовательность действий для выполнения конкретной задачи. Действие отражается в виде комбинации контекстов, экрана и HTML для веб -приложений и деревьев доступности для настольных приложений, а также событий, таких как клик мыши, тип ключа и т. Д. »

Далее он объяснил, что их программное обеспечение активно исследует среды корпоративного программного обеспечения (например, Salesforce, ERP Systems) для определения задач, которые могут быть автоматизированы. Агент автономно пытается выполнить эти задачи, и наиболее эффективные попытки (успешные следы) используются для тонкой настройки модели.

Как и большинство других крупных языковых моделей, Орби обучил Actio открытым веб -данным. Тем не менее, Лу добавил, что они также могут точно настраивать, используя запатентованные данные клиента.

Сравнения с оператором Openai

Решение Орби имеет сходство с оператором Openai, который был запущен ближе к концу января. Оператор, в настоящее время доступный только для пользователей Pro ($ 200 в месяц), был описан Openai как «исследовательский предварительный просмотр агента, который может использовать свой собственный браузер для выполнения задач для вас». В обзоре Кевин Руз из New York Times назвал это «скорее интригующей демонстрацией, чем продуктом, который я рекомендую использовать — и определенно не то, что большинству людей нужно тратить 200 долларов в месяц».

Я спросил Лу, как Орби сравнивает с оператором OpenAI?

По его словам, одно из различий заключается в том, что у Орби есть концепция, которую она называет «заземлением».

«По сути, заземление есть [for] Конкретное действие, которое вы хотите сделать — например, отправьте отчет. Так что это действие, и тогда вы хотите найти элементы, которые могут сделать эту вещь, а затем запустить его. Это называется шагом заземления ».

Эта концепция поступает из проекта, который сделал Орби вместе с Университетом штата Огайо под названием Uground — описанной как «универсальная модель зрительного заземления для поиска элемента действия координат пикселей на GUI». Uground обучался на 10 -метровой элементах с 1,3 -метровых скриншотов.

«Когда дело доходит до действительно сложных, реальных вариантов использования предприятия, мы ожидаем, что технические люди, которые убедитесь, что он работает в масштабе».
— Будет Лу, пахотная техника

Лу также отметил, что у Orby есть программный стек программного обеспечения AI AI, который он предлагает предприятиям.

«Так в основном […] Мы разработали его так, чтобы пользователи могли продемонстрировать, как выполняется задача. Основываясь на этой демонстрации, мы генерируем как описание, так и код в разделе «Описание». Затем […] Разработчики могут прийти, посмотреть на описание и сгенерированный код и вносить изменения в свои потребности, а затем запустить агента на основе кода, который определял приложение ».

Лу добавил, что для простых задач нетехнические сотрудники могут запускать их. Но для более сложных «действий», как правило, участвуют разработчики.

«Когда дело доходит до действительно сложных, реальных вариантов использования предприятия, мы ожидаем, что технические люди, которые убедитесь, что он работает в масштабе. Когда, например, задача в настоящее время выполняется 100 человек, вы хотите убедиться, что виртуальная машина настроена правильно, агент работает там в одной и той же среде, и могут ли они получить доступ ко всем системам и всем Условия ».

Совет для ИТ -директоров

Агенты ИИ, или агент ИИ для использования модного термина, быстро стали приоритетом для рассмотрения ИТ -департаментов. Поэтому я спросил Лу, какой совет он даст ИТ -директорам и другим лидерам ИТ -предприятия, если рассматривать, если и когда использовать агенты искусственного интеллекта.

«Я думаю, что самое важное — найти реальную бизнес -боль, которую ищут пользователи», — ответил он. «А потом, когда дело доходит до бизнес-боли, мы хотим определить шаги, которые очень много времени для пользователей».

Эти шаги могут быть трудоемкими для человеческих сотрудников, но «действительно, очень легко для компьютера», добавил он.

Одним из вариантов использования от клиентов Orby является аудит отчета о расходах.

«Почти у каждого предприятия есть этот процесс, и этот процесс довольно утомите», — сказал Лу. «Вы должны открыть отчет, посмотреть на все квитанции, посмотреть на всю заполненную информацию, а затем проверить, соответствует ли информация […] или нет. А также проверьте эти отчеты против политики, которые определяются компанией — например, нет алкоголя. [allowed].

«… Пока наши агенты получают доступ к системе […] Мы можем войти в систему, а затем провести работу ».
— Лу

Мой инстинктивный последующий вопрос как технический журналист состоял в том, чтобы спросить, к чему программное обеспечение API Orby подключается-например, SAP. Но Лу подтвердил, что все это сделано через агента ИИ; АПИ не требуется.

«Это красота наших решений. Мы [Orby’s software] В основном управляйте этими приложениями, как если бы мы были людьми, работающими в этих системах. Так что нет фактической интеграции. Поэтому, пока наши агенты получают доступ к системе, если у нас есть учетные данные, мы можем войти в систему, а затем проводить работу ».

Итак, как насчет проблем безопасности? Лу подтвердил, что безопасность «всегда является лучшим спросом почти от всех предприятий» и что они работают с каждым клиентом над этим.

Наконец, стоит отметить, что, хотя цель Орби состоит в том, чтобы помочь предприятиям автоматизировать рабочие процессы, пока в курсе всегда есть человек.

«Есть целый агент дизайн рабочего процесса [that] является ядром всего нашего предложения, потому что сегодня модели все еще не работают на 100%, и все равно будет так долго », — сказал Лу. «Таким образом, у нас есть этот процесс человеческого петли встроен по дизайну».

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Ричард Макманус — старший редактор нового стека и пишет о тенденциях разработки веб -и приложений. Ранее он основал ReadWriteWeb в 2003 году и встроил его в один из самых влиятельных технологических новостей в мире. С самого раннего … Подробнее от Ричарда Макмануса

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *