SAP спонсировала этот пост.
БЕРЛИН, ГЕРМАНИЯ – SAP SE, немецкий гигант программного обеспечения для бизнеса, на этой неделе проводит в Берлине ежегодное мероприятие TechEd, и никого не удивит тот факт, что компания уделяет большое внимание искусственному интеллекту в своих объявлениях. В конце концов, искусственный интеллект уже был в центре внимания флагманской конференции компании Sapphire ранее. Однако, что может стать неожиданностью, так это то, что SAP сегодня анонсировала свою первую модель большого языка (LLM): SAP-RPT-1.
Компания называет SAP-RPT-1, который станет общедоступным позднее в этом году, «первой реляционной базовой моделью предприятия», поскольку она изначально была разработана, чтобы помочь пользователям работать с реляционными и структурированными бизнес-данными. Он будет доступен на платформе SAP, а также в виде модели с открытым весом на Hugging Face.
«Мы увидели пробел в отрасли», — сказал мне Бхарат Сандху, директор по маркетингу SAP Business Technology Platform (BTP), когда я спросил его о том, почему компания решила построить свою собственную модель. Традиционно LLM в первую очередь обучаются на огромных объемах неструктурированных данных. Из-за этого, отметил Сандху, они, как правило, преуспевают в предсказании текста, но с трудом справляются с математикой.
Схема архитектуры для модели ConTextTab, которая теперь называется SAP-RPT-1 (Фото: SAP).
RPT (произносится как «быстрый») означает «реляционный предварительно обученный преобразователь», и его основное внимание уделяется прогнозированию результатов распространенных бизнес-сценариев, а не следующего слова в предложении. Это уже давно является областью применения различных алгоритмов глубокого и машинного обучения, но модели реляционной основы в настоящее время являются очень активной областью исследований, и стоит отметить, что есть несколько стартапов, таких как Kumo, которые также работают в этой области.
Исследовательская группа SAP опубликовала в начале этого года подробный документ о своих исследованиях в области LLM и табличных данных. В то время модель еще называлась ConTextTab. В отличие от большинства разработчиков моделей, SAP сообщила, что для обучения своей модели она использовала набор данных Tremendous TabLib Trawl (T4). Этот набор данных размером 1,34 ТБ от Approximate Labs содержит около 3,1 миллиона таблиц, которые варьируются от спортивных данных до данных о выбросах промышленных предприятий Литвы.
Поскольку модель SAP была предварительно обучена для этого варианта использования, SAP утверждает, что эта новая модель позволит ее клиентам обойти любое дополнительное обучение или тонкую настройку, если они хотят, чтобы она анализировала их структурированные данные. Используя контекстное обучение, SAP-RPT-1 может выполнять классификацию и регрессию табличных данных с помощью простого вызова API.
«Проблема традиционного машинного обучения заключается в том, что вам необходимо обучать модель», — сказал Сандху. «У вас должны быть данные. Вы должны убедиться, что они не слишком предвзяты в том или ином отношении. Вы должны их обучить, поэтому это требует времени и опыта. Таким образом, RPT-1, по сути, представляет собой общую реляционную модель и может выполнять такие общие виды предсказаний, прогнозирования и все остальное на табличных данных».
Для пользователей, которые хотят попробовать эту модель, SAP также запускает бесплатный веб-интерфейс, получивший название SAP-RPT Playground (хотя тип файла ограничен файлами CSV с максимальным количеством 2073 строк и 50 столбцов). Приведенные примеры сосредоточены на многих стандартных случаях использования, которые SAP ожидает от этой модели, таких как прогнозирование предстоящих потребностей в обслуживании, платежных рисков и оттока клиентов.
SAP — лидер рынка корпоративного программного обеспечения, превращающий предприятия в интеллектуальные и устойчивые предприятия. Наши приложения и услуги позволяют клиентам в 25 отраслях по всему миру работать прибыльно и постоянно адаптироваться. SAP помогает миру работать лучше и улучшать жизнь людей. Узнайте больше Последние новости SAP TRENDING STORIES YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одного эпизода. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Прежде чем присоединиться к The New Stack в качестве старшего редактора по искусственному интеллекту, Фредерик был корпоративным редактором в TechCrunch, где освещал все, от появления облака и первых дней Kubernetes до появления квантовых вычислений…. Подробнее от Фредерика Лардинуа