Исследователи безопасности предупреждают, что данные, подвергшиеся воздействию Интернета, даже на мгновение могут задержаться в онлайн -генеративных чат -ботах ИИ, таких как Microsoft Copilot, еще долго после того, как данные станут частными.
Согласно новым выводам из израильской компании по кибербезопасности, в том числе тысячи некогда публичных репозиториев GitHub от некоторых крупнейших в мире компаний, включая Microsoft’s, в соответствии с новыми результатами Lasso, израильской компании по кибербезопасности.
Соучредитель Лассо Офир Дрор сказал TechCrunch, что компания нашла контент из своего собственного репозитория GitHub, появившегося в Copilot, потому что она была проиндексирована и кэширована поисковой системой Microsoft Bing. Дрор сказал, что репозиторий, который был ошибочно обнародован в течение короткого периода, с тех пор был назначен на частную часть, и доступ к нему на GitHub вернул ошибку «страница не найдена».
«На« Копилоте », достаточно удивительно, мы нашли один из наших частных репозиториев», — сказал Дрор. «Если бы я просмотрел Интернет, я бы не увидел эти данные. Но любой в мире может задать копило правильный вопрос и получить эти данные ».
После того, как он понял, что любые данные о GitHub, даже кратко, могут быть потенциально подвергаться таким инструментам, как Copilot, Лассо исследовал дальнейшее исследование.
Лассо извлек список репозиториев, которые были общедоступными в любой точке в 2024 году, и определили репозитории, которые с тех пор были удалены или установлены на частные. Используя механизм кэширования Bing, компания обнаружила, что более 20 000 с тех пор, с тех пор частные репозитории GitHub по-прежнему имели данные через Copilot, что затрагивает более 16 000 организаций.
По словам Лассо, пострадавшие организации включают Amazon Web Services, Google, IBM, PayPal, Tencent и Microsoft. Для некоторых пострадавших компаний можно было бы предложено вернуть конфиденциальные архивы Github, которые содержат интеллектуальную собственность, конфиденциальные корпоративные данные, ключи доступа и токены, сообщила компания.
Лассо отметил, что он использовал Copilot для извлечения содержимого репозитория GitHub — с тех пор, как Microsoft удален Microsoft — который размещал инструмент, позволяющий создавать «оскорбительные и вредные» изображения ИИ с использованием сервиса Microsoft Cloud AI.
Дрор сказал, что Лассо обратился к всем пострадавшим компаниям, которые «серьезно пострадали» от воздействия данных и посоветовали им вращать или отозвать любые нарушенные ключи.
Ни одна из пострадавших компаний, названных Лассо, не ответила на вопросы TechCrunch. Microsoft также не ответила на запрос TechCrunch.
Лассо сообщила Microsoft о своих выводах в ноябре 2024 года. Microsoft сказала Lasso, что она классифицировала проблему как «низкую серьезность», заявив, что это кэширование было «приемлемым», Microsoft больше не включала ссылки на кэш Bing в результаты поиска, начиная с декабря 2024 года.
Тем не менее, Лассо говорит, что, хотя функция кэширования была отключена, Copilot по -прежнему имел доступ к данным, даже если она не была видна с помощью традиционных веб -поисков, что указывает на временное исправление.