Дилемма данных AI: баланс инноваций с управлением Ironclad

Снежинка спонсировала этот пост.

В ландшафте, где правила конфиденциальности данных становятся все более строгими, а модели искусственного интеллекта требуют доступа к обширным, разнообразным наборам данных, традиционные рамки безопасности терпят неудачу. И от многонационального сотрудничества до внутренних силосов данных, необходимость нового, ориентированного на данные подход к управлению ИИ имеет первостепенное значение.

Независимо от того, сотрудники ли сотрудники между внутренними командами, внешними партнерами или новыми рынками организации должны обеспечить, чтобы их конфиденциальные данные оставались защищенными и соответствующими местным законам-и традиционные рамки безопасности не созданы для учета жидкости ИИ, жаждущего данных.

Например, многонациональная компания, обучающая агента по поддержке клиентов с AI, необходимо объединить информацию из различных региональных офисов, каждый из которых подлежит различным законам о конфиденциальности данных, таких как GDPR в Европе и CCPA в Калифорнии. Или финансовое учреждение, использующее ИИ для обнаружения мошенничества, должно извлечь данные из групп риска, соблюдения требований и обслуживания клиентов, каждый из которых имеет отдельный контроль доступа, не нарушая внутреннюю политику безопасности.

Итак, как организации могут достичь этого, не введя риск в их организации? Чтобы разблокировать весь потенциал ИИ, предприятиям нужен новый подход к безопасности и соответствию, который позволяет регулировать сотрудничество по дизайну. Рассматривая безопасность как основу, а не как запоздалую мысль, организации могут использовать все свои данные, чтобы уверенно масштабировать инновации искусственного интеллекта — без ответственности ИИ.

Безопасное управление данными в течение жизненного цикла данных

Прежде чем мы пойдем, как создать защищенную основу данных, давайте поговорим о том, почему. Любая успешная стратегия ИИ требует безопасной и управляемой стратегии данных, основанной на способной современной платформе данных.

Организации, которые создают безопасность и управление непосредственно в их инфраструктуру данных, получают конкурентное преимущество: они могут двигаться быстрее, получить доступ к более разнообразным наборам данных и более широко развернуть ИИ по всему предприятию, сохраняя при этом доверие с клиентами.

Это верно во всем целостном жизненном цикле данных, из первоначального сбора необработанных данных в «бронзовом слое», таких как билеты поддержки клиентов, содержащие неструктурированный текст и конфиденциальная личная информация (PII), путем трансформации в «Серебряном слое», где данные очищаются, нормализованы и PII приводятся в силу или подключенные, и ультрализованы, что «Goldery». (Обогащенные наборы данных с соответствующими элементами управления доступом, которые могут безопасно обучить модели анализа настроений или чат -боты обслуживания клиентов).

На каждом этапе протоколы безопасности и управления гарантируют, что данные остаются защищенными, в то время как все еще доступны для инноваций, основанных на искусственном интеллекте.

Советы по использованию самого ценного актива для ИИ: данные

Для организаций, направляющих перекресток между потенциалом ИИ и защитой данных, несколько ключевых стратегий могут помочь сохранить деликатный баланс, чтобы избежать риска.

1. Создайте, где живут ваши данные

Наиболее безопасные реализации искусственного интеллекта следуют фундаментальному принципу: принесите модели ИИ непосредственно в данные, а не данные в модели. Совместное расположение систем ИИ в рамках существующих границ безопасности вашей платформы данных, организации могут значительно снизить риски воздействия.

Стратегическая близость также гарантирует, что конфиденциальная информация никогда не оставляет безопасной среды организаций во время обучения или вывода. Этот подход решает ключевые проблемы регулирования путем поддержания географического заключения-сохраняя данные в рамках утвержденных юрисдикций и предотвращение несанкционированных перекрестных переводов, которые могут вызвать нарушения соответствия.

Создание четкого обеспечения границ с помощью технического контроля также гарантирует, что модели ИИ работают исключительно в рамках экосистемы управляемой организации, создавая безопасную основу для инноваций, без ущерба для стандартов защиты.

2. Знайте, с чем вы работаете

Вы не можете защитить то, что не видите. Реализация надежных возможностей обнаружения данных позволяет организациям автоматически идентифицировать, классифицировать и тететь конфиденциальную информацию по всему ландшафту данных.

Инструменты автоматической классификации могут сканировать структурированные и неструктурированные данные, идентифицируя PII, защищенную медицинскую информацию (PHI) и другие конфиденциальные элементы, которые требуют специальной обработки. Эти системы могут генерировать описательные метаданные, которые улучшают как поиск, так и управление, гарантируя, что соответствующие элементы управления применяются на основе чувствительности данных.

3. Обеспечение интеллектуального управления

По мере роста сложности данных, статические модели управления становятся неадекватными. Ведущие организации выходят за рамки контроля доступа на основе ролей (RBAC) к более моделям с учетом контекста, таких как управление дискреционным доступом (DAC), которые могут принимать более умные решения о том, кто может получить доступ к тому, что, например, маскировка на уровне столбцов, чтобы скрыть конфиденциальные данные в определенных столбцах или фильтрации строк для управления видимостью данных на основе разрешений пользователей.

Предоставление доступа на основе атрибутов пользователя (таких как роль, местоположение и цель), атрибуты ресурсов (такие как чувствительность или классификация данных) и атрибуты окружающей среды (такие как время или местоположение) позволяет обеспечить детальный, контекстный контроль доступа. При этом, вызов правильного баланса между конфиденциальностью и утилитой данных является сложной задачей — слишком много шума может снизить точность модели, в то время как слишком мало может подвергать чувствительные закономерности.

Эти динамические системы рассматривают несколько факторов — кто является пользователем, какие данные они получают, откуда и для какой цели — до предоставления соответствующих разрешений. В сочетании с технологиями маскирования данных в реальном времени организации могут по-разному представлять один и тот же набор данных различным пользователям на основе их уровня авторизации, максимизируя утилиту данных при минимизации уязвимостей.

Помимо стандартных управления на основе ролей, эти системы также должны включать в себя дополнительные политики безопасности и управления, такие как маскирование столбцов, политики доступа к строке и политики конфиденциальности, чтобы предоставить многоуровневые элементы управления, которые еще больше ограничивают доступ и защищают конфиденциальную информацию. Организации также все чаще используют генеративные ИИ и языковые модели внутренне для укрепления и обеспечения безопасности, используя их для обнаружения аномалий, автоматизации обеспечения соблюдения политики и обеспечения более последовательного соответствия в крупных распределенных данных.

Этот подход позволяет ученым -ученым обучать модели на богатых наборах данных, без просмотра конфиденциальных элементов, обеспечивая соответствие такими правилами, как GDPR и CCPA, при этом извлекая ценную информацию.

4. Поддерживать комплексный надзор, соблюдение и управление

В современной нормативной среде документирование того, что происходит с вашими данными, так же важно, как и их защита. Реализация надежного отслеживания линии данных создает проверку о том, как информация протекает через ваши системы и в модели искусственного интеллекта.

Эта прозрачность не только удовлетворяет растущим нормативным требованиям, но и укрепляет организационное доверие к выходу искусственного интеллекта, четко демонстрируя происхождение данных обучения. Системы дополнительного мониторинга должны постоянно проверять модели доступа, обнаруживая аномальное поведение, которое может указывать на проблемы безопасности. Следовательно, надзор должен быть разработан на основе конкретных сценариев современного использования, таких как безопасные и управляемые данные и обмен приложениями, а также создание защищенных приложений для ИИ.

Поддерживая подробные записи как преобразования данных, так и схемы использования, организации могут быстро реагировать на нормативные запросы и уверенно продемонстрировать свою приверженность ответственному развитию ИИ.

Путь вперед: безопасность данных и ИИ на одной платформе

В эпоху, когда нарушения данных делают заголовки, а правила затягиваются во всем мире, способность сбалансировать утилиту данных с защитой конфиденциальности является не просто критическим отличием, а стратегическим бизнесом. Организации, которые могут решить эту проблему, могут раскрыть истинный преобразующий потенциал ИИ, обеспечивая при этом их самый ценный актив.

Snowflake позволяет каждой организации мобилизовать свои данные с помощью облака данных Snowflake. Клиенты используют облако данных для объединения данных, обнаружив и надежно обмениваться данными, приложениями данных о мощности, а также выполняют различные рабочие нагрузки AI/ML и аналитические рабочие нагрузки по нескольким облакам и географии. Узнайте больше последних из Snowflake Trending Stories youtube.com/thenewstack Tech Moving быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Артин Аванес присоединилась к Snowflake в 2015 году в качестве первого менеджера по продукту, создав более широкую команду и экосистему с нуля. Как глава основной платформы данных в Snowflake, он отвечает за создание и масштабирование команд управления продуктами … Подробнее от Artin Avanes

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *