Établir la confiance : Fondements de la sécurité, de la sûreté et de la transparence en IA

Building Trust: Foundations of Security, Safety and Transparency in AI

November 19, 2024
Auteurs: Huzaifa Sidhpurwala, Garth Mollett, Emily Fox, Mark Bestavros, Huamin Chen
cs.AI

Résumé

Cet article explore l'écosystème en évolution rapide des modèles d'IA disponibles publiquement, et leurs implications potentielles sur le paysage de la sécurité. Alors que les modèles d'IA deviennent de plus en plus courants, comprendre leurs risques et vulnérabilités potentiels est crucial. Nous passons en revue les scénarios actuels de sécurité et de sûreté tout en mettant en lumière des défis tels que les problèmes de suivi, la remédiation, et l'absence apparente de processus de cycle de vie et de propriété des modèles d'IA. Des stratégies complètes pour renforcer la sécurité et la sûreté à la fois pour les développeurs de modèles et les utilisateurs finaux sont proposées. Cet article vise à fournir certaines des pièces fondamentales pour une sécurité, une sûreté et une transparence plus standardisées dans le développement et l'exploitation des modèles d'IA et des écosystèmes ouverts plus vastes et des communautés qui se forment autour d'eux.
English
This paper explores the rapidly evolving ecosystem of publicly available AI models, and their potential implications on the security and safety landscape. As AI models become increasingly prevalent, understanding their potential risks and vulnerabilities is crucial. We review the current security and safety scenarios while highlighting challenges such as tracking issues, remediation, and the apparent absence of AI model lifecycle and ownership processes. Comprehensive strategies to enhance security and safety for both model developers and end-users are proposed. This paper aims to provide some of the foundational pieces for more standardized security, safety, and transparency in the development and operation of AI models and the larger open ecosystems and communities forming around them.

Summary

AI-Generated Summary

PDF102November 20, 2024