Het opbouwen van vertrouwen: Fundamenten van veiligheid, beveiliging en transparantie in AI.

Building Trust: Foundations of Security, Safety and Transparency in AI

November 19, 2024
Auteurs: Huzaifa Sidhpurwala, Garth Mollett, Emily Fox, Mark Bestavros, Huamin Chen
cs.AI

Samenvatting

Deze paper verkent het snel evoluerende ecosysteem van publiekelijk beschikbare AI-modellen en hun mogelijke implicaties voor het beveiligings- en veiligheidslandschap. Naarmate AI-modellen steeds meer voorkomen, is het cruciaal om inzicht te hebben in hun potentiële risico's en kwetsbaarheden. We bekijken de huidige beveiligings- en veiligheidsscenario's en benadrukken uitdagingen zoals traceerbaarheidsproblemen, remediëring en het ogenschijnlijke gebrek aan processen voor de levenscyclus en eigendom van AI-modellen. Er worden uitgebreide strategieën voorgesteld om de beveiliging en veiligheid voor zowel modelontwikkelaars als eindgebruikers te verbeteren. Het doel van deze paper is om enkele van de fundamentele stukken te bieden voor meer gestandaardiseerde beveiliging, veiligheid en transparantie in de ontwikkeling en werking van AI-modellen en de grotere open ecosystemen en gemeenschappen die zich rondom hen vormen.
English
This paper explores the rapidly evolving ecosystem of publicly available AI models, and their potential implications on the security and safety landscape. As AI models become increasingly prevalent, understanding their potential risks and vulnerabilities is crucial. We review the current security and safety scenarios while highlighting challenges such as tracking issues, remediation, and the apparent absence of AI model lifecycle and ownership processes. Comprehensive strategies to enhance security and safety for both model developers and end-users are proposed. This paper aims to provide some of the foundational pieces for more standardized security, safety, and transparency in the development and operation of AI models and the larger open ecosystems and communities forming around them.

Summary

AI-Generated Summary

PDF102November 20, 2024