Het opbouwen van vertrouwen: Fundamenten van veiligheid, beveiliging en transparantie in AI.
Building Trust: Foundations of Security, Safety and Transparency in AI
November 19, 2024
Auteurs: Huzaifa Sidhpurwala, Garth Mollett, Emily Fox, Mark Bestavros, Huamin Chen
cs.AI
Samenvatting
Deze paper verkent het snel evoluerende ecosysteem van publiekelijk beschikbare AI-modellen en hun mogelijke implicaties voor het beveiligings- en veiligheidslandschap. Naarmate AI-modellen steeds meer voorkomen, is het cruciaal om inzicht te hebben in hun potentiële risico's en kwetsbaarheden. We bekijken de huidige beveiligings- en veiligheidsscenario's en benadrukken uitdagingen zoals traceerbaarheidsproblemen, remediëring en het ogenschijnlijke gebrek aan processen voor de levenscyclus en eigendom van AI-modellen. Er worden uitgebreide strategieën voorgesteld om de beveiliging en veiligheid voor zowel modelontwikkelaars als eindgebruikers te verbeteren. Het doel van deze paper is om enkele van de fundamentele stukken te bieden voor meer gestandaardiseerde beveiliging, veiligheid en transparantie in de ontwikkeling en werking van AI-modellen en de grotere open ecosystemen en gemeenschappen die zich rondom hen vormen.
English
This paper explores the rapidly evolving ecosystem of publicly available AI
models, and their potential implications on the security and safety landscape.
As AI models become increasingly prevalent, understanding their potential risks
and vulnerabilities is crucial. We review the current security and safety
scenarios while highlighting challenges such as tracking issues, remediation,
and the apparent absence of AI model lifecycle and ownership processes.
Comprehensive strategies to enhance security and safety for both model
developers and end-users are proposed. This paper aims to provide some of the
foundational pieces for more standardized security, safety, and transparency in
the development and operation of AI models and the larger open ecosystems and
communities forming around them.Summary
AI-Generated Summary