Vertrauen aufbauen: Grundlagen von Sicherheit, Schutz und Transparenz in KI

Building Trust: Foundations of Security, Safety and Transparency in AI

November 19, 2024
Autoren: Huzaifa Sidhpurwala, Garth Mollett, Emily Fox, Mark Bestavros, Huamin Chen
cs.AI

Zusammenfassung

Dieses Papier untersucht das sich rasch entwickelnde Ökosystem öffentlich verfügbarer KI-Modelle und deren potenzielle Auswirkungen auf die Sicherheits- und Sicherheitslandschaft. Mit der zunehmenden Verbreitung von KI-Modellen ist es entscheidend, ihre potenziellen Risiken und Schwachstellen zu verstehen. Wir überprüfen die aktuellen Sicherheits- und Sicherheitsszenarien und heben Herausforderungen wie Tracking-Probleme, Fehlerbehebung und das offensichtliche Fehlen von KI-Modell-Lebenszyklus- und Eigentumsprozessen hervor. Es werden umfassende Strategien zur Verbesserung der Sicherheit und Sicherheit für sowohl Modellentwickler als auch Endbenutzer vorgeschlagen. Dieses Papier zielt darauf ab, einige der grundlegenden Elemente für eine standardisierte Sicherheit, Sicherheit und Transparenz bei der Entwicklung und dem Betrieb von KI-Modellen sowie den größeren offenen Ökosystemen und Gemeinschaften, die sich um sie bilden, bereitzustellen.
English
This paper explores the rapidly evolving ecosystem of publicly available AI models, and their potential implications on the security and safety landscape. As AI models become increasingly prevalent, understanding their potential risks and vulnerabilities is crucial. We review the current security and safety scenarios while highlighting challenges such as tracking issues, remediation, and the apparent absence of AI model lifecycle and ownership processes. Comprehensive strategies to enhance security and safety for both model developers and end-users are proposed. This paper aims to provide some of the foundational pieces for more standardized security, safety, and transparency in the development and operation of AI models and the larger open ecosystems and communities forming around them.

Summary

AI-Generated Summary

PDF102November 20, 2024