ChatPaper.aiChatPaper

"Non è una rappresentazione di me": Esaminando il Pregiudizio sull'Accento e l'Esclusione Digitale nei Servizi di Sintesi Vocale basati sull'Intelligenza Artificiale

"It's not a representation of me": Examining Accent Bias and Digital Exclusion in Synthetic AI Voice Services

April 12, 2025
Autori: Shira Michel, Sufi Kaur, Sarah Elizabeth Gillespie, Jeffrey Gleason, Christo Wilson, Avijit Ghosh
cs.AI

Abstract

I recenti progressi nelle tecnologie di generazione del parlato e clonazione vocale basate sull'intelligenza artificiale (IA) hanno prodotto un parlato naturalistico e una replica vocale accurata, tuttavia il loro impatto sui sistemi sociotecnici attraverso diversi accenti e tratti linguistici non è ancora completamente compreso. Questo studio valuta due servizi vocali sintetici basati su IA (Speechify e ElevenLabs) attraverso un approccio misto che utilizza sondaggi e interviste per valutare le prestazioni tecniche e scoprire come le esperienze vissute dagli utenti influenzino le loro percezioni delle variazioni di accento in queste tecnologie vocali. I nostri risultati rivelano disparità nelle prestazioni tecniche tra cinque accenti regionali di lingua inglese e dimostrano come le attuali tecnologie di generazione del parlato possano involontariamente rafforzare i privilegi linguistici e la discriminazione basata sull'accento, potenzialmente creando nuove forme di esclusione digitale. Nel complesso, il nostro studio evidenzia la necessità di un design inclusivo e di una regolamentazione, fornendo spunti pratici per sviluppatori, responsabili politici e organizzazioni per garantire tecnologie vocali basate su IA eque e socialmente responsabili.
English
Recent advances in artificial intelligence (AI) speech generation and voice cloning technologies have produced naturalistic speech and accurate voice replication, yet their influence on sociotechnical systems across diverse accents and linguistic traits is not fully understood. This study evaluates two synthetic AI voice services (Speechify and ElevenLabs) through a mixed methods approach using surveys and interviews to assess technical performance and uncover how users' lived experiences influence their perceptions of accent variations in these speech technologies. Our findings reveal technical performance disparities across five regional, English-language accents and demonstrate how current speech generation technologies may inadvertently reinforce linguistic privilege and accent-based discrimination, potentially creating new forms of digital exclusion. Overall, our study highlights the need for inclusive design and regulation by providing actionable insights for developers, policymakers, and organizations to ensure equitable and socially responsible AI speech technologies.

Summary

AI-Generated Summary

PDF22April 17, 2025