ChatPaper.aiChatPaper

IDEAW: 역가능한 이중 삽입을 이용한 견고한 신경 음성 워터마킹

IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding

September 29, 2024
저자: Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
cs.AI

초록

오디오 워터마킹 기술은 메시지를 오디오에 삽입하고 워터마킹된 오디오에서 메시지를 정확하게 추출합니다. 기존 방법은 전문가 경험을 기반으로 신호의 시간 영역이나 변환 영역에 워터마크를 삽입하는 알고리즘을 개발했습니다. 심층 신경망의 발전으로 심층 학습 기반의 신경 오디오 워터마킹 기술이 등장했습니다. 전통적인 알고리즘과 비교하여, 신경 오디오 워터마킹은 훈련 중 다양한 공격을 고려하여 더 나은 견고성을 달성합니다. 그러나 현재의 신경 워터마킹 방법은 용량이 낮고 만족스럽지 못한 인식 능력을 가지고 있습니다. 더불어, 신경 오디오 워터마킹에서 더욱 중요한 워터마크 위치 결정 문제는 충분히 연구되지 않았습니다. 본 논문에서는 효율적인 위치 결정을 위해 이중 삽입 워터마킹 모델을 설계합니다. 또한 견고성 훈련에서 불변 신경망의 공격 계층이 모델에 미치는 영향을 고려하여, 모델을 향상시켜 이성과 안정성을 모두 향상시킵니다. 실험 결과 제안된 IDEAW 모델은 기존 방법과 비교하여 더 높은 용량과 더 효율적인 위치 결정 능력으로 다양한 공격에 견딜 수 있음을 보여줍니다.
English
The audio watermarking technique embeds messages into audio and accurately extracts messages from the watermarked audio. Traditional methods develop algorithms based on expert experience to embed watermarks into the time-domain or transform-domain of signals. With the development of deep neural networks, deep learning-based neural audio watermarking has emerged. Compared to traditional algorithms, neural audio watermarking achieves better robustness by considering various attacks during training. However, current neural watermarking methods suffer from low capacity and unsatisfactory imperceptibility. Additionally, the issue of watermark locating, which is extremely important and even more pronounced in neural audio watermarking, has not been adequately studied. In this paper, we design a dual-embedding watermarking model for efficient locating. We also consider the impact of the attack layer on the invertible neural network in robustness training, improving the model to enhance both its reasonableness and stability. Experiments show that the proposed model, IDEAW, can withstand various attacks with higher capacity and more efficient locating ability compared to existing methods.

Summary

AI-Generated Summary

PDF22November 13, 2024