런던 퀸 메리 대학의 새로운 연구에 따르면 AI가 생성한 음성은 인간 음성과 구별할 수 없을 정도로 사실적인 수준을 달성했으며, 이는 의사소통, 보안 및 윤리에 있어서 기술이 하는 역할에 대한 중요한 의문을 제기합니다.
AI 음성 기술은 놀라운 이정표를 세웠습니다. 런던 퀸 메리 대학교의 새로운 연구에 따르면 합성 음성이 이제 실제 사람의 음성과 구별할 수 없을 정도로 발전하여 인공지능 역량에 있어 상당한 도약을 이루었습니다.
많은 사람들이 오랫동안 AI가 생성하는 음성은 설득력이 없고 사람의 목소리와 쉽게 구분된다고 생각해 왔습니다. 그러나 최근 연구에 따르면 이러한 인식은 점점 시대에 뒤떨어지고 있습니다.
게재 PLOS One 저널에 발표된 연구에 따르면, 실제 인간의 목소리와 두 가지 유형의 AI가 생성한 목소리를 비교했습니다. 하나는 특정 사람을 모방하도록 복제된 목소리이고, 다른 하나는 특정 인간 대응물이 없는 대규모 음성 모델로부터 생성된 목소리입니다.
연구 참가자들은 목소리의 사실성, 지배력, 신뢰성을 평가했습니다.
연구 결과에 따르면 AI가 생성한 목소리는 사람 목소리만큼 생생하게 들려 청취자가 구분하기 어려울 정도였습니다. 흥미롭게도, 이러한 목소리는 종종 사람 목소리보다 더 지배적인 것으로, 어떤 경우에는 더 신뢰할 만한 것으로 인식되었습니다.
"AI가 생성하는 목소리는 이제 우리 주변에 널려 있습니다. 알렉사나 시리에게 말을 걸거나, 자동화된 고객 서비스 시스템에 전화를 걸어본 경험이 있을 겁니다." 이 연구의 공동 저자이자 런던 퀸 메리 대학교 심리학과 선임 강사인 나딘 라반은 보도자료를 통해 이렇게 밝혔습니다. "이러한 음성은 실제 사람의 목소리처럼 들리지는 않지만, AI 기술이 자연스럽고 사람 목소리처럼 들리는 음성을 생성하는 것은 시간문제였습니다. 이번 연구는 그 시대가 왔음을 보여주며, 사람들이 이러한 사실적인 목소리를 어떻게 인식하는지 시급히 이해할 필요가 있음을 보여줍니다."
라반은 팀이 상업적으로 이용 가능한 소프트웨어를 사용하여 얼마나 쉽고 빠르게 음성 복제본을 만들 수 있는지 강조했습니다.
"이 과정에는 최소한의 전문 지식, 몇 분 분량의 음성 녹음, 그리고 거의 비용이 필요하지 않았습니다."라고 그녀는 덧붙였습니다. "AI 음성 기술이 얼마나 접근하기 쉽고 정교해졌는지 보여주는 사례입니다."
AI 음성 합성 기술의 급속한 발전은 윤리적, 저작권적, 그리고 보안적 측면에서 심각한 문제를 야기합니다. 특히 사실적인 음성 생성 기술의 접근성과 발전이 높아짐에 따라, 잘못된 정보, 사기, 그리고 사칭에 대한 우려가 매우 중요해졌습니다.
하지만 긍정적인 점으로, 라반은 AI 음성 기술이 흥미로운 기회를 제공할 수 있는 잠재력을 강조했습니다.
그녀는 "맞춤형 고품질 합성 음성을 통해 사용자 경험을 향상시킬 수 있는 접근성, 교육 및 커뮤니케이션 개선에 응용할 수 있을 것"이라고 말했습니다.
출처: 퀸 메리 런던 대학교

