뷰페이지

“15초만 듣고 목소리 뚝딱”… 오픈AI, ‘보이스 엔진’ 공개

“15초만 듣고 목소리 뚝딱”… 오픈AI, ‘보이스 엔진’ 공개

이재연 기자
이재연, 박성국 기자
입력 2024-04-01 01:23
업데이트 2024-04-01 01:23
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

오용 우려에 일반 출시는 회의적
美는 ‘엘비스법’서 음성조작 금지
132조원 들여 MS와 슈퍼컴 구축

이미지 확대
생성형 인공지능(AI) ‘챗GPT’ 개발사인 오픈AI가 사람 음성을 학습해 모방 음성을 생성하는 AI 도구 ‘보이스 엔진’을 개발해 공개했다. 최근 미국 테네시주가 AI가 사람 음성을 베끼는 것을 금지하는 일명 ‘엘비스(Elvis) 법안’에 미국 최초로 서명한 것과 맞물려 AI 음성이 이미지 생성과 마찬가지로 딥페이크(AI 가짜 영상·음성 조작물) 유포, 개인 정보 해킹 등에 악용될 우려가 제기되고 있다.

오픈AI가 지난 29일(현지시간) 공개한 보이스 엔진 사전실험 결과를 보면 실제 사람 음성 샘플과 이를 이용해 보이스 엔진으로 생성한 음성은 구분이 거의 힘들 만큼 비슷했다. 회사 측은 15초 분량의 음성 샘플만 있으면 이런 AI 음성을 만들어 낼 수 있다고 밝혔다.

언어 질환 환자용 치료 애플리케이션, 장애인 소통 기기에 지원된 이 도구는 동영상의 다국어 번역, 교육 음성 해설, 실시간 맞춤형 응답 등 광범위하게 상용될 수도 있다.

다만 오픈AI는 “현재로선 이 기술을 ‘미리 보여주기’(preview)만 하되 일반에 출시하진 않기로 했다”며 “인조 음성의 오용 가능성 때문에 조심스럽게 접근하고 있다”고 선을 그었다. 이어 “사람 목소리를 닮은 음성을 생성하는 것은 심각한 위험을 야기하며, 선거가 있는 해엔 특히 더 그렇다”면서 “우리는 미국과 해외 정부, 미디어, 시민사회 등과 협력해 피드백을 반영하기 위해 노력하고 있다”고 강조했다. 지난달 회사가 글을 동영상으로 바꿔 주는 AI ‘소라’를 개발했을 때와 동일한 우려가 불거지는 것을 사전에 차단하기 위한 포석이다.

실제로 올해 미 대선을 앞두고 지난 1월엔 뉴햄프셔주 프라이머리(예비선거) 전날 조 바이든 대통령을 사칭한 가짜 전화로 투표 거부를 독려하는 사례가 나오면서 음성 조작 우려가 현실화됐다.

뉴욕타임스(NYT)는 “이미지나 비디오 생성과 마찬가지로 음성 생성도 소셜미디어에 허위 정보를 퍼뜨리는데 도움이 될 수 있고 범죄자가 온라인이나 전화 통화에서 다른 이를 사칭할 수도 있다”고 지적했다.

이와 관련해 빌 리 테네시 주지사는 지난 21일 AI를 사용해 사람 목소리를 베끼는 것을 금지하는 엘비스 법에 미국 최초로 서명했다. 정식 명칭이 ‘초상·음성·이미지 보안 보장법’이지만 로큰롤의 제왕으로 군림한 엘비스 프레슬리의 이름으로 별칭이 붙은 건 사전 허가 없이 예술가 저작을 사용하는 것을 보호하기 위한 법안이기 때문이다.

테네시주는 로큰롤 탄생지인 멤피스, 컨트리 뮤직 본산인 내슈빌이 위치한 대중음악 산업의 메카로, 4500개 이상의 공연장, 6만 1000개 이상의 일자리로 한 해 수십억 달러를 창출하고 있다. 엘비스 법은 지역 핵심 산업이 AI로 타격받는 것을 막은 선제 조치인 셈이다. 리 주지사는 “AI가 나쁜 행위자들의 손에 넘어가면 대중음악 산업이 파괴될 수 있다”고 경고했다.

AI업계 혁신을 주도하고 있는 오픈AI는 마이크로소프트(MS)와 1000억 달러(약 132조 6000억원)를 투자해 AI 슈퍼컴퓨터를 포함한 데이터센터 구축도 추진하고 있다. 오픈AI와 MS의 ‘스타게이트’는 6년짜리 프로젝트로, AI 모델 구동을 위한 슈퍼컴퓨터와 이를 위한 초대형 데이터센터를 조성하는 사업이다. 현존 최고 수준 데이터센터와 비교해 100배 이상 큰 규모라고 정보기술(IT) 전문매체 디인포메이션이 보도했다.

데이터센터에는 슈퍼컴퓨터 구동을 위해 특별 제작된 서버 칩 수백만 개가 들어간다. 생성형 AI 연산을 위해서는 그래픽처리장치(GPU) 같은 AI 반도체를 연결하고 대규모 데이터 처리 작업을 수행할 컴퓨팅 시스템이 필요하다. 데이터센터에는 여러 공급업체의 다른 칩을 사용할 것으로 알려졌다.

이는 샘 올트먼 오픈AI 최고경영자(CEO)가 AI 반도체 시장을 90% 이상 점유한 엔비디아에 대응해 ‘AI 반도체 동맹’을 구축하려는 행보와도 연결된다. 올트먼 CEO는 지난 1월 직접 한국을 찾아 삼성전자, SK하이닉스와 협력 방안을 논의했다. 이때 이재용 삼성전자 회장, 최태원 SK그룹 회장도 만난 것으로 알려졌다.
워싱턴 이재연 특파원·서울 박성국 기자
2024-04-01 8면

많이 본 뉴스

국민연금 개혁 당신의 선택은?
국민연금 개혁 논의가 이어지고 있습니다. 국회 연금개혁특별위원회 산하 공론화위원회는 현재의 보험료율(9%), 소득대체율(40%)을 개선하는 2가지 안을 냈는데요. 당신의 생각은?
보험료율 13%, 소득대체율 50%로 각각 인상(소득보장안)
보험료율 12%로 인상, 소득대체율 40%로 유지(재정안정안)
광고삭제
위로