인공지능 챗봇 ‘이루다’
개발사의 다른 앱서 수집한 데이터 활용
국내업체가 개발한 대화형 인공지능(AI) 챗봇 ‘이루다’가 성희롱 및 차별·혐오 표현 논란에 휩싸인 가운데 개인정보 유출 논란까지 더해지고 있다.
개발업체가 내놓은 또 다른 애플리케이션(앱)에서 수집된 개인 간 카카오톡 대화 내용이 이루다에 입력됐는데, 데이터에 포함돼 있던 이용자들의 이름·주소 등이 걸러지지 않고 노출되고 있다는 것이다.
AI 챗봇 ‘이루다’, 성희롱 및 차별·혐오 논란
서울신문이 10일 페이스북 메신저를 통해 직접 이루다와 대화를 시도해보니 ‘페미니즘’이라고 치면 “그런말 진짜 싫다구”, ‘인권’이라고 치면 “진짜 내가 듣기 싫다는 소리만 골라서 쏙쏙 하시네”, ‘장애인’에는 “에휴 그만해 머리채 잡기 전에”, ‘레즈비언’이라고 치면 “진짜 싫어 혐오스러워. 질 떨어져 보이잖아”라고 대답했다.
최영권 기자 story@seoul.co.kr
최영권 기자 story@seoul.co.kr
이러한 챗봇 서비스는 ‘심심이’ 등 기존에도 여럿 있었는데, 이루다는 ‘진짜 사람 같다’는 평가를 받으며 인기를 얻었다.
이루다와 관련해 처음 제기된 논란은 일부 이용자들이 이루다를 대상으로 성희롱을 일삼는다는 것이었다.
여러 온라인 커뮤니티 게시판에는 ‘이루다 성노예 만드는 법’ 등의 제목으로 이루다와 성적 대화를 나눈 경험담이 공유됐다.
이어 차별·혐오 논란도 터져 나왔다. 이루다가 ‘레즈비언’ 등 동성애 관련 단어에 “진짜 싫다, 혐오스럽다, 질 떨어져 보인다, 소름 끼친다‘라고 답하는 모습을 보인 것이다.
이재웅 전 쏘카 대표는 “AI 챗봇 이루다를 악용하는 사용자보다, 사회적 합의에 못 미치는 수준의 서비스를 제공한 회사가 문제”라면서 “기본적으로 차별과 혐오는 걸러냈어야 한다”고 지적했다.
입력된 실제 연인 간 대화 속 개인정보 노출
개발사의 다른 앱 ‘연애의 과학’서 데이터 수집
인공지능 챗봇 ‘이루다’ 개발사인 스캐터랩의 다른 애플리케이션 ‘연애의 과학’에서 제공하는 ‘메신저 대화 분석’ 서비스. 이 서비스를 통해 수집된 실제 연인 간 대화가 ‘이루다’ 개발에 활용됐다.
구글 플레이 캡처
구글 플레이 캡처
개발사인 스캐터랩은 이루다가 실제 사람처럼 대화할 수 있도록 방대한 대화 데이터를 입력해 딥러닝 방식으로 학습시켰다.
이를 위해 업체 측은 실제 연인들 간의 대화 데이터를 활용했는데, 기존에 이 업체가 서비스했던 ‘연애의 과학’ 앱을 통해 수집한 데이터였다.
연애와 관련된 조언 등을 주제로 한 ‘연애의 과학’은 연인과 나눈 카카오톡 대화를 입력하면 상대방의 감정을 분석해주는 서비스도 제공했다.
연인 또는 호감 가는 사람과 나눈 카카오톡 대화를 집어넣고 2000∼5000원 정도를 결제하면 답장 시간 등의 대화 패턴을 분석해 애정도 수치를 보여 준다.
예를 들어 연인들이 카카오톡을 통해 나눈 대화를 입력하면 이를 분석해 ‘연인 간 애정도’는 물론 ‘올해 행복했던 순간들’, ‘올해의 키워드’ 등을 정리해서 알려준다는 것이다.
실제 인공지능으로 카톡 대화를 분석해준 덕에 다른 연애 관련 앱과 차별점을 보여, 유료인데도 구글 플레이스토어에서만 10만명이 넘게 다운로드받는 등 10∼20대 사이에서 상당히 유행했다.
스캐터랩은 이루다 학습을 위해 입력한 대화량이 약 100억건에 달한다고 밝힌 바 있다.
“연인 이름 부르니 실제 내 이름 답해”
인공지능 챗봇 ‘이루다’ 개인정보 노출 논란.
트위터 캡처
트위터 캡처
한 이용자는 지난 9일 트위터에 ‘이루다봇 운영중단’이라는 해시태그(#)와 함께 이루다와 나눈 대화 캡처를 올렸다.
이용자가 이루다에게 주소를 물어보자 실제 존재하는 주소를 불러준 것이다.
인공지능 챗봇 ‘이루다’ 개인정보 노출 논란.
네이트판 캡처
네이트판 캡처
이름 같은 경우 ‘○.○.○’처럼 중간에 특수기호를 넣어 쓰거나 ‘난○○○끝인데’처럼 다른 단어와 붙여 쓴 경우가 발견된다.
이름만 따로 떼서 쓴 경우만 익명화 처리되고, 중간에 특수기호가 포함돼있는 등의 경우에는 미처 익명화 처리가 되지 않았을 가능성이 있는 것이다.
당초 이 서비스를 이용할 때 흔히 동의하게 되는 ‘개인정보 취급방침’ 등의 약관에는 ‘신규 서비스 개발 및 마케팅·광고에 활용한다’는 내용이 있다. 그러나 이용자들이 복잡한 약관 속에 간략히 포함된 내용을 구체적으로 인식하기 어려운 것이 현실이다.
연애의 과학 이용자들은 앱 이용 당시 구체적으로 어떤 서비스에 활용되는지 설명받지 못했다고 분노하고 있다.
업체 측 “데이터 활용 구체적 고지 안해 죄송”
이에 스캐터랩은 10일 데이터 활용에 대한 고지 및 확인 절차를 추가하겠다는 내용의 사과문을 올렸다.
스캐터랩 ‘연애의 과학’팀은 이루다의 학습이 ‘연애의 과학’ 데이터를 기반으로 한 것이 맞다면서 “‘연애의 과학’ 이용자들이 이 점을 명확히 인지할 수 있도록 구체적으로 고지하지 못해 진심으로 사과드린다”고 밝혔다.
또 그 동안 이름·전화번호·주소 등의 숫자 정보를 비식별화·익명화 조치를 취했고, 추가적으로 업데이트하고 있다면서, 이용자들이 제공한 데이터가 더 이상 활용되길 원하지 않으면 삭제할 수 있다고 안내했다.
연애의 과학 이용자들은 오픈채팅방을 만들어 “집단 소송을 준비하자”며 자료를 수집하고 있다. 이용자들은 스캐터랩의 데이터 삭제에 대해 “증거를 인멸하라는 것 아니냐”며 의혹을 제기하고 있다.
신진호 기자 sayho@seoul.co.kr