뷰페이지

AI 전쟁의 새 키워드, 한국어

AI 전쟁의 새 키워드, 한국어

김소라 기자
김소라 기자
입력 2017-03-16 17:46
업데이트 2017-03-17 00:37
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14
# Microsoft Translator is now powering all speech translation through state-of-the-art neural networks.

→마이크로소프트 통역은 지금 최신식 신경 통신망을 통해 모든 음성 번역을 강화하고 있다.

# 차기 대선일이 5월 9일로 확정된 가운데 각 정당의 후보들이 분주히 움직이고 있다.

→The next presidential election day on May 9th among each party’s nominee is confirmed are bunjuhi moving.
이미지 확대
마이크로소프트(MS)의 인공신경망 번역 웹사이트(http://translate.ai)에서 영·한 번역과 한·영 번역을 해 봤다. 첫 번째 문장은 ‘neural networks’를 ‘신경 통신망’이라고 직역한 정도만 제외하면 매끄러운 결과물이다. 그러나 두 번째 문장에서는 ‘가운데’의 문맥 속 의미가 반영되지 않았고 ‘분주히’는 영어로 옮기지 못했다.

구글과 IBM, 네이버, 삼성전자 등 글로벌 기업들과 국내 기업들이 각축전을 벌이고 있는 한국어 기반 인공지능(AI) 서비스 시장에 마이크로소프트가 뛰어들며 치열한 경쟁이 예고되고 있다. 마이크로소프트는 자사의 인공신경망(NMT) 번역 서비스에 영어, 독일어, 중국어 등 10개 언어에 이어 한국어를 새롭게 추가했다고 지난 15일 밝혔다. 마이크로소프트의 인공신경망 번역 기술은 번역 애플리케이션 ‘MS 트랜스레이터’와 인터넷전화 ‘스카이프’의 실시간 통역 등에 적용된다.

인공신경망 번역은 문장 전체의 순서와 맥락을 파악해 번역하는 기술로, 기존의 통계 기반 번역(SMT)이 단편적인 번역물을 내놓았던 것과 달리 각 단어의 문맥 속 의미까지 고려한 매끄러운 번역물을 내놓는다. 지난해 구글에 이어 네이버의 ‘파파고’, 한글과컴퓨터의 ‘지니톡’ 등이 인공신경망 번역 기술을 도입한 데 이어 마이크로소프트까지 가세하면서 한국어 인공신경망 번역은 4파전 양상으로 펼쳐지게 됐다.

마이크로소프트는 자사의 자연어 처리 서비스 ‘루이스’(LUIS)에서 한국어를 지원하면서 한국어 기반의 음성인식 AI 비서와 챗봇 등 생태계 확장에도 나섰다. 한국마이크로소프트는 “정보기술(IT)과 제조, 교통, 물류, 쇼핑, 미디어 등 다양한 분야의 국내 기업들이 루이스에 기반한 챗봇과 앱 등 서비스를 준비하고 있으며 스마트 스피커, 자동응답시스템(ARS) 부가 서비스, 상품 예약 등 다양한 한국어 앱이 개발될 것”이라고 밝혔다.

아마존과 구글, 마이크로소프트 등은 글로벌 시장의 방대한 이용자와 클라우드에 축적된 빅데이터가 강점이다. 이들 기업은 영어 이외의 외국어 서비스를 늘려 생태계 확장에 나서고 있다. 국내 기업들도 ‘맞불’을 놓고 있다. 삼성전자는 다음달 출시할 상반기 전략 스마트폰 ‘갤럭시S8’에 음성인식 AI 비서 ‘빅스비’를 탑재한다. 한국어와 영어 등 총 7~8개 언어를 지원하고 삼성전자의 TV, 가전 등과 연동해 사물인터넷(IoT) 생태계를 넓힌다는 밑그림을 그리고 있다. 네이버는 자회사 라인과 손잡고 한국어와 일본어 기반의 자연어 처리 기술과 인공신경망 번역, 검색엔진 등을 아우르는 AI 플랫폼 ‘클로바’를 개발하며 아시아 시장을 방어한다는 전략이다. 국내 최초로 한국어 AI 스피커를 내놓은 SK텔레콤을 비롯해 카카오, KT, LG유플러스 등도 한국어 기반 AI 서비스를 내놓았거나 올해 공개를 목표로 개발 중이다.

글로벌 기업들의 국내 시장 진출에 국내 업계는 자신감을 보이고 있다. 글로벌 기업들이 정교한 AI 알고리즘을 구축했더라도 한국어 특유의 뉘앙스나 신조어, 시사용어 등에 관한 데이터는 국내 기업들이 앞서 있다는 것이다. 가령 ‘세월호’를 영어로 옮길 때 네이버의 ‘파파고’는 ‘Ferry Sewol’로 번역하는 반면 구글 번역기와 마이크로소프트 번역기는 각각 ‘Time lake’, ‘The three issue’로 번역하는 식이다. 국내 업계 관계자는 “글로벌 기업들의 AI 플랫폼이 사전에 담긴 정제된 한국어는 학습할 수 있어도 최신 용어와 한국어 어조 등은 습득하기 어렵다”면서 “한국어 빅데이터만큼은 국내 기업들이 강점을 가지고 있어 충분히 경쟁할 만하다”고 말했다.

김소라 기자 sora@seoul.co.kr
2017-03-17 22면

많이 본 뉴스

  • 4.10 총선
저출생 왜 점점 심해질까?
저출생 문제가 시간이 갈수록 심화하고 있습니다. ‘인구 소멸’이라는 우려까지 나옵니다. 저출생이 심화하는 이유가 무엇이라고 생각하시나요.
자녀 양육 경제적 부담과 지원 부족
취업·고용 불안정 등 소득 불안
집값 등 과도한 주거 비용
출산·육아 등 여성의 경력단절
기타
광고삭제
위로