찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • 바벨탑의 저주
    2026-01-21
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
7
  • 1600개 언어 듣고 변환… 메타, ‘바벨탑의 저주’ 풀 AI 기술 공개

    1600개 언어 듣고 변환… 메타, ‘바벨탑의 저주’ 풀 AI 기술 공개

    LLM 통해 적은 수의 음성도 인식사용 적은 저자원 언어 문자로 구현70억 음성 인코더 오픈소스 공개 “언어 장벽 넘어 다양한 소통 확대” 서아프리카 국가 라이베리아와 시에라리온에는 바이족과 일부 소수민족이 쓰는 ‘바이’(Vai)라는 언어가 있다. 사하라사막 이남 아프리카 대표 언어족인 니제르콩고어족의 ‘만데어’ 계열로 분류된다. 라틴 문자나 아랍어 문자를 기반으로 하지 않는 문자 체계를 가진 몇 안 되는 아프리카 언어 중 하나로 주목받지만 사용하는 인구는 12만명에 불과하다. 이런 소수언어도 인식해 문자로 변환하는 인공지능(AI) 기술이 페이스북·인스타그램 모회사 메타에 의해 개발됐다. 사실상 전 세계의 모든 언어를 인식할 수 있는 AI가 등장한 것으로, ‘바벨탑의 저주’를 풀 획기적인 기술로 평가된다. 메타의 기초AI연구(FAIR) 팀은 10일(현지시간) 소수언어 등 전 세계 1600여개 언어를 문자로 구현할 수 있는 자동음성인식(ASR) 체계를 공개했다. 메타는 모든 언어를 인식할 수 있다는 뜻을 담아 이 기술을 ‘옴니링구얼’(Omnilingual)이라고 이름 지었다. 메타는 “현재 대부분의 ASR은 인터넷에 널리 존재하는 소수의 ‘고자원 언어’에 집중돼 있다. 널리 사용되지 않거나 자원이 부족한 ‘저자원 언어’ 사용자는 ASR을 이용할 수 없는 경우가 많아 디지털 격차가 심화된다”며 “옴니링구얼에는 AI로 이전에는 기록되지 않았던 500개의 저자원 언어가 포함된다”고 밝혔다. 현재 주요 AI는 공식적으로 수십 개 정도의 언어를 인식하고 문자 변환을 지원하고 있다. 방대한 데이터 학습을 통해 인간의 언어를 이해하고 생성하는 대규모언어모델(LLM)에 의존하고 있어 데이터가 많은 고자원 언어에서는 잘 동작하지만 그렇지 않은 저자원 언어에서는 구동이 제한적이다. 새로운 언어 지원을 추가하려면 전문가가 주도하는 미세조정을 거쳐야 하는 불편함도 있다. 하지만 옴니링구얼은 ‘LLM-ASR’로 불리는 새로운 접근법을 통해 적은 수의 음성·문자 데이터 쌍만 있어도 기본적인 수준의 음성 인식 기능이 가능하다는 게 메타의 설명이다. 다만 옴니링구얼의 저자원 언어 문자 변환 오류율은 아직 고자원 언어보다는 높다. 사용량이 절대적으로 적기 때문이다. 메타가 공개한 자료를 보면 고자원 언어 249종 중에선 236종(94.8%)이 오류율 10% 미만으로 파악됐다. 하지만 저자원 언어 546종에선 195종(35.7%)만이 고자원 언어 변환율과 비슷한 정확도를 보였다. 메타는 이날 옴니링구얼에 적용된 매개변수 70억개 규모 음성 인코더를 누구나 활용할 수 있도록 오픈소스로 풀었다. 음성 데이터를 자동으로 AI가 이해할 수 있는 벡터 데이터 형태로 정렬하는 도구다. 메타는 “옴니링구얼은 전 세계적으로 음성 기술 접근성을 확대한 중요한 진전으로, 가장 소외된 언어권의 사람들도 고품질 음성-텍스트 변환 시스템을 이용할 수 있도록 보장한다”며 “궁극적으로 언어 장벽을 허물고 다양한 언어 및 문화적 배경을 가진 사람들 간의 소통을 가능하게 하는 것이 목표”라고 밝혔다.
  • 메타 ‘모든 언어 인식기’ 공개…1600여개 언어 받아쓰기 가능

    메타 ‘모든 언어 인식기’ 공개…1600여개 언어 받아쓰기 가능

    서아프리카 국가 라이베리아와 시에라리온에는 바이족과 일부 소수민족이 쓰는 ‘바이’(Vai)라는 언어가 있다. 사하라사막 이남 아프리카 대표 언어족인 니제르콩고어족의 ‘만데어’ 계열로 분류된다. 라틴 문자나 아랍어 문자를 기반으로 하지 않는 문자 체계를 가진 몇 안 되는 아프리카 언어 중 하나로 주목받지만 사용하는 인구는 12만명에 불과하다. 이런 소수언어도 인식해 문자로 변환하는 인공지능(AI) 기술이 페이스북·인스타그램 모회사 메타에 의해 개발됐다. 사실상 전 세계의 모든 언어를 인식할 수 있는 AI가 등장한 것으로, ‘바벨탑의 저주’를 풀 획기적인 기술로 평가된다. 메타의 기초AI연구(FAIR) 팀은 10일(현지시간) 소수언어 등 전 세계 1600여개 언어를 문자로 구현할 수 있는 자동음성인식(ASR) 체계를 공개했다. 메타는 모든 언어를 인식할 수 있다는 뜻을 담아 이 기술을 ‘옴니링구얼’(Omnilingual)이라고 이름 지었다. 메타는 “현재 대부분의 ASR은 인터넷에 널리 존재하는 소수의 ‘고자원 언어’에 집중돼 있다. 널리 사용되지 않거나 자원이 부족한 ‘저자원 언어’ 사용자는 ASR을 이용할 수 없는 경우가 많아 디지털 격차가 심화된다”며 “옴니링구얼에는 AI로 이전에는 기록되지 않았던 500개의 저자원 언어가 포함된다”고 밝혔다. 현재 주요 AI는 공식적으로 수십 개 정도의 언어를 인식하고 문자 변환을 지원하고 있다. 방대한 데이터 학습을 통해 인간의 언어를 이해하고 생성하는 대규모언어모델(LLM)에 의존하고 있어 데이터가 많은 고자원 언어에서는 잘 동작하지만 그렇지 않은 저자원 언어에서는 구동이 제한적이다. 새로운 언어 지원을 추가하려면 전문가가 주도하는 미세조정을 거쳐야 하는 불편함도 있다. 하지만 옴니링구얼은 ‘LLM-ASR’로 불리는 새로운 접근법을 통해 적은 수의 음성·문자 데이터 쌍만 있어도 기본적인 수준의 음성 인식 기능이 가능하다는 게 메타의 설명이다. 다만 옴니링구얼의 저자원 언어 문자 변환 오류율은 아직 고자원 언어보다는 높다. 사용량이 절대적으로 적기 때문이다. 메타가 공개한 자료를 보면 고자원 언어 249종 중에선 236종(94.8%)이 오류율 10% 미만으로 파악됐다. 하지만 저자원 언어 546종에선 195종(35.7%)만이 고자원 언어 변환율과 비슷한 정확도를 보였다. 메타는 이날 옴니링구얼에 적용된 매개변수 70억개 규모 음성 인코더를 누구나 활용할 수 있도록 오픈소스로 풀었다. 음성 데이터를 자동으로 AI가 이해할 수 있는 벡터 데이터 형태로 정렬하는 도구다. 또 소수언어 350종의 음성자료 ‘말뭉치’도 공개했다. 메타는 “옴니링구얼은 전 세계적으로 음성 기술 접근성을 확대한 중요한 진전으로, 가장 소외된 언어권의 사람들도 고품질 음성-텍스트 변환 시스템을 이용할 수 있도록 보장한다”며 “궁극적으로 언어 장벽을 허물고 다양한 언어 및 문화적 배경을 가진 사람들 간의 소통을 가능하게 하는 것이 목표”라고 밝혔다.
  • [씨줄날줄] 마천루의 저주/이동구 논설위원

    [씨줄날줄] 마천루의 저주/이동구 논설위원

    9·11 테러로 뉴욕의 세계무역센터(WTC) 빌딩이 붕괴된 후 한 부동산 사업가는 “세계 최고의 마천루를 다시 미국에 세워야 한다”며 미국민들의 애국심을 자극했다. 그는 15년 후 미국의 제45대 대통령에 당선됐다. 도널드 트럼프다.인류는 크고 웅장한 건물을 신성시하며 부와 명예, 권위의 상징으로 여겼다. 바벨탑의 전설이나 고대 이집트의 피라미드, 중국의 자금성, 유럽의 궁궐 등등. 현대의 도시들은 빌딩의 높이로 도시와 국가의 발전을 과시한다. 뉴욕의 맨해튼, 시카고, 두바이 등이 바로 하늘을 찌를 듯한 빌딩들로 유명한 도시들이다. 공교롭게도 이런 빌딩 중에는 저주의 상징물로 취급받는 것도 있어 흥미롭다. 소위 ‘마천루의 저주’가 덧씌워진 빌딩이다. ‘마천루의 저주’(skycraper curse)란 초고층 건물을 짓는 국가는 최악의 경기 불황을 맞게 된다는 내용의 가설이다. 시사상식사전 등에 따르면 1999년 도이체방크의 분석가 앤드루 로런스라는 인물이 100년간의 사례를 분석해 만들어 낸 가설이다. 초고층 빌딩 건설 당시 돈줄이 풀렸으나 완공 시점에는 버블이 꺼지면서 경제 불황을 맞는다는 것이 핵심이다. 버즈 두바이(828m), 엠파이어스테이트 빌딩(381m), 세계무역센터(415m, 416m), 시어스타워(442m), 타이베이금융센터(508m), 페트로나스타워(452m) 등을 대표적인 사례로 꼽는다. 버즈 두바이는 2010년 1월 완공돼 세계에서 가장 높은 빌딩에 등극했으나 곧바로 금융위기가 닥치면서 두바이 경제가 큰 위기를 맞았다. 2004년 타이완의 타이베이금융센터는 건립 후 자국의 주력 산업인 정보기술(IT) 산업이 붕괴됐다. 1997년 말레이시아 페트로나스타워가 완공되면서 아시아 전체에 경제 위기가 찾아왔다고 한다. 세계무역센터와 시어스타워가 건설된 후에는 석유 파동으로 미국 경제가 초유의 스태그플레이션을 겪었고, 엠파이어스테이트 빌딩이 세워졌을 땐 세계 대공황이 시작됐다는 것이다. 최근 국내 최고의 마천루 롯데월드타워(123층·555m)가 입방아에 오르내리고 있다. 2014년 말부터 시작된 롯데의 잇따른 악재와 국정 난맥상 때문으로 보인다. 형제간의 경영권 분쟁과 최순실 게이트 연루 의혹에 이어 최근 중국의 사드 보복으로 큰 피해가 예상되는 롯데에 대한 안타까움의 표시로 해석될 수도 있다. 여기에 북한의 미사일 발사와 미국, 일본, 중국 등 주변 강대국들의 갖가지 압박에 대한 불안한 마음이 반영된 것으로 풀이된다. 기업이나 국가가 도약하는 데는 그만큼의 어려움이 따르기 마련이다. 산고(産苦)일 뿐 저주를 가져오는 빌딩이란 있을 수 없다는 건축가와 풍수가들의 말이 훨씬 더 설득력 있게 다가온다. 이동구 논설위원 yidonggu@seoul.co.kr
  • [씨줄날줄] 마천루 경쟁의 명암/정기홍 논설위원

    ‘통유리의 저주’. 고층빌딩의 외벽유리가 햇빛을 반사해 인근 주민을 괴롭힌다고 해서 생겨난 신조어다. 통유리 공법은 건물에 첨단 이미지를 주고 공사기간도 단축시켜 건설업체들이 선호하는 방식이다. 저층에 사용하는 콘크리트가 무거워 끌어들인 기술이다. 외벽유리를 천막처럼 덮는 ‘커튼 월’(curtain wall)이란 공법을 적용해 빛을 막는다. 최근 이 공법이 한여름 건물 안을 찜통으로 만든다는 논란에 휩싸였다. 3년 전 부산 해운대의 고층빌딩 화재 때는 외벽의 가연성 자재로 인해 순식간에 불이 4층에서 38층으로 옮겨붙어 화재에 취약함을 그대로 드러내기도 했다. 인간은 왜 하늘 높이 건물을 지으려 할까. 좁은 땅을 효율적으로 활용하기 위해? 높은 건물이 지역의 랜드마크로 인식되고, 부의 상징으로 여겨지기 때문에? 지금 세계 유수의 도시들은 경쟁적으로 초고층 빌딩 건설에 나서고 있다. 중동· 중국 등 신흥 부국들이 경쟁을 주도한다. 중국에서는 300여개의 초고층빌딩이 올라가고 있다고 한다. 수백m의 빌딩은 이미 성에 차지 않는 것일까. 1~2km 높이의 빌딩도 우후죽순처럼 솟아나고 있다. 사우디아라비아의 킹덤타워는 높이가 1000m로 2017년 완공될 예정이다. 쿠웨이트 부르즈 무바라크 알 카비르 빌딩, 바레인 머잔타워, 두바이 시티타워 등도 초고층 대열에 섰다. ‘마천루의 저주’(skyscraper curse)라고들 한다. 초고층빌딩을 건설하면 으레 경제불황이 찾아온다는 가설이다. 도이치뱅크의 분석가 앤드루 로렌스가 1999년 ‘마천루 지수’란 제목으로 발표한 개념이다. 실제로 미국의 엠파이어스테이트 빌딩이 완공되자 1930년 대공황이 깊어졌고, 말레이시아의 페트로나스타워가 준공되면서 1998년 아시아에 외환위기가 닥쳤다. 이 가설이 나온 지 10년 후인 2009년엔 세계 최고층빌딩인 부르즈 칼리파(162층·828m)가 완공 두 달을 앞두고 파산을 선언하면서 또다시 화제가 되기도 했다. 서울 강남 초고층 아파트 헬기 출동사고로 마천루의 저주가 다시 입길에 오르내리고 있다. 21세기판 ‘바벨탑의 저주’가 될 것이란 얘기다. 현재 시공 중인 잠실 제2롯데월드(123층·555m)에도 불똥이 튀고 있다. 이 건물 인근 서울공항의 이착륙 군용기와 충돌할 우려가 없지 않은 만큼 층수를 낮춰야 한다는 것이다. 하늘에 닿으려는 인간의 욕망은 재앙을 잉태할 수밖에 없는 것인가. 마천루의 가설은 어디까지나 가설일 뿐이다. 하지만 유비무환이다. 이번 헬기 충돌 사고 때 아파트의 항공장애표시등(점멸등)이 꺼져 있었음을 잊지 말자. 정기홍 논설위원 hong@seoul.co.kr
  • 남아공 “월드컵 개막 전에 국가 외우자” 난리법석

    남아공 “월드컵 개막 전에 국가 외우자” 난리법석

    보통 국제경기에서 시작에 앞서 국가가 연주되면 선수들은 엄숙한 자세로 국가를 따라부르며 승리를 다짐한다. 관중들도 애국가를 함께 부르면서 선수들에게 선전을 기원한다. 남아공도 예외가 아니다. 하지만 국가를 끝까지 완벽하게 따라부르는 선수나 관중은 좀처럼 찾아보기 힘들다. 생소한 언어가 뒤죽박죽 섞여 있는 가사를 외우는 사람이 워낙 적기 때문이다. 남아공에서 공용어로 인정된 언어는 모두 11개. 국가 ‘Nkosi Sikelel’iAfrica(아프리카에 신의 축복이 있으라)’의 가사에는 영어, 남아공 공용 네덜란드어, 코사어 소토어, 줄루어 등 무려 5개 언어가 섞여 있다. ‘바벨탑의 저주’라는 말이 나올 만하다. 사정이 이렇다 보니 경기종목에 따라 국가가 연주될 때 웃지 못할 일이 벌어진다. 대개가 흑인인 축구선수들은 힘차게 국가를 부르다가 남아공 공용 네덜란드어로 된 대목에선 입을 다문다. 선수 대다수가 백인인 럭비에선 반대로 영어나 공용 네덜란드어로 된 부분에서만 선수들이 국가를 따라한다. 대다수 국민도 국가를 통째로 외우지 못하는 건 마찬가지다. 당연히 평소에 국가를 부르는 사람도 찾아보기 힘들다. 월드컵 개막을 불과 10일 앞둔 가운데 주최국 남아공이 필사적으로 국가배우기 운동을 펴고 있는 건 바로 이런 이유 때문이다. 남아공 문화부 관계자는 외신과의 인터뷰에서 “일부 국민은 가사의미를 모르다 보니 국가를 전혀 부르지 않는다.”며 “(11개) 공용어로 가사의 내용을 풀이한 인쇄물을 배부하는 등 국민들에게 국가 배우기를 독려하고 있다.”고 말했다. 외신은 “국가의 뜻이 서명된 인쇄물을 받아온 사람들이 CD를 틀어놓고 국가를 (끝까지) 따라해 보는 등 월드컵 개막을 앞두고 남아공 국민들이 국가 배우기에 열심을 내고 있다.”고 전했다. 사진=ESPN 서울신문 나우뉴스 해외통신원 손영식 voniss@naver.com@import'http://intranet.sharptravel.co.kr/INTRANET_COM/worldcup.css';
  • 영혼 깊은 곳서 찾아낸 삶의 지혜

    영혼 깊은 곳서 찾아낸 삶의 지혜

    전세계 1억 독자들의 마음을 움직인 ‘연금술사’의 작가 파울로 코엘료(61). 한국에도 두터운 독자층을 확보하고 있는 그가 첫 산문집 ‘흐르는 강물처럼’(박경희 옮김, 문학동네 펴냄)을 내놓았다. 가볍게 읽을 수 있는 수필집이라기보다 인간의 영혼 깊은 곳에서 길어 올린, 삶의 지혜가 담긴 우화집이다. ‘다르게 여행하기’‘길을 여는 열쇠’‘평화로운 세상을 위해’‘보이지 않는 책’ 등 101편의 짤막한 글이 실린 이 산문집에는 작가 자신의 소소한 일상의 경험과 동서고금의 지혜가 녹아들어 있다. 세계 곳곳을 여행하며 겪은 일들과 사람들과의 만남을 통해 한층 성숙해진 사유가 담겼다. 코엘료 문학의 시원(始原)을 살펴볼 수 있다. ●일 중독증에 걸린 현대인에 경종 작가는 우화를 통해 워커홀릭(일 중독자)처럼 바쁘게 돌아가는 현대인의 삶에 경종을 울린다.“꿈속에서 천사가 묻는다.‘자넨 무엇 때문에 그렇게 분주하게 사는가?’ 마누엘이 대답한다.‘책임감 때문이지요.’ 천사는 다시 묻는다.‘하루에 십오분만이라도 일을 멈추고 아무 것도 하지 않은 채, 세상과 자네 스스로를 돌아볼 수 없나?’ 마누엘은 그러고 싶지만 시간이 없다고 대답한다.‘누구에게든 시간은 있네. 용기가 없을 뿐이지. 노동은 축복일세. 그것을 통해 우리의 행동을 돌아볼 수 있다면 말이야. 그러나 일에만 매달려 삶의 의미를 도외시한다면 그것은 저주야.’˝ (‘마누엘은 없어서는 안 될 인물’ 중에서) 바쁜 가운데서도 여행을 게을리 하지 않고 삶을 온전히 즐기는 일을 소홀히 하지 말라는 인생살이의 지혜를 들려 준다. 이 책의 미덕은 무엇보다 자연인으로서의 코엘료의 면모를 고스란히 엿볼 수 있다는 점이다. 그는 일년의 절반은 고향인 브라질의 리우데자이네이루에서, 절반은 프랑스 피레네 지방의 작은 시골마을 방앗간 집에서 보낸다. 옆집 노인과 나무 한 그루를 놓고 옥신각신하는가하면(‘가지 않은 길’), 아내와 함께 산을 누비며 노르딕 워킹도 하기도 한다(‘규칙보다 중요한 것’). 그야말로 평범한 소시민의 하루하루다. 그에게 영향을 미친 작가들에 대한 애정도 살뜰하게 피력한다. 브라질의 위대한 시인 마누엘 반데이라와 무명인 코엘료를 묵묵히 지켜봐준 거장 조르지 아마두에 대한 감사(‘나의 진정한 수호자’), 그가 흠모하는 헨리 밀러의 아내였던 호키 밀러를 만난 일화(‘사랑, 그것이면 충분하다’) 등은 그의 작품세계를 이해하게 하는 소중한 단초를 제공한다. 자신의 작품을 번역하는 번역가들에 감사의 마음을 전하는 글 ‘바벨탑의 저편’은 사뭇 뭉클한 감동을 안겨 준다. ●자연인의 면모 엿보여 ‘세계의 경찰 ’ 미국을 비판한 글도 눈길을 끈다. “당신의 결정에 반대하는 우리를 한결같이 무시해 주셔서 감사합니다. 지구의 미래는 소외된 사람들의 것이니까요. 당신이 없었더라면 우리는 우리 자신의 힘을 조직화할 능력이 있음을 발견하지 못할 뻔했습니다.”(‘부시 대통령, 고맙습니다’ 중에서) 이라크 전쟁 발발 직전 한 영어 웹사이트에 실려 전세계 5억명의 독자들이 읽은 글이다. 1만 2000원. 김규환기자 khkim@seoul.co.kr
  • [씨줄날줄] 마천루의 저주

    구약성서 창세기에 바벨탑에 관한 이야기가 나온다.노아의 후손들이 시날(바빌로니아)에 정착했다.그들은 벽돌을 굽는 신기술을 발견했다.도시를 건설하고 하늘에 닿게 탑을 세워 자기들의 이름을 떨치려 했다.하늘에서 내려다본 하느님은 신에 대한 도전이라고 생각했다.하느님은 사람들의 마음과 언어를 혼란시켜 멀리 흩어지게 함으로써 탑 건축이 중단되게 했다.바벨탑의 붕괴는 인간의 교만에 대한 심판이었다고 성경은 말한다.그러나 하늘을 향한 인간의 도전은 계속됐다. 거대한 건물을 세우려는 배경에는 인간의 과시욕과 도약정신 그리고 권력 의지가 있다.건축물을 통한 권력 의지와 욕망의 과시는 고대뿐만이 아니라 현대에도 마찬가지다.그러한 시도는 물론 부정적인 측면만 있는 것은 아니다.인류의 삶을 향상시킨 과학기술 발달의 원동력이었다. 미국은 1931년 뉴욕에 당시 세계에서 가장 높은 엠파이어스테이트 빌딩을 건축했다.102층의 381m다.1971년에는 뉴욕에 417m,415m 높이의 110층짜리 쌍둥이 건물인 세계무역센터가 지어졌다.1974년에는 시카고에 110층 443m의 시어스 타워가 건축됐다.1998년에는 중국 상하이에 421m 높이의 진마오 타워가 등장했다.현재 가장 높은 건물은 말레이시아 콸라룸푸르에 있는 452m 높이의 페트로나스 트윈타워다. 그 건물보다 더 높은 세계 최고의 건물이 서울 상암동 디지털미디어시티(DMC)에 건설된다.130층 580m 높이의 국제비즈니스센터다.2008년 완공 예정이다.그러나 세계 최고 건물이 지어질 때는 바벨탑의 저주처럼 ‘마천루의 저주(Skyscraper Curse)’가 있었다고 한다.블룸버그 통신의 윌리엄 페섹 칼럼니스트는 세계 최고 건물 건설에 나섰던 나라들은 금융위기를 맞았다고 밝혔다.초대형 빌딩의 건설은 과잉투자 등의 경제거품을 유발하기 쉽다는 것이다. 페트로나스 트윈타워가 완공된 1990년대 후반에는 말레이시아에 금융위기가 왔다.세계무역센터와 시어스 타워가 건축된 1970년대에는 미국의 물가가 폭등하고 뉴욕시가 재정위기에 빠졌다.페섹 칼럼니스트는 그러나 한국은 어려운 작업을 잘 수행하고 행운이 따라준다면 ‘마천루의 저주’를 피할 수 있을 것이라고 말했다. 이창순 논설위원
위로