뷰페이지

나라지식정보컨소시엄, 문화·게임 콘텐츠 분야 용어 말뭉치 구축

나라지식정보컨소시엄, 문화·게임 콘텐츠 분야 용어 말뭉치 구축

이경우 기자
입력 2022-12-13 11:22
업데이트 2022-12-13 11:22
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

품질 검증 후 ‘AI허브’에 공개

각종 커뮤니티에서 사용되는 언어가 정치·경제·문화 등 사회 각 분야에서 활발하게 수용되면서 커뮤니티 언어의 영향력이 커지고 있다. 이에 과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 한국어 자연어 처리 기술 발전과 인력 양성을 위해 ‘인공지능 학습용 데이터 구축 지원 사업’을 진행하고 있다.

이와 관련해 ㈜나라지식정보 컨소시엄(㈜나라지식정보, 루리웹닷컴, 비플라이소프트㈜, ㈜알토비전, ㈜인벤, 전북대 산학협력단)은 과기정통부와 NIA가 진행하는 ‘2022년 인공지능 학습용 데이터 구축 지원 사업’ 중 ‘문화, 게임 콘텐츠 분야 용어 말뭉치’의 데이터 구축 사업을 수행했다고 13일 밝혔다. 이 사업은 ‘게임 용어’와 ‘문화 용어’(미디어 및 레저 용어)를 기계가 빠르게 인식할 수 있도록 하는 데이터 구축 사업이다.

컨소시엄은 ‘문화 및 게임 분야’ 신조어 약 9만개에 대한 정의와 단어 간의 관계를 데이터베이스로 구축했으며, 이 용어들이 포함된 문장 약 60만개에 대한 AI 학습용 데이터 구축 작업도 수행했다고 밝혔다.

구축된 데이터는 품질 검증 후 ‘AI허브’(https://aihub.or.kr)에 공개할 예정이다. 데이터셋과 함께 데이터 구조, 데이터 사용 환경 및 사용 방법 등에 대한 설명도 제공할 예정이다. 데이터셋은 챗봇 연구개발, 인공지능 분야 학술연구를 위한 기초 자료로도 활용된다.

많이 본 뉴스
‘민생회복지원금 25만원’ 당신의 생각은?
더불어민주당은 22대 국회에서 전 국민에게 1인당 25만원의 지역화폐를 지급해 내수 경기를 끌어올리는 ‘민생회복지원금법’을 발의하겠다고 밝혔습니다. 민주당은 빠른 경기 부양을 위해 특별법에 구체적 지원 방법을 담아 지원금을 즉각 집행하겠다는 입장입니다. 반면 국민의힘과 정부는 행정부의 예산편성권을 침해하는 ‘위헌’이라고 맞서는 상황입니다. 또 지원금이 물가 상승과 재정 적자를 심화시킬 수 있다고 우려합니다. 지원금 지급에 대한 당신의 생각은?
찬성
반대
모르겠다
광고삭제
위로