뷰페이지

인공지능, 눈을 뜨다

인공지능, 눈을 뜨다

김민석 기자
김민석 기자
입력 2023-06-20 00:02
업데이트 2023-06-20 00:02
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

LG, 국제 AI 학회서 ‘캡셔닝 AI’ 공개
경험·지식 활용해 이미지 설명 가능

LG 등 국내 기업들이 캐나다 밴쿠버에서 열리는 세계 최대 인공지능(AI) 학회에 대거 참가해 ‘이미지 인식(비전) AI’ 기술을 뽐낸다.

LG AI연구원은 18일(현지시간)부터 22일까지 열리는 ‘국제 컴퓨터 비전 및 패턴 인식 학회(CVPR) 2023’에 LG전자, LG이노텍, LG에너지솔루션, LG유플러스 등 주요 계열사와 함께 참가해 ‘캡셔닝 AI’를 처음 공개했다.

국제학회에 처음 공개되는 캡셔닝 AI는 인간처럼 처음 보는 물체나 장면에 대해서도 이전의 경험과 지식을 활용해 이해하고 설명할 수 있는 AI다. 눈이 달려 본 것에 대해 설명할 수 있는 생성형 AI로 보면 쉽다.

캡셔닝 AI는 대량의 이미지를 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 수 있다. 평균적으로 문장 5개, 키워드 10개를 10초 내에 생성할 수 있어, 이미지 범위를 1만장으로 확장하면 2일 이내에 맞춤형 이미지 검색·관리 시스템 구축에 필요한 작업을 끝낼 수 있다.

CVPR은 세계 최대 공학 학술단체인 국제전기전자공학회(IEEE)와 국제컴퓨터비전재단(CVF)이 공동 주최하는 가장 권위 있는 비전 AI 학회다. AI가 카메라나 센서로 인식한 이미지를 분석하고 분류하는 기술인 비전 AI는 자율주행, 의료, 스마트공장, 광학문자인식(OCR, 금융 등), 안면인식(보안) 등 활용 범위가 매우 넓다. 올해 행사엔 9155편의 비전 AI 논문이 접수돼 25.8%에 해당하는 2359편이 발표됐다.

올해도 네이버클라우드와 카카오브레인이 CVPR에 논문을 제출해 각각 8편, 6편이 채택됐다. 네이버클라우드는 대표적으로 인터넷에서 이미지를 검색해 반자동으로 대화를 생성하고 이를 원래의 데이터셋과 함께 사용해 10배 효율적으로 모델을 학습시키는 방안을 제안했다. 카카오브레인은 CVPR에서 LG가 주최하는 이미지 캡셔닝 대회인 ‘NICE 챌린지’에서 3위를 했다.

한편 이번 행사에선 기업과 기관 117곳이 부스를 차리고 AI 인재 채용에 나선다. 올해도 구글, 애플, 아마존, 퀄컴, 메타(옛 페이스북) 등 글로벌 정보기술(IT) 기업이 부스를 차렸다. 테슬라, 아마존의 자율주행 스타트업인 죽스(ZooX)도 가장 큰 부스를 차려 인재 모집에 나섰다.
김민석 기자
2023-06-20 18면

많이 본 뉴스

국민연금 개혁 당신의 선택은?
국민연금 개혁 논의가 이어지고 있습니다. 국회 연금개혁특별위원회 산하 공론화위원회는 현재의 보험료율(9%), 소득대체율(40%)을 개선하는 2가지 안을 냈는데요. 당신의 생각은?
보험료율 13%, 소득대체율 50%로 각각 인상(소득보장안)
보험료율 12%로 인상, 소득대체율 40%로 유지(재정안정안)
광고삭제
위로