뷰페이지

“AI 핵심은 학습데이터… 챗봇 논란도 ‘교재’ 문제”

“AI 핵심은 학습데이터… 챗봇 논란도 ‘교재’ 문제”

박승기 기자
박승기 기자
입력 2021-03-17 20:46
업데이트 2021-03-18 02:34
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

박재일 특허청 정보시스템과장

AI 활용 특허·상표 검색 시스템 개발 중
“데이터 보완 거쳐 정확도 78%로 상승
구축된 자료, 민간 활용 가능하게 할 것”
이미지 확대
박재일 특허청 정보시스템과장
박재일 특허청 정보시스템과장
“인공지능(AI) 챗봇 논란의 핵심은 잘못된 학습데이터가 원인입니다. 교재가 잘못됐는데 점수가 제대로 나올 수 없습니다.”

AI 등 신기술을 활용한 스마트 심사 시스템 구축을 총괄하는 박재일 특허청 정보시스템과장은 17일 서울신문과의 인터뷰에서 ‘데이터’의 중요성을 강조했다. 특허청은 디지털 신기술에 대한 권리를 부여하는 동시에 기술을 활용해 업무 효율성 및 행정 서비스 제고를 추진 중이다. 첫 사업이 AI를 활용한 검색으로, 선행기술(특허)·이미지(디자인)를 자동 검색·추천하는 작업이다.

박 과장은 “특허와 상표·디자인 등을 심사하려면 비슷한 기술이 있는지를 확인해야 하는데 검색에 상당한 시간과 노력이 필요하다”며 “기존 규칙 기반 검색 시스템은 유사성이 반영되지 않아 심사관이 처음부터 끝까지 다 확인해야 하지만 AI 검색은 유사성이 높은 순서로 검색돼 시간 단축 및 분류 정확도를 높여 심사 품질을 향상시킬 수 있다”고 밝혔다.

실제 사용이 많은 디자인의 경우 검색건수가 20만건이 넘는다. AI 기술의 관건은 학습데이터 구축이다. 특허청이 2019년 도형상표에 첫 적용한 결과 정확도가 55.9%였으나 학습데이터 추가 보완 등을 거친 지난해 78.1%로 상승했다. 패턴에 따라 유사성을 판단하는 디자인도 지난해 시범 적용한 결과 평면디자인 정확도가 70%에 달했다.

특허는 상표·디자인보다 훨씬 복잡하다. 기술 및 기술 타당성에 대한 검증 등에 엄청난 데이터가 필요해 내년부터 시범 실시할 계획이다. 지난해 시험 실시 결과 기존 검색시스템에 비해 7% 정도 정확도가 높은 것으로 평가돼 시스템 개발에 속도를 내고 있다. 박 과장은 “AI 특허 검색은 세계에서 처음 시도하는 것으로 변수가 많다”면서도 “기술 속도가 빨라지고 난이도도 높아지면서 선행기술 검색이 복잡해지는 등 심사관 업무를 지원할 수 있는 대책이 필요하다”고 강조했다.

선행기술 검색을 비롯해 통지문 작성, 출원서 작성(AI 변리사) 등 확장성이 기대된다. 다만 AI 활용을 위한 기반은 아직 미흡하다. 학습데이터 자동 생성 기능 구축이 우선 과제로 꼽힌다. 현재는 별도 입력 과정이 필요해 시간과 비용이 과다하게 소요된다. 박 과장은 “AI 기술은 개발로 끝나는 게 아니라 추가 학습이 지속적으로 이뤄져야 한다”며 “중장기적으로 구축된 양질의 학습데이터를 민간에서 활용할 수 있도록 서비스할 계획”이라고 밝혔다.

대전 박승기 기자 skpark@seoul.co.kr
2021-03-18 27면

많이 본 뉴스

의료공백 해법, 지금 선택은?
심각한 의료공백이 이어지고 있습니다. 의대 증원을 강행하는 정부와 정책 백지화를 요구하는 의료계가 ‘강대강’으로 맞서고 있습니다. 현 시점에서 가장 먼저 필요한 것은 무엇일까요?
사회적 협의체를 만들어 대화를 시작한다
의대 정원 증원을 유예하고 대화한다
정부가 전공의 처벌 절차부터 중단한다
의료계가 사직을 유예하고 대화에 나선다
광고삭제
위로