소스코드 등 공유해 개발자들 함께 문제 해결
AI 우려되는 윤리, 사회, 법적 문제도 머리 맞대
가장 대표적인 오픈소스 플랫폼 깃허브의 홈페이지 첫 화면.
그런데 AI 개발과 운영에 고민해야 할 문제들을 비교적 쉽게 해결할 수 있는 방법으로 ‘오픈소스’가 떠오른다. 소스 코드를 무료로 제공하고 누구나 수정·배포할 수 있는 소프트웨어를 말한다. 오픈소스는 AI 등장 이전부터 개발 분야에서 활발하게 사용돼 왔다. ‘깃허브’로 대표되는 사이버 공간에서 개발자들은 서로의 프로그램 소스 코드를 공유하고 머리를 맞대 고민하거나 새로운 프로그램을 개발하기도 했다.
AI 분야에서 오픈소스는 특히 활발하게 사용되고 있다. 파이토치, 텐서플로, 케라스 등의 딥러닝 프레임워크부터 허깅페이스, 엔엘티케이 등의 자연어 처리 라이브러리까지 다양한 오픈소스 소프트웨어가 AI 개발자들에게 제공되고 있다.
오픈AI가 챗GPT를 공개한 뒤 구글은 새로운 생성 AI를 논문 형태로 깃허브에 공유하기도 했다. 국내 AI 기술기업 업스테이지는 메타가 오픈소스로 공유한 대규모언어모델(LLM) ‘라마’를 개량해 ‘솔라’를 개발, 허깅페이스 오픈LLM 리더보드에서 최초로 ‘GPT-3.5’의 점수를 넘기도 했다. 반면, 오픈AI는 GPT-4를 공개하며 소스 코드는 물론 파라미터 수 등 어떤 것도 공유하지 않았다.
오픈소스 소프트웨어들은 AI 기술과 알고리즘을 빠르게 접할 수 있게 하고, 새로운 아이디어와 창의성을 발휘할 수 있게 한다. 전세계의 개발자들이 서로 협력하고, 지식과 경험을 공유하며, 문제를 해결할 수 있는 커뮤니티를 제공한다.
오픈소스AI 리더보드를 운영하는 허깅페이스의 홈페이지 첫 화면.
라이선스 비용이나 저작권 문제 없이 사용할 수 있어 AI 개발에 들어가는 비용을 절감할 수 있다. 막대한 자본을 끌어오기 어려운 저소득국가나 중소 업체, 개인 개발자들도 AI 기술을 활용할 수 있다.
소스 코드가 공개되기 때문에 AI 모델이 어떤 데이터를 사용하고, 어떤 판단 기준을 가지고, 어떤 결과를 내놓는지 투명하게 공개된다. 공정성과 책임성이 자연히 따라온다.
AI 모델의 잠재적인 위험을 사전에 파악하고, 예방·대응할 수 있다. AI 모델이 인간의 의도와 다르게 행동하거나, 혹은 해킹이나 조작에 노출, 사회·환경 문제를 일으키는 것을 막을 수 있다.
오픈소스 AI는 AI 연구자들뿐만 아니라 IT 기업들, 비영리 단체들, 대학 연구자들 등 다양한 주체들이 참여하고 있다. 자연어처리 분야 최대 오픈소스 플랫폼을 운영하는 프랑스의 스타트업 허깅페이스가 대표적인 오픈소스AI 플랫폼이며 한국의 업스테이지도 오픈LLM 플랫폼으로 ‘Open Ko-LLM 리더보드’를 운영하고 있다.
업스테이지는 “오픈소스는 AI업계에서의 중요한 트렌드이자 미래”라면서 “오픈소스를 지원하고 활용하는 것은 AI 업계의 책임과 덕목”이라고 밝혔다.
김민석 기자