찾아보고 싶은 뉴스가 있다면, 검색
검색
최근검색어
  • 이미지젠 2.0
    2026-06-16
    검색기록 지우기
저장된 검색어가 없습니다.
검색어 저장 기능이 꺼져 있습니다.
검색어 저장 끄기
전체삭제
2
  • 첫 완성도는 오픈AI ‘이미지 2.0’… 반복하니 앤트로픽 ‘클로드’ 저력

    첫 완성도는 오픈AI ‘이미지 2.0’… 반복하니 앤트로픽 ‘클로드’ 저력

    “한국 신문 중 역사가 가장 오래 된 서울신문의 광고 이미지를 만들어줘.” 오픈AI의 ‘챗GPT 이미지 2.0’과 앤트로픽의 ‘클로드 디자인’ 기능이 잇달아 공개되면서 생성형 인공지능(AI) 이미지 시장이 경쟁 구도로 재편되는 가운데, 이런 명령어를 두 생성형 AI에 입력해 비교했다. 오픈AI 챗GPT는 1분 안에 결과물을 내놓았고, 앤트로픽 클로드디자인은 광고의 용도와 톤을 되묻는 과정을 거치며 약 5분이 소요됐다. 챗GPT가 생성한 포스터는 ‘120년의 신뢰, 시대를 읽다’라는 문구를 중심으로 과거와 현재를 대비하는 이미지를 배치해 완성도가 높았다. 일부 틀린 정보가 있었지만 전반적으로 텍스트 표현이 자연스럽고 전달력이 명확했다. 반면 클로드 디자인은 사용자의 의도를 반영해 흑백·빈티지 톤을 구현하는 데는 성공했지만, 시각적 요소가 적어 광고로서 눈에 덜 띄었다. 오픈AI의 챗GPT 이미지 2.0은 22일 공개됐다. 이미지 생성 AI의 활용 범위를 한 단계 끌어올렸다는 평가를 받는다. 앞서 오픈AI는 일본 애니메이션 스튜디오 ‘지브리’풍 이미지 열풍을 계기로 챗GPT를 대중화한 바 있다. 해당 모델은 ‘이미지젠(ImageGen) 2.0’을 기반으로 텍스트 표현 정확도를 크게 개선한 것이 특징이다. 기존 이미지 생성 AI의 한계로 지적되던 글자 왜곡 문제를 상당 부분 해소했고, 작은 글자·아이콘 요소 등 고난도 영역에서도 정밀한 결과를 구현할 수 있다. 다국어 이미지 생성 성능 역시 강화돼 한국어를 포함한 다양한 언어를 자연스럽게 표현할 수 있으며, 한 번에 최대 10개의 이미지를 생성하는 기능도 지원한다. 반면 앤트로픽은 지난 16일 내놓은 ‘클로드 오퍼스(Claude Opus) 4.7’을 기반으로 한 이미지 및 디자인 기능을 통해 차별화된 접근을 보이고 있다. 클로드 디자인은 결과물을 즉시 생성하기보다 사용자의 의도를 구체적으로 파악하는 과정을 거쳐 맞춤형 결과를 도출하는 방식이 특징이다. 이에 정교한 작업은 상대적으로 떨어지지만 여러 사람이 참여하는 집합 작업에 적합하다는 평가가 나온다. 앞서 구글은 지난해 8월 제미나이 애플리케이션에서 사용할 수 있는 이미지 생성 모델 ‘나노 바나나’를 선보였고, 지난 2월에는 속도와 제어력이 한층 강화된 ‘나노 바나나 2’를 공개했다. 메타도 ‘망고’라는 내부 코드명으로 이미지 생성 AI 모델을 개발 중인 것으로 알려졌다.
  • 베일 벗은 ‘덕테이프’…오픈AI, ‘챗GPT 이미지 2.0’ 공개

    베일 벗은 ‘덕테이프’…오픈AI, ‘챗GPT 이미지 2.0’ 공개

    인공지능(AI) 업계와 이용자들 사이에서 ‘덕테이프’(Duct Tape·덕트 테이프)라는 코드명으로 불렸던 AI 이미지 생성 도구의 정체가 예상대로 오픈AI의 새 모델로 드러났다. 오픈AI는 지난해 일본 애니메이션 스튜디오 ‘지브리’ 풍 그림을 만들어내는 기능으로 인기를 끈 이미지 도구의 새 버전인 ‘챗GPT 이미지 2.0’을 21일(현지시간) 공개했다. ‘이미지젠(ImageGen) 2.0’ 모델을 기반으로 만들어진 이 서비스는 앞서 AI 평가 플랫폼 ‘아레나’의 이용자 대상 테스트에서 글자 표현 문제를 완벽에 가깝게 해결했다는 호평을 받으며 관심을 끈 덕테이프의 정식 출시판이다. 오픈AI는 해당 모델에 대해 “단순히 재미를 위한 이미지 생성을 넘어서서 시각적 지능을 갖추고 있다”며 “특히 텍스트 처리에서 (전작 대비) 큰 진전을 이뤘다”고 소개했다. 이 모델은 또 전문적인 디자인 능력을 대폭 강화해 인포그래픽 등 시각 정보 표현에 강점을 보인다는 설명이다. 이에 따라 오픈AI는 이 모델이 교육용·연구용으로 특히 많이 활용될 것이라고 내다봤다. 이미지 생성 과정에서 추론 능력을 강화한 사고(Thinking)·프로(Pro) 모델도 선보였다. 이를 활용하면 사고의 연쇄 기능을 통해 보다 정확한 결과물을 얻을 수 있고, 만화와 같은 여러 장의 이미지에서 인물이나 캐릭터가 일관성을 유지하게 할 수도 있다. 오픈AI는 최근 핵심 사업에 집중하고 부차적인 사업은 정리한다는 기조하에 동영상 생성 도구인 ‘소라’(Sora) 서비스를 접겠다고 최근 발표한 바 있다. 동영상 도구와 달리 이미지 도구는 계속 개발하는 이유에 대해 오픈AI 관계자는 “챗GPT에 있어 이미지 생성은 궁극적인 개인 비서를 만드는 데 있어 핵심적인 요소”인 반면 “동영상에 대한 수요는 아직 그 정도는 아니었다”고 답했다. 이와 같은 이미지 생성 도구가 허위 정보 유포나 정치적 목적에 악용될 우려에 관한 질문에도 “우리는 사용자를 모니터링하고 보호하는 것은 물론이고 생성된 콘텐츠가 미치는 영향에 대해서도 매우 신중하게 다루고 있다”고 강조했다. 오픈AI는 챗GPT 이미지 2.0을 무료 이용자를 포함한 모든 계정에서 쓸 수 있도록 공개하고, 사고·프로 모델은 월 20∼200달러 요금제 이용자에게만 제공할 예정이다. 한편, 오픈AI의 이미지 생성 도구 공개는 이미지 소프트웨어(SW) 기업인 어도비가 연례 ‘어도비 서밋’을 개최하는 가운데 이뤄졌다. 사힐 굽타 어도비 파트너십 수석 총괄은 AI 모델들이 이미지 생성 등 분야에 진출하면서 어도비와 경쟁 관계가 된 것이 아니냐는 질문에 “고객들은 서로 다른 용도로 각 모델을 사용한다”고 일축했다.
위로