본문 바로가기
카테고리 없음

구글, AI 기반 이미지 생성기 출시

by Saim SD 2024. 2. 2.
반응형

Image Credits: Sean Gallup / Getty Images

Taylor Swift의 딥페이크는 망할 것입니다. Google은 이미지 생성을 위한 새로운 AI 기반 도구인 ImageFX를 출시합니다.

Google DeepMind 팀이 개발한 GenAI 이미지 모델인 Imagen 2를 기반으로 ImageFX는 이미지를 생성하고 편집할 수 있는 프롬프트 기반 UI를 제공합니다. 이는 OpenAI의 DALL-E 3, Midjourney, Meta의 Imagine with Meta AI, Microsoft Designer와 같은 도구와 다르지 않습니다. 그러나 ImageFX의 독특한 특징은 사용자가 창작물과 아이디어의 "인접한 차원"을 실험할 수 있는 키워드 제안 목록인 "표현 칩"입니다.

"실험과 창의성을 위해 설계된 ImageFX를 사용하면 간단한 텍스트 프롬프트로 이미지를 만든 다음 표현 칩을 사용하여 새로운 프롬프트로 쉽게 수정할 수 있습니다."라고 Google은 블로그 게시물에 썼습니다.

그러나 특히 최근 사건을 고려할 때 남용 가능성은 어떻습니까?

Google은 ImageFX가 의도하지 않은 방식으로 사용될 수 없도록 조치를 취했다고 주장합니다. 예를 들어 폭력적, 공격적, 성적으로 노골적인 콘텐츠와 같은 '문제가 있는 출력'을 제한하기 위해 '기술적 보호 장치'를 추가하는 등의 조치를 취했습니다. ImageFX에는 공인으로 추정되는 "이름이 지정된 사람"에 대한 프롬프트 수준 필터도 있습니다. 하지만 Google은 언론 자료에서 이 점에 대해 특별히 명확하게 밝히지 않았습니다.

구글은 “우리는 처음부터 훈련 데이터의 안전에 투자했다”라고 밝혔다. "또한 AI 원칙에 따라 잠재적으로 유해하고 문제가 있는 콘텐츠를 식별하고 완화하기 위해 광범위한 적대적 테스트와 레드팀 구성을 수행했습니다."

추가적인 안전 조치로 Google은 ImageFX와 SynthID를 사용하여 생성된 이미지에 태그를 지정했습니다. SynthID는 이미지 편집 및 자르기에 강력한 것으로 알려진 디지털 워터마크입니다.

An image sample from Imagen 2. Image Credits: Google

구글, AI 기반 이미지 생성기 출시

"SynthID 워터마크는 인간의 눈에 감지되지 않지만 식별을 위해 감지될 수 있습니다." Google은 블로그 게시물에서 계속해서 말합니다. "'이 이미지 정보'에 추가된 통찰력을 통해 Google 검색이나 Chrome에서 이미지를 발견했을 때 Google의 AI 도구를 사용하여 이미지가 생성되었는지 여부를 알 수 있습니다."

실험적인 AI 프로젝트를 위한 Google의 웹 앱인 AI Test Kitchen에서 ImageFX를 찾을 수 있습니다.

이미지 2 확장됨

Another sample from Imagen 2. Image Credits: Google

오늘 관련 뉴스에서 Google은 이번 주부터 차세대 AI 검색 경험과 관리형 AI 서비스 Vertex AI 제품군을 포함하여 더 많은 제품과 서비스에 Imagen 2를 도입할 것이라고 밝혔습니다.

이제 Google Ads의 텍스트-이미지 변환 기능과 Google의 생산성을 위한 GenAI 제품군인 Duet AI in Workspace를 지원하는 Imagen 2가 Google의 SGE(Search Generative Experience)에 도입되었습니다. 지난 10월 Google 이미지 검색에 사용자를 위한 이미지 생성 도구를 표시하기 시작한 SGE는 이제 이미지 생성을 위해 Imagen 2를 활용합니다. 사용자는 원하는 이미지 종류를 지정하는 프롬프트를 입력할 수 있으며 SGE는 SGE 대화 경험에서 직접 4개의 결과를 반환합니다.

Vertex AI에서 Imagen 2는 API를 통해 Google Cloud 고객에게 제공됩니다. 다른 곳에서는 이제 Imagen 2를 Google의 AI 기반 챗봇인 Bard를 통해 호출할 수 있습니다.

"Imagen 2를 사용하면 Bard는 간단하거나 복잡한 프롬프트를 이해하여 다양한 고품질 이미지를 생성할 수 있습니다."라고 Google은 설명합니다. "'서핑보드를 타는 개 이미지 만들기'와 같은 설명만 입력하면 Bard가 귀하의 아이디어를 실현하는 데 도움이 되는 광범위한 맞춤형 시각 자료를 생성해 드립니다."

Google은 Imagen 2를 훈련하는 데 사용한 데이터를 아직 공개하지 않았는데, 이는 실망스럽기는 하지만 그다지 놀라운 일은 아닙니다. Google과 같은 GenAI 공급업체가 공개적으로 사용 가능한(심지어 저작권이 있는) 데이터를 기반으로 모델을 교육한 다음 해당 모델을 전환하여 상용화할 수 있는지 여부에 대한 공개적인 법적 질문입니다.

 

반응형