이미지 생성 분야에서 다층 이미지 생성 기술은 사용자가 생성 모델과 상호 작용하는 방식을 완전히 변화시킨 혁명을 이끌고 있습니다. 이 기술을 통해 사용자는 특정 이미지 계층을 분리, 선택 및 편집 할 수 있으므로 전례없는 창의적인 자유를 제공 할 수 있습니다. 최근 Microsoft의 리서치 팀은 "익명 지역 변압기"(ART)라는 혁신적인 기술을 출시하여 글로벌 텍스트 큐 및 익명 지역 레이아웃을 기반으로 가변적 인 다층 투명 이미지를 직접 생성 할 수 있습니다.

Art의 디자인은 "스키마 이론"에서 영감을 얻어 생성 모델이 익명의 지역 레이아웃을 채택하여 어떤 텍스트 정보와 어떤 시각적 정보를 일으킨 지 독립적으로 결정할 수 있습니다. 이 접근법은 전통적인 시맨틱 레이아웃과 급격히 대조됩니다. 전통적인 시맨틱 레이아웃은 일반적으로 명확한 서신이 필요하지만 Art의 익명 영역 레이아웃은 더 큰 유연성을 제공하여 생성 프로세스가보다 지능적이고 효율적입니다.
ART는 각 익명 영역과 관련된 시각 정보 만 선택하여주의 계산 비용을 크게 줄이는 레이어 별 지역 기반 자르기 메커니즘을 도입한다는 점을 언급 할 가치가 있습니다. 이 방법은 발전 속도를 높이고 전체주의 방법보다 12 배 이상 빠를뿐만 아니라 레이어 간의 충돌을 효과적으로 줄이고 50 개 이상의 다른 수준에서 이미지 생성을 처리 할 수 있습니다. 이 효율적인 처리 기능은 복잡한 이미지 생성 작업을 강력하게 지원합니다.
또한 ART는 또한 가변적 인 다층 이미지의 투명성을 공동 방식으로 인코딩하고 디코딩하는 고품질의 다층 투명 이미지 자동 코더를 제안했습니다. 이 혁신적인 디자인은 정확한 제어 및 확장 가능한 계층 생성을위한 새로운 가능성을 제공하여 대화 형 컨텐츠 생성의 개발을 더욱 주도합니다. 이 기술을 통해 사용자는 모든 수준의 이미지를보다 유연하게 제어하고보다 세련된 편집 및 생성을 달성 할 수 있습니다.
프로젝트 : https://art-msra.github.io/
핵심 사항 :
ART는 글로벌 텍스트 프롬프트 및 익명의 지역 레이아웃을 기반으로 다층 투명 이미지를 직접 생성 할 수 있습니다.
층별 영역 자르기 메커니즘은 이미지 생성 효율을 크게 향상시키기 위해 채택되며, 이는 전통적인 방법보다 12 배 빠릅니다.
새로운 고품질 자동 인코더는 다층 투명 이미지의 정확한 제어 및 생성을 지원하여 대화식 컨텐츠 생성을 촉진합니다.