SDXL(Stable Diffusion XL) v1.0 Released

2023. 7. 27. 17:06Stable Diffusion XL

Stable Diffusion XL / SDXL Pipeline

1. Stable Diffusion XL / SDXL은 무엇입니까?

SDXL(Stable Diffusion XL)은 더 짧고 간단한 프롬프트를 사용하면서 사실적인 얼굴, 이미지 내에서 읽을 수 있는 텍스트, 더 나은 이미지 구성을 생성할 수 있는 최신 AI 이미지 생성 모델입니다.
이전 제품과 마찬가지로 SDXL은 이미지 대 이미지 프롬프트, 인페인팅(이미지의 선택된 부분 재구상) 및 아웃페인팅(이미지 테두리 외부에 있는 새 부분 만들기)을 사용하여 이미지 변형을 생성할 수 있습니다.

Stability Diffusion XL은 현재 DreamStudio와 NightCafe Studio 및 ClipDrop과 같은 기타 이미지 생성 앱을 통해 사용할 수 있으며, 오늘부터 Base Model의 Version 1.0이 출시되었습니다.

2. Stable Diffusion XL / SDXL의 설명

SDXL/Stable Diffusion XL은 잠상 확산을 위한 전문가 혼합 파이프라인으로 구성됩니다.
첫 번째 단계에서는 기본 모델을 사용하여 (노이즈가 있는) 잠상을 생성한 다음, 최종 노이즈 제거 단계에 특화된 정제 모델로 추가 처리합니다. 기본 모델은 독립형 모듈로 사용할 수 있습니다.

추가로 다음과 같이 2단계 파이프라인을 사용할 수도 있습니다.
먼저 기본 모델을 사용하여 원하는 출력 크기의 잠복을 생성합니다.
두 번째 단계에서는 특수한 고해상도 모델을 사용하고 동일한 프롬프트를 사용하여 첫 번째 단계에서 생성된 잠상에 SDEdit(일반적으로 "img2img"라고 부르는)라는 기술을 적용합니다.
이 기법은 더 많은 함수 평가가 필요하기 때문에 첫 번째 기법보다 약간 느립니다.

SDXL/Stable Diffusion XL의 소스 코드는 https://github.com/Stability-AI/generative-models 에서 확인할 수 있습니다.

3. Stable Diffusion보다 SDXL이 더 나은 이유

A. 좀 더 명확한 텍스트 생성

SDXL과 나머지 AI 이미지 생성 모델(Deep Floyd 제외)의 가장 중요한 차이점 중 하나는 읽을 수 있는 텍스트를 생성할 수 있다는 것입니다. (정상적인 글자 출력)
이는 이전 버전의 SD(Stable Diffusion)나 다른 모델에서는 불가능했습니다.
이미지의 텍스트가 항상 옳은 것은 아니지만 대부분의 다른 AI 아트 모델보다 좀 더 명확합니다.

B. 정교한 인체 해부학

이전 SD 모델은 정확한 인체 해부학적 구조를 생성하는 데 눈에 띄는 문제가 있었습니다.
그들은 종종 팔다리가 더 많거나(손의 모양 등을 포함하여) 없어졌으며 얼굴이 극도로 변형되었습니다.

Stable Diffusion XL은 이를 어느 정도 수정합니다.
이전 버전보다 품질은 이제 훨씬 좋아졌습니다.

C. 예술적 스타일

이것이 SDXL을 더 좋게 만들지는 않지만 이전과는 다소 다릅니다.
Stable Diffusion XL은 이미지 생성을 위한 여러 가지 예술적 스타일을 제공합니다.

스타일 없음, 향상, 애니메이션, 사진, 디지털 아트, 만화책, 판타지 아트, 아날로그 필름, 네온 펑크, 이중성, 로우 폴리, 종이 접기, 라인 아트, 공예 점토, 시네마틱, 3D 모델 및 픽셀 아트가 기본적으로 가능합니다.

D. 더 손쉽고, 더 짧은 프롬프트

SDXL은 이전 모델보다 짧은 프롬프트를 훨씬 더 잘 이해합니다.
원하는 결과를 얻기 위해 프롬프트를 위해 긴 텍스트의 표현이 필요하지 않습니다.
스타일은 어느 정도 이를 달성하는 데 도움이 되지만, 스타일이 없어도 SDXL은 나은 결과물을 보여줍니다.

E. 향상된 구성

향상된 이미지 구성을 통해 너무 많은 노력 없이 거의 모든 유형의 프롬프트에 대해 놀라운 비주얼을 만들 수 있습니다.

 

Comparison by SD / SDXL Model, Version