Stable diffusion 인공지능 이미지 생성 소프트웨어 (한글명:스태이블 디퓨전)은 독일 뮌헨 대학교 Computer Vision & Learning Group (CompVis) 연구실의 연구결과를 기반으로 Stability AI와 Runway ML등의 지원으로 개발된 인공지능 딥러닝 기반의 text-to-image(텍스트-이미지) 모델입니다.
Stable diffusion은 텍스트 입력에 따라 사실적인 이미지를 생성할 수 있는 모델로써 텍스트 설명에 따라 세부적인 이미지를 생성하는 것뿐만 아니라, 인페인팅, 아웃페인팅, 텍스트 프롬프트를 가이드로 하는 이미지-이미지 변환과 같은 다른 작업에도 적용할 수 있습니다.
Stable diffusion 모델은 8GB 이상의 VRAM을 갖춘 GPU가 장착된 대부분의 개인용 컴퓨터에서 실행할 수 있습니다. 이는 DALL-E와 Midjourney와 같은 이전의 텍스트-이미지 모델들과는 달리 온라인 클라우드 서비스를 통해서만 접근할 수 있는 것이 아니라는 점에서 차별화되었습니다.
참고자료:
위키피디아 https://en.wikipedia.org/wiki/Stable_Diffusion
나무위키 https://namu.wiki/w/Stable%20Diffusion
개발역사 및 개발단체
Stable diffusion의 기술적인 라이센스는 Ludwig Maximilian University of Munich의 CompVis 그룹이 공개하였으며 Stability AI가 컴퓨팅 기부와 훈련 데이터를 제공하였습니다.
Stable diffusion 모델은 LAION과 EleutherAI라는 비영리 단체들로부터 데이터셋과 지원을 받았습니다.
LAION은 OpenCLIP이라는 새로운 텍스트 인코더를 개발하였으며, 이것은 stable diffusion 모델이 텍스트 입력에 따라 이미지를 생성하는 데 큰 도움이 되었습니다.
개발 단체 및 회사
CompVis 그룹 : https://ommer-lab.com/
Stability AI : https://stability.ai
소그공개 : https://huggingface.co/
LAION : https://laion.ai
Stable diffusion 버전별 소개
Stable diffusion(version 1.4) 모델의 첫 번째 버전은 2022년 8월 22일에 공개되었습니다. 이 버전은 latent diffusion model이라는 종류의 딥 생성 인공 신경망을 사용하였으며, CLIP 텍스트 인코더와 주의 메커니즘을 사용하여 텍스트 입력에 따라 이미지를 안내하였습니다. 이 버전은 512×512 픽셀의 해상도로 이미지를 생성할 수 있었습니다.
Stable diffusion(version 2.0) 모델의 두 번째 버전은 2022년 11월 23일에 공개되었습니다. 이 버전은 OpenCLIP-ViT/H라는 새로운 텍스트 인코더를 사용하였으며, LAION-5B 데이터셋의 미적인 부분집합으로부터 훈련되었습니다. 이 버전은 768×768 픽셀의 해상도로 이미지를 생성할 수 있었으며, super-resolution upscaler diffusion model이라는 새로운 기능을 추가하였습니다. 이 기능은 저해상도의 이미지를 고해상도로 변환할 수 있었습니다.
Stable diffusion(version XL ) 모델은 2023년 7월에 공개되었습니다. 이 버전은 기본 1024×1024 해상도를 도입하고 팔다리 및 텍스트 생성을 개선했습니다
Stable diffusion Web UI 버전 설치방법
자신의 컴퓨터에 설치하여 무료로 원하는대로 이미지를 생성할 수 있습니다.
공식적인 다운로드 페이지로써 자동설치파일과 자세한 설치방법이 기록되어있습니다.
GitHub – AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
Windows에서 자동 설치
1. Python 3.10.6 (최신 버전의 Python은 Torch를 지원하지 않음)을 설치하고 “PATH에 Python 추가”를 선택합니다.
2. git을 설치합니다.
3.stable-diffusion-webui 리포지토리를 다운로드합니다(예: .git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git)
4. Windows 탐색기에서 관리자가 아닌 일반 사용자로 실행합니다.
webui-user.bat