DALL·E 2 베타 이미지 제너레이터 사용법 그림 자동 생성 AI 인공지능 기술

SOMETHING MAKES US BRIGHT|2022. 11. 8. 19:43
반응형

DALL·E 2 베타 이미지 제너레이터 사용법 그림 생성 AI 

 


Dall E 2 자동 생성 이미지

인공지능의 한계는 어디까지 인가, 고도화의 끝은 어디인가 

와우 라는 말이 먼저 나온다. 이미지를 자동으로 생성해주는 AI라니, 기술의 놀라운 발전에 다시 한 번 놀라게 된다. 

우리는 기억해야한다. 고대시대부터 중세시대까지 사람들이 그토록 열망하던 벽화부터 초상화까지. 왜그렇게 그림에 열중했나. 우리가 그림을 그리는 이유는 간단했다. 오래동안 그 형상을 기억하고 싶어서이다. 사람은 망각의 동물이니 이런 저런소리를 하다가도 어쨋든 우린 기억을 통해 그 때의 감정을 되살리고 싶어하고 그 감정을 다시 느끼며 뇌에 특정 호르몬을 분비하게 되니깐 말이다. 

왜 그렇게 까지 사람들이 그 감정에 집착하게 되었을까. 그림이란 건 실제로 엄청난 영감을 주기도하고 사람의 감각을 건드리게되는 주요한 행동이기도하다. 우리는 말초신경계의 늪에서 헤어나오지 못하고 있는게 사실이지 않은가. 

그림을 그리던 사람들은 벽화에 내가 봤던 노을을 기록하고 내가 길렀던 가축, 동물, 반려견 등을 기록하여 추억하고 회상한다. 그리곤 눈물짓거나 웃게되지. 중세시대엔 어땠는가. 우리가 알고 있는 유명한 화가들은 출세를 위해 왕족과 귀족들의 초상화를 그리면서 자신의 유명세를 널리 알릴 수 있게 되었다. 우리가 제사상에 오래된 어르신의 영정사진을 놓고 기억하고 추모하는것과 맥락은 같다는 뜻이다. 

그런데 어느날입니까? 사진이 나오기 시작합니다. 1900년 이전이니 1800년도 당시에 카메라가 발명됩니다. 렌즈를 통한 찰나의 순간을 기록하여 종이에 빛을 뿌려대어 우리의 망막에도 비치기 시작하게 된 것이다. 굉장히 단순한 알고리즘. 렌즈의 방향을 타깃에 조준하고 버튼을 클릭하면 끝이라는 놀라운 작동법에 반영구적으로 기억할 수 있는 오브젝트를 얻을 수 있게 된 것이다. 실제로 사진사가 나타나면서 누구나 뻔히 할 수 있는 말중에 하나인

"그림 그리는 사람들은 이제 다 굶어 죽게 생겼어" 

라고 더 이상 초상화를 그릴 필요가 없게 되는 점으로 인해 화가들의 미래가 불투명하다고 조잘댔다. 

하지만 여전히 그림을 그리는 방법은 다양하게 존재한다. 클래식은 영원하고 즐기는 사람의 수요는 늘 있기 마련. 아직도 펌프하는 사람도 있는것처럼.

이제 무엇을 의미하는지 감이 오는가. Dall E 2의 탄생으로 인해 사람들은 더 이상 그림을 그릴 필요가 없이 원하는 이미지를 얻을 수 있다. 심지어 유화, 수채화 같은 클래식한 방식의 드로잉과 일러스트와 같은 디지털의 다양한 형태로도 말이다. 그림을 그릴 필요가 없다. 그림을 그리는 행위는 재밌고 의미있는 일이기 때문에 그 수요가 줄지는 않을것이다. 다만 우리는 많은 시간을 아끼고 원하는 목표에 도달하기 위해 쉽게 이미지를 생성하여 사용할 수 있을 것이다. 

사진? 사진 필요하지. 역시 내가 직접 눈으로 보고 느끼는 히말라야 산맥의 눈 덮힌 능선은 감히 이루 말할 수 없을것이다. 그리고 그 기록을 촬영한 결과물은 당연히 가치가 배가 될 것이다. 

내가 단순히 어디에 이미지를 사용하기 위해 필요한 사진을 찍으러 굳이 갈 필요가 없다는 사실을 깨닫게 된다면. 눈을 감고 내가 상상하는 그림들이 바로 앞에 언제 어디서든 펼쳐질 수 있다면. 그것은 기본적으로 우리의 시간을 엄청나게 절감해주는 역할을 하게 될 것이다. 


사용법은 매우 간단하다. API를 오픈했고 어떤 유저도 사용할 수 있게 프론트 UI 작업까지 손수 마쳐주었다. OpenAI는 지식, 학문에만 몰두하는 그룹이 아니다라는 것이 새삼 느껴진다. 코딩을 사용하지 못하는 사용자들에게 바로 활용할 수 있게 오픈되어 있으니 말이다. 

1. OpenAI 회원가입 - 이제는 이런 곳들은 가입을 무조건 해야하는 시대가 왔다. 안되어있으면 바로하자. 

2. 로그인 

3. 인터랙션 창에 인풋 문장을 넣는다. - 쉽게말하면 내가 원하는 이미지를 텍스트로 넣는다. 아 그리고 영어 입력을 위해 파파고를 켠다. 영어 공부하지 않아도 된다. 번역기 돌리고 앞으로는 언어가 시스템을 통해 통일된 형태로 소통하게 될 것이니 공부도 적당히만 하자.

4. Generate 누르고 기다린다. - 재밌는 인풋들을 그사이에 소개시켜준다. 

5. 결과 확인 - 4장씩이나 한 번에 출력한다. 미쳤네. 사람들의 니즈를 정확히 알고 있다. 이렇게 4장을 만들어 주기 위해 우리는 모르지만 백엔드에서는 요청을 4바퀴 돌려 생성하고 그 결과를 디스플레이한다고.

인풋은 휴대용 우주를 신스웨이브 버전으로 그린다면? (신스웨이브는 음악 장르 중 하나이다.)

이미지는 너무 커서! 좀 줄였다. 휴대용 우주. 이게 뭔 말인가 싶지만. 나도 그냥 적어 넣은 말이다. 블로그 이름처럼 말이다. 

누가 상상할 수 있는가. 포켓 안에 지구? 우주? 우주 바탕에 포켓? 모바일 폰 안에 우주? 휴대폰과 우주? 학습이라는 것은 이렇게 진화한다. 


달이2의 팁이 있다면, 인풋은 다양하게 할 수록 좋다. 피사체 대상을 명시하고, 어떤 상황에 있는지 설명하고, 어떤 스타일의 그림을 원하는지에 대한 것이다. 

배경 - 우주 

피사체 - 꽃, 동물, 울고있는 사람 

그림 스타일 - 수채화, 유화, 스프레이, 일러스트, 램브란트 풍(도 된다.)

제너레이트 버튼 위 서프라이즈 미 버튼을 클릭하면 몇 가지 예시가 나온다. (어버버 할까봐 이런 것까지 준비했다고? 센스 무엇?)

  • 3D render of a small pink balloon dog in a light pink room
  • an astronaut playing basketball with cats in space, digital art
  • synthwave sports car
  • teddy bears shopping for groceries, one-line drawing
  • abstract pencil and watercolor art of a lonely robot holding a balloon
  • an astronaut lounging in a tropical resort in space, vaporwave
  • a stained glass window depicting a hamburger and french fries

성당에 있는 유리를 일컫는 스테인 글라스에 햄버거와 프렌치 프라이라고? 어떤 놈이 이런 상상을 하겠는가. AI는 사람을 몇 천배 앞을 보고 있다.


그래서 저작권은 어떻게 할건데?

일단 정답부터 빠르게 말하자면, 상관없다. 상관없다고? 이게 대인배지. 명확하게는 아직까지는 법적 가이드라인이 만들어지지 않은 탓에 어떤 문제가 있을지 모르지만, 상업적 이용에는 상관없이 사용할 수 있다. 내가 그림을 그렸는지 사진을 찍었는지 AI가 만들었는지 누가 어떻게 알 것인가? 출처를 대라라고 할 때는 "저 친구가 만들었는데요. AI를 가리키며." 라고 하면 누가 그 기계를 탓하랴.

이슈가 있긴하다. 법적인 테두리에 놓기전에 한 가지 장치가 있다면 지나치게 섹슈얼한 도구로 사용되는 것은 금지. 너무 정치적이거나 일반적이지 않은 폭력적, 노골적인 데이터가 출력되는 것은 최소화했다고 한다. 그리고 너무 사실적인 사람의 얼굴 역시 악용될 우려가 있어 방지 시스템이 작동하게 처리했다고 한다. 

베타버전 이렇게 만드는데 풀 서비스로 나오면 아주 그냥 다 뿌개고 돌아다닐 것 같다.

 


기능 중 수정하여 삽입하거나 결과물 자체를 변환하는 것 역시 가능하다. 소비자가 원하는걸 정확히 알고 있다. 소비자라기 보다 우리 일반적인 사람들을 대상으로 말이다. 사업은 이렇게 해야하는데 말이지.

마지막으로, 다시 언급하지만 베타 버전으로 1개월에 50개의 크레딧을 제공한다. 50번 생성이 가능하다는 뜻. 생성을 한 뒤에 다운을 받거나 삭제하거나 자유지만 생성하는데 필요한 서버구동 비용은 챙기겠다는 뜻. 

그리고 15달러에 115회의 크레딧을 제공한다. 더블업도 가능. (환율이 미쳐날뛰긴 해서 일부 아쉬울 순 있겠다.)

 


무엇보다 국내에서 해당 모델을 구현하거나 API 콜을 통해 국내 버전으로 만들어서 판매한다고 해도 꽤나 쏠쏠할거 같다. 

우리가 알고 있는 스톡마켓, 게티이미지 등 다양한 플랫폼은 이제 어떻게 먹구 살아야하나. 물론 수요는 있겠지 올드패션을 좋아하는 사람들은 늘 있고 아이들은 처음보는 것에 빠져서 다시 유행이 돌고 도는 것 처럼. 하지만 그들의 수익 모델이 좁아진다 못해 바늘구멍이 되는 것은 부정할 수 없는 사실이라고 생각한다. 

그럼, 그림 그리는 사람들은 어떻게 함???

그럼, 음악 하는 사람들도 곧 AI가 버튼 클릭하거나 텍스트 입력으로 음악 뚱땅 만들어주는 거 아님?

그럼 음악 하는 사람들 어떻게 함?

...

깊게 생각해볼 시간이 다가온다.

 

 

 


LINK

DALL·E 2 - OpenAI

 

DALL·E 2

DALL·E 2 is a new AI system that can create realistic images and art from a description in natural language.

openai.com

 


 

반응형

댓글()