Ai 시대에서 딸쟁이들을 위한 가이드-1
범람하는 대 Ai시대. 온갖 무관해 보이는 영역에서도 Ai소리를 해대니 아마 질릴법도 했을것이다.
바일러도 아니고 매일 주식이랑 연관짓고, 일자리 문제니 인류의 미래니 하는
이야기들은 집어치우고, 딸쟁이들의 본분에 맞게 Ai가 어느 영역까지 되고 안되는지를
야썰이 아니지만 풀어보고자 한다.
우선 내가 Ai제작에 관심을 가진 시기는 Ai그림이 손가락을 못그린다 어쩐다 할때부터 였으니
상당히 초반 기간이다.
그이후로 본격적으로 직접 제작에 들어가기 시작한건 1년이 좀 넘었지 싶다.
일단 겉핡기로 아는분들이 대부분이기 때문에, 이부분에서 아주 기초적인 부분을 먼저 이야길 드리겠다.
우선 세상에 존재하는 Ai는, 내 기준으로 볼때 크게 두가지다
하나는 유료 혹은 일부 무료로 클라우드 서비스를 이용해 이미지 혹은 영상을 생성하는 경우.
대표적으로 우리에게 너무 친숙한 챗 gpt같은 계열이 되겠다.
인터넷이 끊기면 사용불가, 오로지 온라인 접속을 통해서 사용가능한 존재. 이경우 챗gpt와의 대화과정에서
발생하는 모든 연산이, 데이터 센터에서 이루어지기 때문에 내 컴퓨터 혹은 폰에 걸리는 리소스는 0
이런 상용화 모델들의 경우 당연히 자기네 끼리 피터지게 경쟁을 하기때문에
성능도 가장 좋고 결과물도 가장뛰어나며, 아주 빠르게 다음 버전으로 넘어가면서 업데이트가 이루어지고있다.
뭐 Gpt계열의 언어형 모듈은, 야썰 쓰는데 도움받는거 아닌이상 이미지,영상 제작하곤 아무짝에도 쓸모 없으니
페스하고.
딸쟁이들 사이에 이슈였던 '그록'이 대표적인 이미지 생성Ai로 보면 되겠다. 사진 제작엔 현재 1황인 구글의 나노바나나2
영상쪽에선 seedance 2.0이 치고 올라오고 잇으며 그외에도 klling이나 갑자기 서비스 중지하는 sora2.
뭐 이래저래 상용화 모델은 피터지게 싸우는중이다.
자 그런데 여기서 문제가 있다. 이런 상용화 모델은 철저하게 '성인'물을 만들어 주지않는다. 한때 검열제한이 거의 없던
'그록'이 희망으로 부상하던 시기가 있었으나.
멜론 머스크놈이 메로나 향을 풀풀 풍기며 슬금슬금 제한을 걸기 시작하더니 요새는 거의 검열을 피해가기 힘들어졌다.
그외에도 딱히 성인물이 아니더라도 구글 나노바나나2의 경우는 건전한 사진이라고 하더라도 유명 연예인의 경우
아예 간단한 사진 편집조차 할수없다.
이모든건 당연히, 딥페이크의 방지책이라 할수있고. 건전한 사회에서 당연히 막아야할 일임은 분명하다.
여기까지
그러니까 이런 상용화된 모델이, 내가 분류하는 Ai 이미지 생성 모델에 첫번째 분류다. 성능좋고 업데이트 빠르고
비록 유료지만 그만큼 퀄이 되는. 다만 제약이 크고 선정적인요소 혹은 그게 아니더라도 실제 인물의 사진을
비키니로 만드는것 조차 이미지 편집을 안해주는. 요 분류가 첫번째 분류.
그리고 다음 두번째 분류로 넘어가겠다.
여기에 대표적인 주자는 언론에서도 이야기하는 중국발 ai성장세가 무섭다느니, 미국이 중국에 견제하기위해
칩셋 수출에 제약을 걸었다느니...하는 중국쪽이다.
중국쪽 Ai가 이미지 혹은영상쪽에서 아주 특출나게 치고 올라오는 중인데 (무식하게 무단으로 학습 운운은 이야기 할게
못된다, 그걸 가장 잘하고 먼저한곳이고 현재도 하고있는데가 구글이니까)
일반적 시선하고 다르게, Ai쪽은 데이터의 학습문제보다 중요한건 학습할때의 알고리즘의 비중이 가장높다.
칩셋은 자체적으로 못만들고 있지만. 알고리즘은대체 어떻게 쫓아온건지 모르겠는데
영상쪽은 중국쪽이 단연 앞서올라오는 중이다.
그리고 이런 회사중 몇곳의 대표적인곳. 알리바바 그룹에서 자기네 Ai쪽의 핵심 모델 몇개를
'오픈소스'형태로 풀었다는 것이다.
그래서 그걸 온라인 클라우드 서비스가 아니라, 개인의 PC에 툴을 설치하고 사용함으로써
비용지불 없이, 로컬로 직접 비용을 내지않고 사진 혹은 영상을 뽑을수 있다.
그리고 그렇게 직접 프로그램을 자신의 pc에 설치하고, 오픈소스 모델을 불러와 로딩을 시키고
로컬로 제작하는 것이. 이제 설명드리고자 하는 두번째 방안이다.
그런데 이렇게 말하면 누구나 pc에 설치만 하면 사용 가능, 일것 같지만 그렇진 않다.
우선 이미지든, 영상이든 오픈소스 모델에 따라 천차만별이지만 실사의 이미지를 뽑기
위한 기본적인 사양은
최소사양이 3070, 12g부터로 일단 난 생각을 하고있다. 영상 제작은 그보다 훨씬 더 넉넉한 사양이
필요하다.
이 로컬ai든 뭐든 연산을하고 생성하는데엔 cpu는 거의 사용되지않는다, 오로지 엔디비아의cuda프로세서를
사용하는 그래픽 카드의 Vram만 사용하게된다.
최신 그래픽 카드의 gpu의 클럭이 빠를수록 사진이나 영상이 빨리 제작되긴 하지만, Vram이 모자르면
속도를 떠나 아예 제작 자체가 안된다.
최소 12G의 그래픽 카드가 필요하고, 후술하게될 Lora제작에는 최소 24G의 그래픽 카드 리소스가 필요하기에
여기에 필요한 최소치의 일반적인 그래픽 카드는 3090,4090,5090급의 24G이상의 Vram을 탑재한 모델이
필요하다. 물론 좀더 세부적으로 들어가면야, Lora제작엔 서버를 대여해서 유료로 제작을 하고 생성만
자기 컴퓨터에서 돌린다면 12g로 어떻게든 해볼만 하긴하다.
글로만 써서 지루할거 같아서 미안하다. 그러니 환기를 좀 시키겠다.
우선 간단한 예시를 하나 보자. 딸쟁이 여러분들이 가령 이미지 한장을 생성한다고 가정해보자.
그리고 이미지 생성에 1탑인 나노바나나2를 사용해서. 그나마 할수있는 최선을 다해 이미지를 하나 생성을 해본다
가정해보자
이 사진은 동일한 프롬프트를 사용해 이미지를 생성한 비교다. 왼쪽은 직접 로컬에서 제작한 이미지고, 우측은 끝판왕 격인 나노바나나2로
제작을햇다.
둘중 어떤 이미지가 같은 프롬프트에서 훨씬 자연스럽고, 디테일이 살아있는지 보일것이다. 왼쪽은 Ai사진 특유의 부자연 스러운
'뷰티'이미지처럼 생성이 된데다 배경 소품의 디테일등 많은 부분에서 밀린다.
그렇다면 여러분은 의문이 들것이다. 그럼 도대체 로컬에서 쓰는 의미가 무엇일까? 퀄도 좋고 컴퓨터 사양도 필요없고
하루 생성 제한이 있어도, 이미지 제작은 거의 무한대에 가깝게 제작이 가능한 나노바나나2를 쓰는게 당연히 좋지 않을까??
여기서 이제 차이점을 좀더 서술해보자.
지금 이 이미지를 생성하는데엔 T2i라는 방식이 쓰였다. Text to image. 그러니까 즉.
-한국의 여름의 백사장을 배경으로 20대의 한국 여성이 흰색 비키니를 입고 백사장에 무릎을 꿇고 있다-
이 말을 기반으로 이미지를 생성했다는 의미다. 그럼....여기서 선택이 갈린다.
만일 당신은 불특정 누군가의 이미지를 생성하고자 하는게 아니라. 특정인의 모습이 보고싶다면?
가령 여친일수도, 혹은 와이프일수도 있는 어떤 특정 인물 말이다.
그런 경우라면 T2i로는 방법이 아니다. 이럴땐 I2I 즉 image to image의 방식을 쓰게된다.
여기서 차이점이 발생하는데, 나노바나나2의 경우 만약 당신이 실존 인물의 사진을 한장 올리고
비키니를 입게 해달라, 배경도 해변으로 바꿔달라. 하는순간 일단 수영복으로 바꿔주지 않는다. 정책에 위반된다고
하면서.
그럼 래쉬가드로 타협을 보고 만들자. 그럼 배경이 바뀌고 라이팅이 바뀌는 순간. 인물이 조금씩 정체성을 잃어버리고
비슷하거나 닮은 누군가로 변경될 확율이 높아지기 시작한다
즉 어떠한 특정한 인물로, 특정한 복장으로, 특정 행위를 하고싶다? 그것에 대한 제약이 크게 걸리기 시작한다.
"그럼 여친이든, 와이프든. 특정인물로 제작하는건 안되나요?"
그것에 대한 대답이, 바로 로컬 ai에게 있다. 여자A라는 사람이 있다고 가정하자. 그사람의 사진 수십장을 준비한다
얼굴이 잘나온 정면 측면, 클로즈업 상반신.전신...등등
그렇게 일종의 데이터세트를 만들고, 로컬에서 딥러닝을 통해 인물을 학습을 시키는 과정을 거친다.
바로 여기에 위에 서술한 최소 24g의 vram이 필요해진다.
사전준비부터 제작까지 긴시간과 여러번의 교정 작업을 거치면 '특정'인물의 얼굴과 체형 모습을 갖춘 인물데이터세트가
완성이 된다.
그리고 그걸 기반으로 이미지를 제작한다면, 상용 모델에 비해 전체 퀄리티는 부족하지만. 인물을 특정하고 19금의 문턱을 자유롭게
넘나들수있게된다
이부분은 추가로 설명하고 썰풀게 많기 때문에, 혹시나 이것도 재미있게 읽은분이 있다면 추가로 가이드를 작성해 보도록 하겠다.
뭘 이딴걸 썰게에 쓰냐 라고 할 분도 있을수 있기에, 일단 요부분에서 끊도록 하겠다.
혹시나 개인적인 궁굼즘이 있다면 텔레그램 으로 라도 개인 상담을 해드리겠다
뭐 설치 방법을 궁굼해 하실분도 있을수 있고, 수위라던지 그런게 궁굼할분도 있을수 있으니
텔레: @NetoAi
블루메딕 후기작성시 10,000포인트 증정


윤지
쩐띵띵
팁토스타킹
왕아아아아박
로얄샬로뜨
xyzzxy
juhbsgs
국화





