Ai 관련 잡썰-1
서스텐스
5
49
2
4시간전
ai로 이미지를 생성한다 혹은 동영상을 만든다 라고 했을때. 이쪽으로 관심이 없거나 혹은
유료 서비스 모델로만 간접적으로 체험하신 분들이 다수일듯 합니다.
가령 챗gpt혹은 한동안 ai쪽에 관심없던 분들도 들어보셨을만한 구글 '나노 바나나'깉은것 말이죠
이 구글 제미나이 2.5(나노 바나나)의 경우 제 개인적 평가로는 현존 이미지 생성 모델중 최강이
아닐까 싶습니다.
다만 이렇게 구글같은 대기업에서 내놓은 상용 모델은 제한이 굉장히 많습니다.
단순히 유료의 문제가 아니라, 해상도가 1024x1024로 고정이 되고, 조금이라도 성적이거나 폭력적인 요소가
들어가는 경우 생성을 하지 않습니다.
얼마전에 '그록'에선 일부나마 성인컨텐츠를 2.5d 2d 쪽으론 제한을 낮춰놨다고 해서 화제가 있었는데
얼마안가 바로 수위를 조금씩 낮추더니 지금은 거의 막힌 수준입니다.
그래서 결국 성능이 좀 떨어지더라도, 무료로 오픈소스로 풀려서 개인 컴퓨터로 직접
로컬로 돌리는 방식이 유일한 대안이라고 볼수도 있습니다(적어도 성인물엔 말이죠)
이쪽을 주도하는 몇몇 모델들이 있고, 오픈소스로 풀려있기에 누구나 사용이 가능합니다(컴퓨터 성능만 받쳐준다면 말이죠)
우선 첫번째 썰은
T2i에 관한 잡썰입니다. text to image의 약칭인데. 말그대로 글로써서 이미지를 만드는 방식입니다.
어떤 이미지를 생성하고 싶은지를 글로 써서 입력하면, 해당하는 이미지를 만들어 주는 방식인데
초기엔 자연어를 인식하지 못했기에, 단어의 나열로 입력을 해야 했습니다
(흔히 손가락이 6개면 ai다, 찐빠가 났다)하는 경우가 대부분 이시기 모델입니다.
요새도 모바일 게임업계쪽에 ai를 쓰다가 걸린 흔적이라고 나오는 손가락 문제에 대해선, 그래서 잘 이해가 안되는게
구형 오픈소스 모델에서나 날법한 찐빠가 아직까지 내고 있다는건, 정말 저로써는 이해가 안가는
부분이기도 합니다.
최근에 로컬로 돌리는 이미지 모델중엔, 여전히 구형 모델인 sdxl기반은 여전히 저사양에서도 돌아갈수 있다는
장점때문에 아직까지도 많은 유저층이 있고, 그후로 등장한 flux기 자연어도 이해하면서도 sdxl에 비해 월등한
퀄리티를 자랑하게 되었고, 그후에도 나타났다가 퀄은 좋지만 생성속도가 느리고 변형이 어렵다는 이유로 사장된
hi-dream같은 모델도 존재하는등.
오픈소스라고 해도, 다사다난하게 출시되고 사라지고 있습니다. 그리고 오픈소스가 반드시 퀄이 낮은건 아닌게
이쪽을 주도하는게 중국쪽 대기업 산하 ai쪽이라
구글같은 플랫폼에 비해 뒤쳐질뿐 어지간한 상용모델과는 다 비빌수준은 됩니다.
제가 요새 쓰는 방식은 t2i 인건 동일하지만. 계속 모델이 앞서감에 따라 조금씩 그 생성방식도 여러가지 갈래가 생기고 선택권도 다양해 졌습니다.
사진은 기존에 실사 사진을 불러들이고. 이 사진을 ai가 자동으로 인식해서, 어떤 사진인지를 아주 세밀하고 상세하게 설명을 해주는 기능입니다.
T2i를 생성하려고 할때, 난 어떤어떤 사진처럼 만들고싶다. 그런데 그걸 설명하자니 너무 어렵다. 라고 할때 이 방식을 씁니다. 사실 거의 극 세밀 묘사가
가능하기에, 왠만한 문장력과 어휘력으론 이렇게 디테일한 묘사를 자동으로 만들어 주는 방식을 앞서기가 어렵습니다.
이 기능을 통해 추출한 세부적인 묘사'프롬프트'를 추출해내고. 이걸 다음에 입력합니다.
여기서는 기본 이미지의 생성 노드입니다. 프롬프트를 넣어서 어떤 사진을 만들고 싶은지를 입력합니다. 그외에 추적인 세부사항을 조절을 해야합니다만. 여기선 샘플로 기본 모델만을 적용하는
테스트 과정을 거치기에, 크게 손을 댄 부분은 없습니다.
이렇게 해서 한번 생성된 이미지를 다시한번 업스케일링 하는 노드를 돌립니다.
기본 해상도가 1200x1600으로 높지 않은 해상도기도 하고, 디테일을 높이는 목적으로 한번 돌려줍니다.
이렇게 하면 최종적인 사진 생성이 됩니다. 대부분은 바닐라 형태고. 기존 모델에 광원효과와 카메라 필터 정도만 추가된 상태입니다.
뭐 사실 이정도면 약간은 시시하게 느껴지실수도 있습니다. 그냥 잘나오는구나...하고 말이죠
그래서 이렇게 로컬로 제작을 하는 방식중, 다른 하나는 단순히 성인컨텐츠의 제한을 푸는 방식에서 끝나는게 아니라, 특정 인물을 학습하는게 그다음 스텝입니다.
기존 사진을 변형 시키는게 아니라. 특정한 인물을 딥러닝을 통해 학습일 시키고, 위에 생성에 적용을 시키면, 같은 프롬프트에서, 이렇게 인물이 바뀌게 됩니다.
흥미로운 글이였다면 이후에는 특정 인물을 학습 하는것도 써보겠습니다~.
딱히 누굴 돕고 가르켜드리고 하진 않지만, 정보 공유나 소소한 의뢰정도는 받습니다. 비밀댓글로 텔레 아이디 남겨주시면 되겠습니다
블루메딕 후기작성시 10,000포인트 증정
- 글이 없습니다.


KCASINO
디리하고
파란비타민
