🎬 AI 이미지 생성 헬게이트 탈출기: 지피티, 제미나이 거쳐 그록에 정착한 사연
처음 AI로 이미지를 만들어보겠다고 결심했을 때만 해도 모든 게 금방 끝날 줄 알았습니다.
가장 유명한 챗GPT를 켜고 당당하게 첫 프롬프트를 입력했죠.
하지만 화면에 나타난 결과물을 본 순간 제 눈을 의심할 수밖에 없었습니다.

헬게이트 1단계: 지피티와의 5일 사투
왠지 모르게 빛바랜 느낌에 얼굴은 누렇게 뜬,
출처를 알 수 없는 기괴한 지브리 스타일의 사진이 튀어나온 겁니다.
이때부터 제 고난의 행군이 시작되었습니다.
어떻게든 이 문제를 고쳐보려고 지피티와 무려 5일 동안 밤낮으로 씨름을 벌였습니다.
문장을 바꾸고, 단어를 더해봐도 결과는 제자리 걸음이었습니다.

지피티 + 제미나이 협업 시스템 발명
5일간의 처절한 사투 끝에 마침내 결론을 내렸습니다.
‘아!, 지피티는 근본적으로 내가 원하는 사진을 못 만드는구나!’
하지만
지피티를 완전히 버릴 수는 없었습니다.
다른 건 몰라도 프롬프트 문장을 상세하게 짜는 능력만큼은
제미나이보다 지피티가 한 수 위라고 생각했기 때문입니다.
그래서 머리를 굴려 일종의 협업 시스템을 만들었습니다.
지피티에게 프롬프트를 짜달라고 한 뒤,
그 텍스트를 복사해서 제미나이에게 던져주고 이미지를 그리게 만든 것이죠.

“이제는 진짜 성공하겠지”라며 기대에 부풀어 결과를 기다렸습니다.
하지만 세상일은 그렇게 만만하지 않더군요.
지피티가 짜준 멋진 프롬프트를 입력했음에도,
제미나이가 뱉어낸 결과물 역시 제 마음에 전혀 들지 않았습니다.
중간에서 번역 오류가 난 것처럼 엉뚱한 터치의 그림만 나올 뿐이었습니다.
결국 꼼수를 버리고 정공법을 택하기로 했습니다.
제미나이에게 제가 원하는 느낌의 원본 사진을 직접 보여주며 말했습니다.
“이 사진이랑 분위기 비슷하게 프롬프트 다시 짜줘!”

제미나이 직접 학습 — 말풍선의 저주
(직접 써보고 싶으신 분은 제미나이 공식 페이지에서 무료로 체험해보실 수 있습니다.)
사진을 직접 보여주며 학습을 시키자 그제야 제미나이가 제 의도를 제대로 파악하기 시작했습니다.
드디어 길고 긴 터널의 끝이 보이는 것 같았습니다.
하지만 기쁨도 잠시,
제미나이의 치명적인 한계와 마주하며 또다시 멘붕에 빠지게 되었습니다.
제미나이는 인물의 행동이나 구체적인 상황을 묘사하는 건 기가 막히게 잘했습니다.
문제는 제가 이미지 프롬프트를 만들면서 대본의 ‘대사’를 함께 집어넣었을 때 발생했습니다.

그림 안에 뜬금없이 말풍선이 생기더니,
대사가 이미지 텍스트로 그대로 박혀서 출력되는 것이었습니다.
인터넷을 샅샅이 뒤져보니 ‘부정 프롬프트(Negative Prompt)’에
‘말풍선 금지’, ‘글자 금지’를 넣으면 해결된다고 하더군요.
하지만 아무리 제외 단어를 쑤셔 넣어봐도 이 끈질긴 말풍선들은 절대 사라지지 않았습니다.

알고 보니 캔버스 사용 방식이 진짜 문제였습니다
지금 와서 냉정하게 복기해 보면,
사실 그건 시스템 오류가 아니라 제 잘못이었습니다.
당시 저는 제미나이 캔버스 기능을 사용하고 있었는데요.
욕심이 과한 나머지 이미지 한 장을 8칸,
16칸으로 쪼개서 만화책의 한 페이지처럼 전체 컷을 한 번에 생성해달라고 요청했던 것입니다.
AI 입장에서는 당연히 ‘만화(Comic)’를 그리라는 명령으로 이해하고 친절하게 말풍선과 대사를 넣어준 것이었죠.

AI 이미지 생성 헬게이트 탈출 — 그록(Grok)으로 정착
그렇게 깨달음을 얻고 또 한 번 돌고 돌아
제가 최종적으로 도착한 종착지는 바로 ‘그록(Grok)’이었습니다.
그록의 이미지 생성 능력은 정말 신세계였습니다.
기본적인 생성 로직은 제미나이와 비슷해 보였지만,
이미지 자체의 디테일과 퀄리티가 비교가 안 될 정도로 훌륭했습니다.
무엇보다 가장 감동적인 것은 ‘실패할 확률’이 없다는 점이었습니다.

그록은 이미지 생성을 단 한 번만 시켜도 기본으로 8장의 선택지를 뿜어냈습니다.
게다가 마우스를 아래로 스크롤하면 끝도 없이 새로운 스타일의 이미지들을 계속해서 만들어 보여주었습니다.
수많은 보기 중에서 내가 원하는 최상의 컷을 고르기만 하면 되는 구조였습니다.

마지막 진화: 크롬 확장 + 자동 영상 파이프라인
하지만 인간의 욕심은 끝이 없고,
편해지니 또 다른 귀찮음이 찾아왔습니다.
수십 장의 이미지를 일일이 눈으로 검수하고,
한 장씩 다운로드한 뒤,
영상 제작 프로그램에 넣고 렌더링해서
다시 유튜브에 업로드하는 전체 과정이 너무 번거롭게 느껴진 것입니다.
마우스 클릭질을 반복하다가 손목에 통증이 올 때쯤,
지푸라기라도 잡는 심정으로 유튜브에 해결책을 검색해 보았습니다.

그러다 기적처럼 어떤 영상을 발견했습니다.
크롬 확장 프로그램 중에 그록과 연동하여,
생성된 이미지를 클릭 한 번으로
‘자동 영상 생성 파이프라인’에 바로 꽂아주는 사기적인 기능이 존재한다는 내용이었습니다.
툴을 다운받아 곧바로 실행해 보았습니다.
그동안 제가 했던 수십 번의 다운로드와 수작업 공정이 단 몇 초 만에 자동으로 끝나는 짜릿한 신세계가 펼쳐졌습니다.
혹시 지금 이 순간에도
AI 이미지 생성이 마음대로 되지 않아 모니터 앞에서 머리를 쥐어뜯고 계신 분이 있나요?
그렇다면 지피티나 제미나이만 붙잡고 계시지 말고,
그록과 크롬 확장 프로그램의 조합을 꼭 한 번 시도해 보세요.
여러분의 작업 효율이 수십 배는 튀어 오르는 기적을 경험하시게 될 겁니다.
(참고로 크롬 확장 프로그램은 돈이 듭니다. 그록도 비싸요. 앞서 말씀드렷지만 api도 비싸요.)
제 길고 길었던 AI 이미지 생성 헬게이트 탈출기는 여기까지입니다. 같은 고민에 빠지신 분들께 조금이라도 도움이 되었으면 좋겠습니다.
