6) AI 이미지 생성 헬게이트 탈출기 – 지피티 제미나이 그록 정착

🎬 AI 이미지 생성 헬게이트 탈출기: 지피티, 제미나이 거쳐 그록에 정착한 사연
처음 AI로 이미지를 만들어보겠다고 결심했을 때만 해도 모든 게 금방 끝날 줄 알았습니다.
가장 유명한 챗GPT를 켜고 당당하게 첫 프롬프트를 입력했죠.
하지만 화면에 나타난 결과물을 본 순간 제 눈을 의심할 수밖에 없었습니다.

AI 이미지 생성 헬게이트 - 지브리.png
이미지: 직접 제작

헬게이트 1단계: 지피티와의 5일 사투

왠지 모르게 빛바랜 느낌에 얼굴은 누렇게 뜬,
출처를 알 수 없는 기괴한 지브리 스타일의 사진이 튀어나온 겁니다.
이때부터 제 고난의 행군이 시작되었습니다.
어떻게든 이 문제를 고쳐보려고 지피티와 무려 5일 동안 밤낮으로 씨름을 벌였습니다.
문장을 바꾸고, 단어를 더해봐도 결과는 제자리 걸음이었습니다.

파란 셔츠를 입은 남자가 모니터 앞에서 머리를 감싸쥐고
이미지: AI 생성

지피티 + 제미나이 협업 시스템 발명

5일간의 처절한 사투 끝에 마침내 결론을 내렸습니다.
‘아!, 지피티는 근본적으로 내가 원하는 사진을 못 만드는구나!’
하지만
지피티를 완전히 버릴 수는 없었습니다.
다른 건 몰라도 프롬프트 문장을 상세하게 짜는 능력만큼은
제미나이보다 지피티가 한 수 위라고 생각했기 때문입니다.
그래서 머리를 굴려 일종의 협업 시스템을 만들었습니다.
지피티에게 프롬프트를 짜달라고 한 뒤,
그 텍스트를 복사해서 제미나이에게 던져주고 이미지를 그리게 만든 것이죠.

파란 셔츠를 입은 남자가 메모지를 벽에 붙이며 고민하는
이미지: AI 생성

“이제는 진짜 성공하겠지”라며 기대에 부풀어 결과를 기다렸습니다.
하지만 세상일은 그렇게 만만하지 않더군요.
지피티가 짜준 멋진 프롬프트를 입력했음에도,
제미나이가 뱉어낸 결과물 역시 제 마음에 전혀 들지 않았습니다.
중간에서 번역 오류가 난 것처럼 엉뚱한 터치의 그림만 나올 뿐이었습니다.
결국 꼼수를 버리고 정공법을 택하기로 했습니다.
제미나이에게 제가 원하는 느낌의 원본 사진을 직접 보여주며 말했습니다.
“이 사진이랑 분위기 비슷하게 프롬프트 다시 짜줘!”

파란 셔츠를 입은 남자가 검지손가락을 치켜들며 미소 짓
이미지: AI 생성

제미나이 직접 학습 — 말풍선의 저주

(직접 써보고 싶으신 분은 제미나이 공식 페이지에서 무료로 체험해보실 수 있습니다.)

사진을 직접 보여주며 학습을 시키자 그제야 제미나이가 제 의도를 제대로 파악하기 시작했습니다.
드디어 길고 긴 터널의 끝이 보이는 것 같았습니다.
하지만 기쁨도 잠시,
제미나이의 치명적인 한계와 마주하며 또다시 멘붕에 빠지게 되었습니다.
제미나이는 인물의 행동이나 구체적인 상황을 묘사하는 건 기가 막히게 잘했습니다.
문제는 제가 이미지 프롬프트를 만들면서 대본의 ‘대사’를 함께 집어넣었을 때 발생했습니다.

파란 셔츠를 입은 남자가 허탈한 표정으로 의자에 기대어
이미지: AI 생성

그림 안에 뜬금없이 말풍선이 생기더니,
대사가 이미지 텍스트로 그대로 박혀서 출력되는 것이었습니다.
인터넷을 샅샅이 뒤져보니 ‘부정 프롬프트(Negative Prompt)’에
‘말풍선 금지’, ‘글자 금지’를 넣으면 해결된다고 하더군요.
하지만 아무리 제외 단어를 쑤셔 넣어봐도 이 끈질긴 말풍선들은 절대 사라지지 않았습니다.

파란 셔츠를 입은 남자가 한 손으로 턱을 괴고 모니터를
이미지: AI 생성

알고 보니 캔버스 사용 방식이 진짜 문제였습니다

지금 와서 냉정하게 복기해 보면,
사실 그건 시스템 오류가 아니라 제 잘못이었습니다.
당시 저는 제미나이 캔버스 기능을 사용하고 있었는데요.
욕심이 과한 나머지 이미지 한 장을 8칸,
16칸으로 쪼개서 만화책의 한 페이지처럼 전체 컷을 한 번에 생성해달라고 요청했던 것입니다.
AI 입장에서는 당연히 ‘만화(Comic)’를 그리라는 명령으로 이해하고 친절하게 말풍선과 대사를 넣어준 것이었죠.

파란 셔츠를 입은 남자가 자신의 이마를 탁 치며 깨달음
이미지: AI 생성

AI 이미지 생성 헬게이트 탈출 — 그록(Grok)으로 정착

그렇게 깨달음을 얻고 또 한 번 돌고 돌아
제가 최종적으로 도착한 종착지는 바로 ‘그록(Grok)’이었습니다.
그록의 이미지 생성 능력은 정말 신세계였습니다.
기본적인 생성 로직은 제미나이와 비슷해 보였지만,
이미지 자체의 디테일과 퀄리티가 비교가 안 될 정도로 훌륭했습니다.
무엇보다 가장 감동적인 것은 ‘실패할 확률’이 없다는 점이었습니다.

파란 셔츠를 입은 남자가 밝은 표정으로 모니터를 가리키
이미지: AI 생성

그록은 이미지 생성을 단 한 번만 시켜도 기본으로 8장의 선택지를 뿜어냈습니다.
게다가 마우스를 아래로 스크롤하면 끝도 없이 새로운 스타일의 이미지들을 계속해서 만들어 보여주었습니다.
수많은 보기 중에서 내가 원하는 최상의 컷을 고르기만 하면 되는 구조였습니다.

그록오토.png
이미지: 직접 제작

마지막 진화: 크롬 확장 + 자동 영상 파이프라인

하지만 인간의 욕심은 끝이 없고,
편해지니 또 다른 귀찮음이 찾아왔습니다.
수십 장의 이미지를 일일이 눈으로 검수하고,
한 장씩 다운로드한 뒤,
영상 제작 프로그램에 넣고 렌더링해서
다시 유튜브에 업로드하는 전체 과정이 너무 번거롭게 느껴진 것입니다.
마우스 클릭질을 반복하다가 손목에 통증이 올 때쯤,
지푸라기라도 잡는 심정으로 유튜브에 해결책을 검색해 보았습니다.

파란 셔츠를 입은 남자가 마우스를 쥔 손목을 만지며 찡
이미지: AI 생성

그러다 기적처럼 어떤 영상을 발견했습니다.
크롬 확장 프로그램 중에 그록과 연동하여,
생성된 이미지를 클릭 한 번으로
‘자동 영상 생성 파이프라인’에 바로 꽂아주는 사기적인 기능이 존재한다는 내용이었습니다.
툴을 다운받아 곧바로 실행해 보았습니다.
그동안 제가 했던 수십 번의 다운로드와 수작업 공정이 단 몇 초 만에 자동으로 끝나는 짜릿한 신세계가 펼쳐졌습니다.

혹시 지금 이 순간에도
AI 이미지 생성이 마음대로 되지 않아 모니터 앞에서 머리를 쥐어뜯고 계신 분이 있나요?
그렇다면 지피티나 제미나이만 붙잡고 계시지 말고,
그록과 크롬 확장 프로그램의 조합을 꼭 한 번 시도해 보세요.
여러분의 작업 효율이 수십 배는 튀어 오르는 기적을 경험하시게 될 겁니다.
(참고로 크롬 확장 프로그램은 돈이 듭니다. 그록도 비싸요. 앞서 말씀드렷지만 api도 비싸요.)

제 길고 길었던 AI 이미지 생성 헬게이트 탈출기는 여기까지입니다. 같은 고민에 빠지신 분들께 조금이라도 도움이 되었으면 좋겠습니다.

파란 셔츠를 입은 남자가 두 주먹을 쥐고 환하게 웃고
이미지: AI 생성

관련 글

4) AI 자동화 실패담, 돈 날리고 깨달은 진짜 교훈

AI 자동화 실패담 이야기다. AI 영상&블로그 자동화, 돈 날리고 깨달은 솔직한 후기
처음에는 AI로 영상이랑 블로그 글을 뚝딱 만들어내는 '자동화 공장'만 구축하면 모든 게 끝날 줄 알았습니다. 하지만 직접 부딪혀보니 현실은 상상과 많이 달랐습니다. 이건 제가 직접 겪은 AI 자동화 실패담입니다.

AI 자동화 실패담 - 컴퓨터 화면을 보며 허탈한 표정을 짓는 남자
이미지: AI 생성

할루시네이션, AI들의 뻔뻔한 거짓말

가장 먼저 발목을 잡은 건 AI들의 뻔뻔한 거짓말, 바로 할루시네이션(환각 현상)이었습니다. 제미나이든, 지피티든, 클로드든 가리지 않고 모르는 걸 마치 진짜인 것처럼 너무 당당하게 지어내서 써주더군요. 그대로 올렸다가는 큰일 나겠다 싶어서 결국 사람이 하나하나 검수해야 하는 번거로움이 생겼습니다.

턱을 괴고 모니터 속 텍스트를 검수하는 검은 셔츠 입은
이미지: AI 생성

API 연동의 함정

그다음 찾아온 난관은 바로 API 연동이었습니다. 텍스트 생성은 물론이고 이미지, 사진, 목소리 생성까지 이것저것 욕심내서 파이프라인에 다 연결해 두었죠. 이때까지만 해도 자동으로 굴러가는 시스템을 보며 뿌듯함이 앞섰습니다.

키보드를 두드리며 집중하고 있는 검은 셔츠 입은 남자
이미지: AI 생성

하지만 여기서 정말 뼈아픈 실수를 하나 하게 됩니다. 이번에 제미나이 이미지 생성 API를 연결하면서 당연히 일정 구간은 무료이거나 비용이 거의 안 들 줄 알았거든요. 나중에 알고 보니 무료가 아니라는 사실을 깨닫고 금액을 확인했을 때 그 당혹감이란 이루 말할 수 없었습니다. 지갑이 제대로 털리고 나니 정신이 번쩍 들더군요.

영수증을 보며 한 손으로 이마를 짚는 검은 셔츠 입은
이미지: AI 생성

복붙 노가다에서 벗어나기까지

이뿐만이 아니었습니다. 초기에는 코딩을 잘 모르니 AI가 짜준 코드를 그저 복사해서 내 코드 마크다운에 붙여넣고, 또 에러 나면 다시 복사해서 붙여넣는 무한 루프를 반복했습니다. 파일 하나 수정하는 데도 시간이 엄청나게 걸렸죠.

마우스를 쥐고 모니터를 뚫어지게 응수하는 검은 셔츠 입
이미지: AI 생성

그러다 최근에 클로드 코드를 활용해 내 PC 안의 소스 코드를 직접 읽고 알아서 내용을 수정해 주는 방식으로 워크플로우를 바꿨습니다. 일일이 복붙하지 않아도 터미널에서 알아서 척척 고쳐주니 개발 속도와 편의성이 완전히 신세계로 바뀌더군요. 노가다 아르바이트를 하다가 자동화 장비를 들여놓은 기분이었습니다.

팔짱을 끼고 모니터를 보며 가볍게 미소 짓는 검은 셔츠
이미지: AI 생성

AI 자동화 실패담이 남긴 진짜 자산

지나고 보면 API 비용으로 생돈도 날리고, 코드 에러 잡느라 밤새며 시간 낭비를 참 많이 한 것 같습니다. '내가 지금 뭘 하고 있나' 싶어 현타가 올 때도 많았습니다. 돈 낭비, 시간 낭비처럼 보였던 그 수많은 삽질의 순간들이 사실은 절대 쓸모없는 짓이 아니었습니다.

책상 위에 쌓인 노트들을 정리하는 검은 셔츠 입은 남자
이미지: AI 생성

그 과정에서 에러를 해결하는 눈이 생겼고, 어떤 AI 모델이 어느 작업에 효율적인지 몸으로 깨달았습니다. 결국 그 비싼 수업료들이 고스란히 제 안의 '경험'과 '데이터'로 누적되어 가고 있었던 겁니다. 실패해 보지 않았다면 절대 만들지 못했을 나만의 단단한 무기가 생긴 셈이죠. 자동화는 단순한 기술이 아니라, 수많은 시행착오를 견뎌낸 경험의 결과물입니다. 결국 이 AI 자동화 실패담이 제 가장 큰 자산이 됐습니다.

주먹을 꽉 쥐고 파이팅 포즈를 취하는 검은 셔츠 입은
이미지: AI 생성

관련 글

2) AI 영상 자동화 실패담, 기술은 완벽한데 조회수 3회

AI 영상 자동화 실패담 이야기다. 살다 살다 기계 쪼가리한테
쌍욕을 박을 줄은 몰랐습니다.

지금 생각하면 코미디인데,
그땐 눈 뒤집히기 직전이었거든요.

모니터 부숴버리려다 참은,
제 눈물겨운 삽질 스토리입니다.

AI 영상 자동화 실패담 - 컴퓨터 모니터 앞에서 머리를 쥐어뜯으며 괴로워하는 남자
이미지: AI 생성

AI 영상 자동화 실패담, 이렇게 시작됐습니다

그때가 아마 올해 초였을 겁니다.
남들 다 하니까 나도 해보자!

영상 자동화에 겁 없이 덤볐죠.
노드(Node.js) 코딩을 붙잡고

밤마다 방구석에서 두드렸습니다.
'딸깍 딸깍' 키보드 소리만 났죠.

목표는 단 하나였습니다.
자막과 TTS 목소리가 딱 맞는,
완벽한 영상 팩토리 만들기.

처음엔 지피티가 코드를
참 기가 막히게 짜주더라구요?

방 안에서 노트북 화면을 보며 환하게 웃고 있는 남자의
이미지: AI 생성

코드는 완벽한데 싱크가 어긋난다

"형님, 나만 믿으십쇼."
"코딩 그까이꺼 대충 하면 끝납니다."

속으로 야르~ 소리를 질렀죠.
그런데 드디어 일이 터졌습니다.

분명 코드는 완벽해 보였거든요?
근데 싱크가 자꾸 어긋납니다.

말은 이미 끝났는데,
자막은 한참 뒤에 나오더라구요.

어떨 땐 자막이 스포를 해버립니다.

"지피티야, 이거 싱크 왜 이래?"
"코드 다시 짜줘."

"지피티: 죄송합니다. 비동기 처리 로직을 수정했습니다."

모니터 화면에 복잡한 코드가 띄워져 있는 모습
이미지: AI 생성

철석같이 믿고 돌렸습니다.
결과는 똑같더라구요.

오히려 더 꼬여버렸습니다.
이 짓을 한 스무 번 반복하니까,

속에서 천불이 났습니다.

"야, 너 장난하냐? 방금 준 코드랑 똑같잖아!"

"지피티: 아, 제가 착각했네요. 이번엔 진짜 고쳤습니다."

말대꾸하는 꼬라지를 보는데,
순간 이성을 잃어버렸습니다.

모니터에 대고 소리를 질렀죠.

"이 쓸모없는 기계 자식아! 똑바로 안 해?!"

진짜 화면 너머 멱살이라도
잡고 싶은 심정이었습니다.

어두운 방에서 모니터를 향해 삿대질하며 화를 내고 있는
이미지: AI 생성

제미나이는 눈치가 없었습니다

머리나 식히자 싶었습니다.
영상에 들어갈 이미지를 뽑으려고

제미나이를 켰습니다.

"야, 주인공이 억울해하는 느낌. 그런 그림 하나 뽑아봐."

근데 이 제미나이 녀석은
눈치가 더럽게 없더라구요.

맑고 고운 일러스트를 대령합니다.

"아니, 억울한 느낌 몰라? 내가 지금 화가 난다고!"

"제미나이: 요청을 이해했습니다. 하지만 안전 정책상…"

거기서 퓨즈가 팍 끊겼습니다.
돈 내고 쓰는데 훈계질이라니요.

의자에 깊숙이 기대어 허탈한 표정으로 천장을 바라보는
이미지: AI 생성

구원자 클로드의 등장

"에라, 때려치워라. 내가 무슨 부귀영화를 누리겠다고."

노트북을 덮으려는데,
억울해서 잠이 안 오더라구요.

담배 한 대 피우고 유튜브를 켰죠.
'AI 자막 싱크 오류 해결'

'자동화 프로그램 에러'
이것저것 미친 듯이 뒤졌습니다.

그러다 어떤 영상 댓글에서
낯선 이름을 발견했습니다.

'코딩은 무조건 클로드 쓰세요. 지피티 뺨 때립니다.'

스마트폰 화면으로 유튜브 영상을 집중해서 보고 있는 남
이미지: AI 생성

클로드? 그게 뭔데?
속는 셈 치고 가입했습니다.

그리고 망한 노드 코드를 던졌죠.

"야, 지피티도 못 고친 거다. 네가 볼 수 있겠냐? 왜 밀려?"

잠시 뒤 답변이 올라오는데,
소름이 쫙 돋았습니다.

"클로드: 타임스탬프 파싱 과정에서 밀리초 오차가 누적되고 있네요. 이 부분을 ffmpeg 필터로 강제 고정하세요."

깔끔하게 정리된 코드가 모니터 화면에 출력되고 있는 모
이미지: AI 생성

밤새도록 지피티랑 싸우면서
듣지 못한 원인 분석이었습니다.

클로드가 새로 짜 준 코드를
그대로 복사했습니다.

그리고 제 프로그램에 붙였죠.
떨리는 마음으로 엔터를

'딸깍' 쳤습니다.

…어라? 맞아떨어집니다.
목소리 나오는 타이밍에

자막이 칼같이 박히더라구요.
1초 만에 해결된 순간이었습니다.

모니터 화면을 보며 두 손을 번쩍 들고 환호하는 남자의
이미지: AI 생성

"우와! 됐다! 진짜 되네?!"

새벽 3시에 소리를 질렀습니다.
혈이 뻥 뚫리는 기분이었죠.

싱크가 해결되니까
세상 다 가진 기분이었습니다.

어두운 방안에서 노트북 화면을 보며 안도의 한숨을 쉬는
이미지: AI 생성

클로드+제미나이 콜라보의 마법

이제 그림만 잘 나오면 끝인데,
아까 그 제미나이가 걸렸습니다.

화질 자체는 나쁘지 않았거든요.
명령어를 못 알아먹는 게 문제였죠.

문득 머리에 스치는 생각이
하나 있었습니다.

'코딩 잘하는 클로드한테 프롬프트를 짜달라고 해볼까?'

책상 위에 놓인 따뜻한 커피 잔을 만지며 깊은 생각에
이미지: AI 생성

곧바로 클로드 창을 켰습니다.

"야 클로드, 제미나이 쓸 건데. 주인공이 억울해 미치는 상황이야. 찰떡같이 알아먹게 영어로 짜줘."

"클로드: 제미나이는 얼굴 근육과 배경 색조를 지정하는 게 좋습니다. 이렇게 입력해 보세요."

아주 길고 정교한
영어 프롬프트를 뱉어내더군요.

어두운 모니터 화면에 영어로 된 긴 텍스트가 나열되어
이미지: AI 생성

그걸 복사해서 제미나이한테
슥 던져줬습니다.

'또 헛소리하면 탈퇴한다.'
속으로 칼을 갈았죠.

그런데 결과물이 뜨자마자
입이 떡 벌어졌습니다.

진짜 억울해 죽겠다는 표정이
화면에 딱 나타난 겁니다.

영화 포스터급 퀄리티였습니다.

화려하고 감정 표현이 풍부한 AI 생성 이미지가 모니터
이미지: AI 생성

"와… 이거구나!"
무릎을 탁 쳤습니다.

AI는 죄가 없었습니다.
멍청한 건 AI가 아니라,

사용법을 모르는 저였던 거죠.
이 조합을 알아낸 뒤로

제작 속도에 날개가 달렸습니다.
클로드한테 대본 검수받고,

코드 고치고, 프롬프트 따오고.
그걸로 제미나이 그림 뽑고.

노드 프로그램 돌려서
TTS랑 자막 합치고!

완벽한 무한 동력 팩토리가
방구석에서 돌아갔습니다.

작업실에서 모니터 세 대를 켜놓고 바쁘게 움직이는 남자
이미지: AI 생성

하루 한 개 만들던 영상을
눈 깜짝할 사이에 찍어냈습니다.

컴맹이나 다름없던 제가
AI 툴들을 다루고 있더라구요.

점점 실력이 늘어가는 게 느껴졌죠.
스스로 대견하기도 하고,

어깨 뽕이 잔뜩 들어갔습니다.
친구들 만나서 은근히 자랑도 했죠.

"나 요즘 툴 여러 개 엮어서 영상 자동 생성하잖아."

카페에서 친구들에게 스마트폰 화면을 보여주며 자랑하는
이미지: AI 생성

조회수 3회, 진짜 문제는 따로 있었습니다

신나게 영상을 올렸습니다.
썸네일 예쁘고, 싱크 칼 같고,

화질까지 완벽한 영상들.
한 개, 두 개, 열 개, 스무 개…

채널에 차곡차곡 쌓였습니다.
이제 돈 벌 일만 남았다 싶었죠.

조회수 대박 터지는 상상을 했습니다.
매일 아침 눈뜨자마자

유튜브 스튜디오 앱을 켰습니다.

침대 위에서 눈을 비비며 스마트폰 화면을 확인하는 남자
이미지: AI 생성

그런데 숫자가 이상하더라구요.
조회수: 3회.

그나마 2회는 제가 검수하느라
클릭한 거였습니다.

'초반이라 알고리즘 안 탔나 보지.'
말도 안 되는 합리화를 했습니다.

더 열심히 찍어냈습니다.
퀄리티는 점점 더 완벽해졌죠.

하지만 한 달이 지나도
조회수는 바닥을 기었습니다.

조회수 그래프가 바닥에서 일직선으로 기어가고 있는 노트
이미지: AI 생성

기술적으로는 완벽한데,
사람들이 전혀 보질 않더군요.

사막 한가운데서 나 혼자
축제를 열고 있는 기분이었습니다.

밤새워 가며 기술을 마스터했는데,
정작 제일 중요한 반응이 없었습니다.

화려하게 켜진 모니터 앞에서 허탈하게 앉아 있는 남자의
이미지: AI 생성

그때 멍하니 깨달았습니다.
기술이 전부가 아니구나.

AI 쓰는 법은 마스터했을지 몰라도,
'사람 마음' 끄는 법을 놓쳤던 겁니다.

껍데기는 번지르르한데,
알맹이에 매력이 없었던 거죠.

그렇게 제 비디오 팩토리는
거대한 벽에 부딪히고 말았습니다.

어두운 방 안에서 꺼진 모니터 화면에 비친 자신의 얼굴
이미지: AI 생성

기술은 완벽한데 조회수는 제로.
진짜 문제는 코딩이 아니었습니다.

여기까지가 제 AI 영상 자동화 실패담입니다.

여기서 다 때려치워야 할까요?
아니면 또 다른 길을 찾아야 할까요?

관련 글

본 사이트는 쿠팡 파트너스 및 알리익스프레스(AliExpress) 어필리에이트 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받을 수 있습니다.