11) AI 모델 분산 배치 한 달, 비용 절감 실험 결과

AI 모델 분산 배치 관점에서 핵심 변수를 짚어봅니다. 기대로 시작했던 ‘모델 분산 배치’ 실험이 한 달을 맞이했습니다.
과연 무지성으로 쓰던 고비용 모델을 줄이고 효율을 찾을 수 있었을까요?
5월 28일 처음 마주했던 사용량 페이지는 그야말로 충격이었습니다.

Opus 51%, Sonnet 0%, Haiku 0%.
일주일 만에 한도 절반을 단 하나의 모델이 먹고 있었죠.
전부 Opus가 디폴트로 설정되어 있던 탓이었습니다.

그날 결심했습니다.

복잡한 아키텍처 작업만 Opus에게 맡기고, 나머지는 전부 Sonnet과 Haiku로 내리기로 말이죠.

한 달 전 제가 시작한 게 바로 이 AI 모델 분산 배치.

 

AI 모델 분산 배치 - 모니터 화면을 보며 심각한 표정으로 턱을 괴고 있는 검
이미지: AI 생성

AI 모델 분산 배치 한 달, 무엇이 달라졌나

오늘이 6월 3일입니다.

정확히 한 달이 지나서 다시 같은 사용량 페이지를 열어보았습니다.

결과는 놀라웠습니다.

 

usage_after_split.png
이미지: 직접 제작

(이젠 20달러짜리로도 유지가 될정도로 만들어 졌다는게 놀랍네요)

한 달간 적용한 규칙

실제 한 달간 적용했던 규칙은 아주 명확했습니다.

Opus: 새 시스템 아키텍처 설계, 복잡한 디버깅, 글 다듬기 (일주일에 5번 정도)
Sonnet: 코드 수정, 파일 정리, 일반 작업, 서브에이전트 (사실상 기본값)
Haiku: 단순 분류, 짧은 변환, 반복 작업

참고로 이 세 모델 Opus·Sonnet·Haiku는 모두 Anthropic Claude 라인업입니다.

 

책상 위에 세 개의 노트를 펼쳐놓고 펜으로 분류 작업을
이미지: AI 생성

 

처음에는 매번 작업을 시작할 때마다 망설였습니다.

‘이건 Opus를 써야 하나? Sonnet으로도 충분할까?’

하지만 1주일쯤 지나니 자연스럽게 감이 잡히더군요.

처음부터 새로 만드는 거대한 뼈대는 Opus,
이미 있는 코드를 수정하고 보완하는 건 Sonnet,
단순한 형식 변환은 Haiku.

이 룰을 머릿속에 박아두니 다음부터는 거의 자동으로 손이 움직였습니다.

 

노트북 앞에서 깨달음을 얻은 듯 가볍게 미소 짓는 검은
이미지: AI 생성

의외의 수확들

이번 실험을 통해 얻은 의외의 수확들이 있었습니다.

첫째로, Sonnet으로 충분한 작업이 진짜 많았다는 점입니다.
Opus가 반드시 필요하다고 생각했던 작업의 절반 이상이 Sonnet으로도 똑같이 구현되었습니다.
차이가 있다면 처리 시간 30초 정도였을 뿐, 결과물의 퀄리티는 거의 같았습니다.
그동안 제가 얼마나 무지성으로 ‘제일 비싸고 좋은 것’만 켜두었는지 반성하게 되더군요.

 

컴퓨터 화면과 종이 문서를 번갈아 보며 고개를 끄덕이는
이미지: AI 생성

 

둘째로, 서브에이전트 병렬 작업의 강력함입니다.

Sonnet 서브에이전트 3개를 동시에 띄워서 서로 다른 파일을 작업시키니,
혼자 일하는 하나의 Opus보다 속도가 훨씬 빨랐습니다.
특히 슬라이드 템플릿 6종을 만들 때 세 에이전트가 동시에 코드를 작성하는 모습을 보며 감탄했습니다.
비용은 훨씬 적게 드는데 속도는 몇 배나 빠른 신기한 경험이었죠.
반면 Haiku는 생각보다 쓸 일이 적었습니다.
단순 분류 작업 자체가 실제 업무에서는 그리 많지 않았고,
대부분 Sonnet의 범위 안에서 해결되었기 때문입니다.

 

두 대의 모니터를 바라보며 만족스러운 듯 파이팅 포즈를
이미지: AI 생성

순탄치만은 않았던 시행착오

물론 과정이 늘 순탄했던 것은 아닙니다.
분산 초기에는 Sonnet이 만든 결과물이 만족스럽지 않아
결국 Opus가 다시 손을 보는 이중 작업이 발생하곤 했습니다.
결과적으로 비용이 두 번 든 셈이었죠.
처음부터 적절한 모델을 지정하는 감각을 익히기까지는 꼬박 1~2주의 시행착오가 필요했습니다.

 

노트북 앞에서 한 손으로 이마를 짚으며 고민에 빠진 흰
이미지: AI 생성

 

또 하나의 복병은 ‘익숙함’이었습니다.
툴의 디폴트 설정이 여전히 Opus로 되어 있다 보니,
명시적으로 모델을 지정하지 않으면 나도 모르게 다시 고비용 모델로 슬금슬금 손이 가곤 했습니다.
매 작업을 시작할 때마다 “지금 이 작업에는 어느 머리를 쓸 것인가?”라고

스스로에게 묻는 습관을 들이는 것이 가장 중요했습니다.

 

모니터 옆에 포스트잇을 붙이며 다짐하는 검은 셔츠의 남
이미지: AI 생성

결론: 모델 선택이 곧 작업 설계다

결론적으로,
지난 글을 쓸 때만 해도 “이렇게 하면 비용이 줄겠지”라는 막연한 추측이었던 것이 한 달간의 데이터를 통해 확실한 사실로 증명되었습니다.
가장 중요한 건, 비용을 줄였음에도 결과물의 질은 전혀 떨어지지 않았다는 점입니다.
영상은 매일 차질 없이 제작되었고, 글도 매일 올라갔으며, 전체적인 작업 속도는 오히려 빨라졌습니다.

결국 한 달간 제가 데이터로 증명한 핵심은 AI 모델 분산 배치.

 

깔끔하게 정리된 책상 앞에서 서류를 들고 밝게 웃는 흰
이미지: AI 생성

 

AI 도구를 쓸 때 디폴트로 가장 좋은 모델을 켜는 것은 인간의 직관적인 본능일지도 모릅니다.
하지만 그 직관이 비용의 99%를 만들어냅니다. 이제 모델 선택 자체가 작업 설계의 핵심적인 일부가 되어야 합니다.
어떤 작업에 어떤 머리를 쓸지 결정하는 것은 단순한 비용 절감의 문제가 아니라,
작업의 효율성과 스마트함을 결정짓는 핵심 열쇠입니다.

 

노트북을 닫고 창밖을 바라보며 시원한 표정을 짓는 검은
이미지: AI 생성

 

다음 한 달의 질문은 이것입니다. ‘이 효율적인 비율이 계속 유지될 것인가,
아니면 복잡한 작업들이 다시 쌓이면서 Opus의 비중이 올라갈 것인가.’ 한 달 뒤 실제 데이터를 들고 다시 기록을 남기겠습니다.

관련 글

5) API 자동화 비용 현실: 100달러 클로드까지 쓰게 된 이유

이건 API 자동화 비용에 대한 솔직한 실패담이자 정착기다요. 많은 사람들이 자동화 파이프라인을 구축하면 알아서 돈이 복사되는 줄 압니다. 하지만 막상 뛰어들어 보면 API 항목별 비용, RPM(분당 요청 제한), 그리고 손익분기점(BEP)이라는 거대한 벽에 부딪히게 되죠. 가장 솔직하게 제 지갑을 털어가며 배운 경험담을 공유합니다.

돈 날리며 깨달은 API 자동화 비용의 냉혹한 현실

API 자동화 비용 - 모니터 화면을 보며 심각한 표정으로 턱을 괴고 있는 남
이미지: AI 생성

처음에는 무조건 싸거나 무료인 툴만 찾았습니다. 가장 먼저 손을 댄 건 OpenAI의 TTS(음성 합성) 서비스였습니다. 무료라는 점에 끌려 냉큼 도입했지만, 결과는 참담했습니다. 로봇이 책을 읽는 듯한 어색한 톤과 떨어지는 성능 때문에 도저히 실전에서 쓸 수 없는 수준이었죠.

한 손으로 이마를 짚으며 한숨을 쉬는 흰 셔츠 입은 남
이미지: AI 생성

결국 눈을 돌린 곳은 일레븐랩스(ElevenLabs)였습니다. 음질이나 자연스러움은 확실히 괜찮더군요. ‘이거다!’ 싶었지만 치명적인 문제가 있었습니다. 제가 구상한 자동화 프로그램에 API로 연결하는 과정에서 사소한 제약과 연결 문제가 계속 발목을 잡았습니다. 귀가 열리면 손발이 묶이는 답답한 상황이 반복된 겁니다.

가성비와 타협한 현재의 정착지

결국 수많은 시행착오 끝에 정착한 곳은 타입캐스트(Typecast)였습니다. API 가격이 월 9,900원으로 굉장히 저렴하다는 게 가장 큰 메리트였습니다. 물론 완벽하진 않습니다. 감정 표현이나 디테일한 뉘앙스는 일레븐랩스와 거의 비슷한 수준이였으니까요.

타입캐스트
이미지: 직접 제작
타입캐스트2
이미지: 직접 제작

(참고사항: api는 가격은 저렴하지만 이 가격으로는 웹에서 생성을 할수없습니다.)

하지만 자동화 시스템을 장기적으로 굴리기 위한 ‘가성비’ 측면을 고려하면, 현재로서는 타입캐스트만 한 대안이 없어서 지금까지 만족하며 사용 중입니다. 100% 만족은 없지만, 손익분기점을 맞추려면 비용 타협은 필수니까요.

계산기를 두드리며 미소를 짓는 흰 셔츠 입은 남자
이미지: AI 생성

텍스트와 이미지 생성 영역에서도 저만의 최적화 조합을 찾았습니다. 처음엔 무료 분량을 제공하는 GPT와 제미나이를 동시에 썼는데, 어느 순간부터 GPT는 손이 잘 안 가게 되더군요. 대신 제미나이는 이미지 생성용으로 아주 훌륭하게 뽑아내고 있어서 현재 이미지 전용으로 유용하게 쓰고 있습니다.

돈이 전혀 아깝지 않았던 유일한 치트키

반면, 돈을 쓰면서도 “이건 진짜 돈값 한다”라며 감탄한 툴이 있습니다. 바로 클로드(Claude)입니다. 저는 클로드를 전적으로 ‘코드 수정 및 개발 전용’으로 활용하고 있습니다. 자동화 프로그램을 짜다 보면 턱턱 막히는 에러가 발생하는데, 클로드가 받아쳐 주는 코드 수정 능력은 차원이 다릅니다.

5월3일100달러.png
이미지: 직접 제작

처음에는 기본 요금으로 시작했지만, 지금은 무려 81달러를 더 얹어서 월 100달러짜리 플랜을 사용 중입니다. 겉보기엔 매달 나가기엔 꽤 큰돈 같지만, 지금 당장 제가 처리해야 할 작업량과 개발 스케줄을 생각하면 이 100달러가 거의 딱 맞아떨어집니다. 제 시간을 사주는 고마운 치트키인 셈이죠.

노트북 앞에서 주먹을 꽉 쥐고 파이팅 포즈를 취하는 흰
이미지: AI 생성

물론 이 비용을 평생 쓸 생각은 없습니다. 지금 진행 중인 대규모 자동화 프로그램 개발과 세팅이 완벽하게 정리되고 나면, 다시 월 20달러짜리 기본 플랜으로 내려갈 예정입니다. 그때가 되면 복잡한 코딩 대신 대본 대사나 텍스트 초안 작성용으로만 가볍게 돌려도 충분할 테니까요.

결국 API 자동화 비용은 성능에 취해 돈을 쏟아붓는 것이 아니라, 내 상황에 맞게 비용을 줬다 폈다 하는 ‘타이밍 싸움’입니다.

카페 창가 자리에 앉아 노트북을 보며 편안하게 커피를
이미지: AI 생성

관련 글

2) AI 영상 자동화 실패담, 기술은 완벽한데 조회수 3회

AI 영상 자동화 실패담 이야기다. 살다 살다 기계 쪼가리한테
쌍욕을 박을 줄은 몰랐습니다.

지금 생각하면 코미디인데,
그땐 눈 뒤집히기 직전이었거든요.

모니터 부숴버리려다 참은,
제 눈물겨운 삽질 스토리입니다.

AI 영상 자동화 실패담 - 컴퓨터 모니터 앞에서 머리를 쥐어뜯으며 괴로워하는 남자
이미지: AI 생성

AI 영상 자동화 실패담, 이렇게 시작됐습니다

그때가 아마 올해 초였을 겁니다.
남들 다 하니까 나도 해보자!

영상 자동화에 겁 없이 덤볐죠.
노드(Node.js) 코딩을 붙잡고

밤마다 방구석에서 두드렸습니다.
'딸깍 딸깍' 키보드 소리만 났죠.

목표는 단 하나였습니다.
자막과 TTS 목소리가 딱 맞는,
완벽한 영상 팩토리 만들기.

처음엔 지피티가 코드를
참 기가 막히게 짜주더라구요?

방 안에서 노트북 화면을 보며 환하게 웃고 있는 남자의
이미지: AI 생성

코드는 완벽한데 싱크가 어긋난다

"형님, 나만 믿으십쇼."
"코딩 그까이꺼 대충 하면 끝납니다."

속으로 야르~ 소리를 질렀죠.
그런데 드디어 일이 터졌습니다.

분명 코드는 완벽해 보였거든요?
근데 싱크가 자꾸 어긋납니다.

말은 이미 끝났는데,
자막은 한참 뒤에 나오더라구요.

어떨 땐 자막이 스포를 해버립니다.

"지피티야, 이거 싱크 왜 이래?"
"코드 다시 짜줘."

"지피티: 죄송합니다. 비동기 처리 로직을 수정했습니다."

모니터 화면에 복잡한 코드가 띄워져 있는 모습
이미지: AI 생성

철석같이 믿고 돌렸습니다.
결과는 똑같더라구요.

오히려 더 꼬여버렸습니다.
이 짓을 한 스무 번 반복하니까,

속에서 천불이 났습니다.

"야, 너 장난하냐? 방금 준 코드랑 똑같잖아!"

"지피티: 아, 제가 착각했네요. 이번엔 진짜 고쳤습니다."

말대꾸하는 꼬라지를 보는데,
순간 이성을 잃어버렸습니다.

모니터에 대고 소리를 질렀죠.

"이 쓸모없는 기계 자식아! 똑바로 안 해?!"

진짜 화면 너머 멱살이라도
잡고 싶은 심정이었습니다.

어두운 방에서 모니터를 향해 삿대질하며 화를 내고 있는
이미지: AI 생성

제미나이는 눈치가 없었습니다

머리나 식히자 싶었습니다.
영상에 들어갈 이미지를 뽑으려고

제미나이를 켰습니다.

"야, 주인공이 억울해하는 느낌. 그런 그림 하나 뽑아봐."

근데 이 제미나이 녀석은
눈치가 더럽게 없더라구요.

맑고 고운 일러스트를 대령합니다.

"아니, 억울한 느낌 몰라? 내가 지금 화가 난다고!"

"제미나이: 요청을 이해했습니다. 하지만 안전 정책상…"

거기서 퓨즈가 팍 끊겼습니다.
돈 내고 쓰는데 훈계질이라니요.

의자에 깊숙이 기대어 허탈한 표정으로 천장을 바라보는
이미지: AI 생성

구원자 클로드의 등장

"에라, 때려치워라. 내가 무슨 부귀영화를 누리겠다고."

노트북을 덮으려는데,
억울해서 잠이 안 오더라구요.

담배 한 대 피우고 유튜브를 켰죠.
'AI 자막 싱크 오류 해결'

'자동화 프로그램 에러'
이것저것 미친 듯이 뒤졌습니다.

그러다 어떤 영상 댓글에서
낯선 이름을 발견했습니다.

'코딩은 무조건 클로드 쓰세요. 지피티 뺨 때립니다.'

스마트폰 화면으로 유튜브 영상을 집중해서 보고 있는 남
이미지: AI 생성

클로드? 그게 뭔데?
속는 셈 치고 가입했습니다.

그리고 망한 노드 코드를 던졌죠.

"야, 지피티도 못 고친 거다. 네가 볼 수 있겠냐? 왜 밀려?"

잠시 뒤 답변이 올라오는데,
소름이 쫙 돋았습니다.

"클로드: 타임스탬프 파싱 과정에서 밀리초 오차가 누적되고 있네요. 이 부분을 ffmpeg 필터로 강제 고정하세요."

깔끔하게 정리된 코드가 모니터 화면에 출력되고 있는 모
이미지: AI 생성

밤새도록 지피티랑 싸우면서
듣지 못한 원인 분석이었습니다.

클로드가 새로 짜 준 코드를
그대로 복사했습니다.

그리고 제 프로그램에 붙였죠.
떨리는 마음으로 엔터를

'딸깍' 쳤습니다.

…어라? 맞아떨어집니다.
목소리 나오는 타이밍에

자막이 칼같이 박히더라구요.
1초 만에 해결된 순간이었습니다.

모니터 화면을 보며 두 손을 번쩍 들고 환호하는 남자의
이미지: AI 생성

"우와! 됐다! 진짜 되네?!"

새벽 3시에 소리를 질렀습니다.
혈이 뻥 뚫리는 기분이었죠.

싱크가 해결되니까
세상 다 가진 기분이었습니다.

어두운 방안에서 노트북 화면을 보며 안도의 한숨을 쉬는
이미지: AI 생성

클로드+제미나이 콜라보의 마법

이제 그림만 잘 나오면 끝인데,
아까 그 제미나이가 걸렸습니다.

화질 자체는 나쁘지 않았거든요.
명령어를 못 알아먹는 게 문제였죠.

문득 머리에 스치는 생각이
하나 있었습니다.

'코딩 잘하는 클로드한테 프롬프트를 짜달라고 해볼까?'

책상 위에 놓인 따뜻한 커피 잔을 만지며 깊은 생각에
이미지: AI 생성

곧바로 클로드 창을 켰습니다.

"야 클로드, 제미나이 쓸 건데. 주인공이 억울해 미치는 상황이야. 찰떡같이 알아먹게 영어로 짜줘."

"클로드: 제미나이는 얼굴 근육과 배경 색조를 지정하는 게 좋습니다. 이렇게 입력해 보세요."

아주 길고 정교한
영어 프롬프트를 뱉어내더군요.

어두운 모니터 화면에 영어로 된 긴 텍스트가 나열되어
이미지: AI 생성

그걸 복사해서 제미나이한테
슥 던져줬습니다.

'또 헛소리하면 탈퇴한다.'
속으로 칼을 갈았죠.

그런데 결과물이 뜨자마자
입이 떡 벌어졌습니다.

진짜 억울해 죽겠다는 표정이
화면에 딱 나타난 겁니다.

영화 포스터급 퀄리티였습니다.

화려하고 감정 표현이 풍부한 AI 생성 이미지가 모니터
이미지: AI 생성

"와… 이거구나!"
무릎을 탁 쳤습니다.

AI는 죄가 없었습니다.
멍청한 건 AI가 아니라,

사용법을 모르는 저였던 거죠.
이 조합을 알아낸 뒤로

제작 속도에 날개가 달렸습니다.
클로드한테 대본 검수받고,

코드 고치고, 프롬프트 따오고.
그걸로 제미나이 그림 뽑고.

노드 프로그램 돌려서
TTS랑 자막 합치고!

완벽한 무한 동력 팩토리가
방구석에서 돌아갔습니다.

작업실에서 모니터 세 대를 켜놓고 바쁘게 움직이는 남자
이미지: AI 생성

하루 한 개 만들던 영상을
눈 깜짝할 사이에 찍어냈습니다.

컴맹이나 다름없던 제가
AI 툴들을 다루고 있더라구요.

점점 실력이 늘어가는 게 느껴졌죠.
스스로 대견하기도 하고,

어깨 뽕이 잔뜩 들어갔습니다.
친구들 만나서 은근히 자랑도 했죠.

"나 요즘 툴 여러 개 엮어서 영상 자동 생성하잖아."

카페에서 친구들에게 스마트폰 화면을 보여주며 자랑하는
이미지: AI 생성

조회수 3회, 진짜 문제는 따로 있었습니다

신나게 영상을 올렸습니다.
썸네일 예쁘고, 싱크 칼 같고,

화질까지 완벽한 영상들.
한 개, 두 개, 열 개, 스무 개…

채널에 차곡차곡 쌓였습니다.
이제 돈 벌 일만 남았다 싶었죠.

조회수 대박 터지는 상상을 했습니다.
매일 아침 눈뜨자마자

유튜브 스튜디오 앱을 켰습니다.

침대 위에서 눈을 비비며 스마트폰 화면을 확인하는 남자
이미지: AI 생성

그런데 숫자가 이상하더라구요.
조회수: 3회.

그나마 2회는 제가 검수하느라
클릭한 거였습니다.

'초반이라 알고리즘 안 탔나 보지.'
말도 안 되는 합리화를 했습니다.

더 열심히 찍어냈습니다.
퀄리티는 점점 더 완벽해졌죠.

하지만 한 달이 지나도
조회수는 바닥을 기었습니다.

조회수 그래프가 바닥에서 일직선으로 기어가고 있는 노트
이미지: AI 생성

기술적으로는 완벽한데,
사람들이 전혀 보질 않더군요.

사막 한가운데서 나 혼자
축제를 열고 있는 기분이었습니다.

밤새워 가며 기술을 마스터했는데,
정작 제일 중요한 반응이 없었습니다.

화려하게 켜진 모니터 앞에서 허탈하게 앉아 있는 남자의
이미지: AI 생성

그때 멍하니 깨달았습니다.
기술이 전부가 아니구나.

AI 쓰는 법은 마스터했을지 몰라도,
'사람 마음' 끄는 법을 놓쳤던 겁니다.

껍데기는 번지르르한데,
알맹이에 매력이 없었던 거죠.

그렇게 제 비디오 팩토리는
거대한 벽에 부딪히고 말았습니다.

어두운 방 안에서 꺼진 모니터 화면에 비친 자신의 얼굴
이미지: AI 생성

기술은 완벽한데 조회수는 제로.
진짜 문제는 코딩이 아니었습니다.

여기까지가 제 AI 영상 자동화 실패담입니다.

여기서 다 때려치워야 할까요?
아니면 또 다른 길을 찾아야 할까요?

관련 글

본 사이트는 쿠팡 파트너스 및 알리익스프레스(AliExpress) 어필리에이트 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받을 수 있습니다.