7) 클로드 코드 사용량 폭발, 모델 분산으로 51%를 15%로

클로드 코드 사용량 이야기다.

개발을 하다 보면 예상치 못한 곳에서 리소스가 펑펑 터져 나가곤 합니다.

특히 AI API나 툴을 연동할 때는 더욱 그렇습니다.

오늘은 Claude Code를 활용해 심리테스트 자동화 시스템을 구축하다가,

단 한번의 사용으로 5시간 사용 한도의 51%를 날려 먹은 웃픈 이야기와 함께 이를 해결한 과정을 공유해 드립니다.

이 글은 클로드 코드 사용량 폭발 사건과 그 해결기를 담은 기록입니다.

 

클로드 코드 사용량 - 모니터 화면을 보며 허탈한 표정을 짓고 있는 검은 셔츠
이미지: AI 생성

 

 

현재 준비 중인 콘텐츠는 심리테스트, 홈페이지 주식 관련 글 정리, 그리고 일상적인 경험담들입니다. 오늘은 그중에서도 오늘 딱 겪었던 따끈따끈한 심리테스트 개발 연동 이야기를 해보려고 합니다.

심리테스트 자동화, 4단계 구조부터

 

클로드 코드로 심리테스트를 만드는 과정은 크게 4단계로 나뉩니다.

첫째는 전체적인 배경 설정,

둘째는 글자가 나오는 레이어 위치 맞춰주기,

셋째는 가장 중요한 글(콘텐츠) 생성 도구 만들기입니다. 매번 같은 내용이 나오면 안 되니까요.

마지막 넷째는 이 모든 요소를 자연스럽게 투입하고 완성하는 단계입니다.

 

책상 위에 종이와 펜을 두고 생각에 잠긴 검은 셔츠의
이미지: AI 생성

 

이 과정을 시작 버튼 딱 하나로 한 방에 해결하려고 하니 모든 게 막혀버렸습니다. 배경이야 대충 만든다 쳐도, 레이어 위치나 글 생성은 눈으로 직접 보고 테스트하고 수정하는 반복 작업의 연속이었습니다. 이쯤 되니 내가 비개발자인지 개발자인지 헷갈리기 시작하더군요.

로컬호스트로 작업 환경을 옮겼습니다

 

사이트를 열어 확인하고, 실패한 부분을 다시 클로드 코드에게 던져주는 짓을 반복하다가 문득 좋은 아이디어가 떠올랐습니다. “클로드야, 이거 그냥 내 컴퓨터에서도 돌아가게 만들어서 여기서 완전히 고치고 실행하자!”라고 했더니 바로 알겠다고 하더군요. 그렇게 로컬호스트(Localhost) 환경을 구축했습니다.

 

로컬호스트(Localhost)란?
외부 인터넷 서버를 거치지 않고, 본인의 개인 컴퓨터(PC) 내부를 가상의 서버로 만들어 웹사이트나 프로그램을 구동하는 환경을 뜻합니다. 쉽게 말해 ‘내 컴퓨터 주소’를 의미하며, 개발 중인 화면을 실시간으로 띄워놓고 안전하게 수정 및 테스트를 반복할 수 있는 나만의 비밀 작업실 공간입니다.

노트북 화면을 보며 손가락으로 가리키고 있는 검은 셔츠
이미지: AI 생성

 

로컬호스트를 띄워놓고 클로드 코드에게 “이건 틀렸어”, “이건 잘했어”, “이 부분은 빼줘”라고 요청하니 순식간에 딱딱 맞춰서 문제들이 풀려나갔습니다.

배경은 아주 천천히 움직이게 만들었습니다

 

그다음은 이미지와 음악 생성 과정이었습니다.

가장 처음에 만든 심리테스트는 이미지만 떵그러니 넣었더니 너무 밋밋하고 보기 싫었습니다. 그래서 두 번째로는 움직이는 영상을 배경으로 넣어봤는데, 이번에는 배경이 휙휙 지나가니까 글자가 눈에 전혀 안 들어왔습니다. 배경이 너무 신경 쓰였던 거죠.

스마트폰 화면을 진지하게 바라보고 있는 검은 셔츠의 남
이미지: AI 생성

결국 최종 조율한 방법은 아주 아주 천천히 움직이는 영상을 만드는 것이었습니다. 사용자가 보면서 ‘아, 뒷배경이 은은하게 움직이고 있구나’ 정도만 파악할 수 있는 수준으로요. 이 부분은 제미나이로 이미지를 먼저 생성한 뒤, 그록(Grok)을 통해 영상으로 변환하여 넣도록 조율했습니다.

이미지는 특별한 기교 없이 상황에 맞는 프롬프트를 넣었습니다. 배경 움직임을 최소화해야 했기에 프롬프트 구조는 생각보다 단순했습니다.

배경 영상 생성 프롬프트 예시
“심리테스트 질문에 어울리는 차분하고 몽환적인 그래픽 일러스트, 아주 미세하고 느린 구름의 움직임(Minimal animation, cinematic, super slow motion, 0.1x speed)”과 같이 시각적 자극을 줄이고 움직임을 극도로 제한하는 키워드를 조합하여 적용했습니다.

마우스를 쥐고 모니터를 집중해서 응시하는 검은 셔츠의
이미지: AI 생성

클로드 코드 사용량, 51%가 사라진 순간

그렇게 세팅을 끝내고 신나게 실행을 시켜봤는데, 모니터를 보고 눈을 의심했습니다. 100달러짜리 플랜인데 클로드 사용량이 벌써 51%를 먹고 있었던 것입니다.

클로드사용량.png
이미지: 직접 제작

클로드는 보통 5시간 주기로 사용량이 갱신됩니다. 만약 20달러짜리 일반 플랜으로 이 작업을 돌렸다면 중간에 사용 제한이 걸려 아예 실행조차 되지 않았거나 멈췄을 게 뻔합니다.

이렇게 어마어마한 리소스 소비가 일어난 까닭을 분석해 보니, 클로드의 가장 무겁고 똑똑한 고성능 AI 모델을 단순한 퀴즈 텍스트 생성에 전부 때려 박고 있었기 때문이었습니다.

이마에 손을 얹고 한숨을 쉬는 검은 셔츠의 남자
이미지: AI 생성

고성능 모델만 쓰던 게 문제였습니다

현재 클로드의 AI 모델 종류는 Sonnet 4.6, Haiku 4.5, Opus 4.6, Sonnet 4.5, Opus 4.7 등이 존재하며, 모델마다 비용과 사용량 차이가 크게 납니다. 보통은 전체적인 구조나 마스터플랜을 짤 때 최고 사양인 Opus 4.7을 쓰고, 실제 반복적인 코딩 생산이나 단순 텍스트 생성은 가성비와 속도가 좋은 Sonnet 4.6이나 Haiku를 씁니다.

하지만 저는 비개발자라 아무것도 모르는 상태였으니, 모든 파이프라인을 Opus 4.7로 전부 실행되게 만들어 두었던 것입니다. 이 사단이 난 원인을 파악하자마자 클로드 코드에게 곧바로 명령했습니다. “이 낭비되는 상황을 파악하고, 비용을 줄이기 위한 최소한의 행동 계획을 짜서 나한테 줘.”

클로드계획.png
이미지: 직접 제작

 

여기서 AI를 활용할 때 유용한 팁을 하나 드리자면, 무작정 “너 이거 해줘”, “이건 이렇게 고쳐줘”라고 단편적인 지시를 내리는 것보다 “먼저 계획을 짜라”고 우선순위를 넘겨주는 것이 훨씬 좋습니다. AI들이 계획을 먼저 수립하게 만들면, 스스로 무엇을 해야 할지 논리적인 단계를 거치기 때문에 이후 행동에서 실수가 급격하게 줄어듭니다.

 

화이트보드에 깔끔하게 정리된 계획표를 가리키는 검은 셔
이미지: AI 생성

 

확인해 보니 역시나 제가 만든 심리테스트 자동화 스크립트가 돌아갈 때 모든 텍스트 생성 API 요청이 전부 무거운 모델로 처리되고 있었습니다.

 

클로드오퍼스.png
이미지: 직접 제작

모델 분산으로 사용량이 15%까지

 

클로드 코드의 안내에 따라 무거운 작업은 상위 모델로, 단순 퀴즈 생성이나 폼 양식 맞추기는 하위 모델로 분산하는 수정을 거쳤습니다. 그리고 다시 실행을 시켜보니 놀랍게도 사용량이 기존의 3분의 1 수준인 15%까지 뚝 떨어졌습니다.

 

프로그램이나 자동화 시스템을 구축할 때 리소스 낭비가 심하다면, 어떤 모델이 불필요하게 고스펙으로 돌아가고 있는지 반드시 체크해 보셔야 합니다.

카페 테이블에서 커피를 마시며 미소를 짓고 있는 검은
이미지: AI 생성

비개발자가 꼭 기억할 두 가지

 

더 중요한 것은 진짜로 성능이 필요한 핵심 부분과 가볍게 처리해도 되는 부분을 구별하지 못하면 나중에 더 큰 문제가 생긴다는 점입니다. 비개발자 입장에서 복잡한 자동화를 구현할 때는 이 두 가지만 꼭 기억하시길 바랍니다.

무조건 계획(Plan)부터 AI에게 짜 달라고 요청할 것

계획된 단계 중 딱 한 가지를 정확하게 마무리 짓고 다음 단계로 넘어갈 것

이 원칙만 지켜도 저처럼 하루 만에 아까운 사용 한도를 절반 넘게 날려 먹는 실수는 피할 수 있을 것입니다. 결국 클로드 코드 사용량 관리의 핵심은 무거운 모델과 가벼운 모델을 제대로 나누는 것이었습니다.

관련 글