4 분 소요

월정액 AI와 에이전트 harness의 충돌 구조를 설명하는 대표 이미지

Claude 같은 구독형 AI 서비스가 OpenClaw류의 써드파티 harness 사용을 막는다는 이야기를 보면, 겉으로는 약관 변경이나 정책 이슈처럼 보인다. 그런데 조금만 더 뜯어보면 이건 단순히 “허용할까 말까”의 문제가 아니라, 월정액 가격 구조와 에이전트형 사용 패턴이 원래부터 잘 안 맞는 문제에 더 가깝다.

이건 특정 회사 하나만의 성격 문제로 보기 어렵다. 오히려 에이전트가 점점 더 많은 토큰과 더 긴 세션, 더 많은 반복 호출을 자연스럽게 만들어내는 순간부터, 월정액 기반 AI 서비스는 구조적으로 흔들리기 시작한다.

왜 일반 구독과 에이전트 사용은 성격이 다르냐

보통 구독 서비스는 많은 사용자가 적당히 쓰고, 그중 소수의 헤비 유저가 조금 더 많이 쓰는 구조를 전제로 돌아간다. 영상, 음악, SaaS 대부분이 비슷하다. 많이 쓰는 사람과 거의 안 쓰는 사람이 섞여 있어야 계산이 맞는다.

그런데 에이전트형 사용은 이 전제를 너무 쉽게 깨뜨린다.

  • 사용자가 직접 타이핑하지 않아도 호출이 반복됨
  • 긴 작업을 위해 컨텍스트가 계속 이어짐
  • 도구 호출, 재시도, 검증 루프가 자연스럽게 붙음
  • 사람이 한 번 시키면 내부적으로 여러 번 더 호출됨
  • 잘 만든 harness일수록 더 오래, 더 자주, 더 깊게 모델을 사용함

즉, 채팅형 사용자는 “질문 하나 → 답변 하나”에 가깝지만, 에이전트형 사용자는 “작업 하나 → 다수의 내부 호출”에 가깝다. 이 차이는 생각보다 훨씬 크다.

월정액 모델은 원래 이런 패턴에 약하다

월정액 모델은 사용량이 어느 정도 예측 가능해야 유지된다. 그런데 에이전트는 그 예측 가능성을 계속 깨뜨린다.

예를 들어 같은 구독제라도 아래는 전혀 다르다.

  • 가끔 질문하는 사용자
  • 긴 코딩 세션을 자주 여는 사용자
  • harness를 통해 반자동/자동 작업을 계속 돌리는 사용자
  • 여러 프로젝트를 병렬로 굴리는 파워 유저

이걸 다 같은 정액 안에 넣으려 하면 언젠가 한계가 온다. 실제로 서비스 입장에서는 아래 셋 중 하나를 고르게 된다.

  1. 한도를 더 빡빡하게 건다
  2. 가격을 올린다
  3. 특정 사용 패턴을 막는다

이번 흐름은 사실상 3번에 가깝다.

여기서 중요한 건 OpenClaw 자체보다 “사용 패턴”이다

이런 이슈가 나오면 사람들은 보통 특정 도구 이름에 먼저 집중한다. OpenClaw가 문제냐, 어떤 구현이 문제냐, 특정 프로젝트만 차단한 거냐 같은 질문이 먼저 나온다.

물론 그 차이도 중요하다. 하지만 더 본질적인 건 이름이 아니라 사용 패턴이다.

서비스 제공자 입장에서 더 민감한 건 대개 이런 쪽이다.

  • 장시간 지속되는 세션
  • 반복 호출이 많은 자동화
  • 인간 입력 대비 비정상적으로 높은 모델 사용량
  • 도구 호출과 재시도가 많이 붙는 흐름
  • 여러 작업을 병렬로 굴리는 구조

즉, 어떤 harness가 특별히 나빠서라기보다, 에이전트형 UX가 월정액 요금제의 취약점을 너무 잘 찌른다고 보는 편이 더 맞다.

“정책”처럼 보이지만 사실은 용량과 수익성 문제다

이런 조치가 나올 때 사람들은 철학적으로 받아들이기 쉽다. 개방성이 후퇴했다, Unix 철학에 어긋난다, 상호운용성을 해친다 같은 이야기다. 그런 문제의식도 이해는 간다.

그런데 운영 쪽 관점에서 보면 이유는 훨씬 덜 낭만적일 가능성이 크다.

  • GPU 용량이 부족하다
  • 특정 사용 패턴이 예상보다 빠르게 늘었다
  • 정액제 가격이 실제 비용 구조와 안 맞는다
  • 서비스 품질을 유지하려면 누군가를 먼저 제한해야 한다
  • 결국 더 중요한 고객군에 용량을 먼저 배분한다

문제를 철학으로 설명할 수는 있어도, 실제 조치는 대개 용량과 수익성이 결정한다.

에이전트는 왜 이렇게 비싸지나

사람이 직접 채팅하는 것과 달리, 에이전트는 혼자서 토큰을 잘 태운다.

예를 들면 이런 식이다.

  • 작업 계획 세움
  • 파일 읽음
  • 중간 결과 요약
  • 다시 질문
  • 도구 호출
  • 실패 시 재시도
  • 결과 검증
  • 다른 경로로 한 번 더 확인

사람 입장에서는 “한 번 시킨 일”인데, 모델 입장에서는 이미 여러 차례 호출을 거친 셈이다. 게다가 이런 흐름은 좋은 도구일수록 더 정교해진다. 아이러니하게도 에이전트를 잘 만들수록 월정액 모델에 부담이 커지는 구조가 된다.

그래서 앞으로 더 자주 보게 될 장면

나는 이런 일이 앞으로 더 많아질 거라고 본다. Claude만의 문제가 아니라, 구독형 AI 서비스 전반에서 반복될 가능성이 높다.

특히 아래 조합은 계속 마찰을 만든다.

  • 월정액 요금제
  • 고성능 모델
  • 긴 컨텍스트
  • 멀티스텝 에이전트
  • 자동화 harness
  • 병렬 작업

이걸 한 서비스 안에서 모두 싸게 제공하는 건 오래 버티기 어렵다. 그래서 앞으로는 점점 아래처럼 갈 가능성이 높다.

  • 채팅형 구독은 유지
  • 에이전트형 사용은 별도 과금
  • API 기반 사용은 usage-based billing 강화
  • 공식 제품과 써드파티 harness의 허용 범위 분리
  • 기업 고객과 일반 구독자의 용량 우선순위 분리

사용자는 왜 불만이 커질까

문제는 사용자 입장에서도 불만이 커질 수밖에 없다는 점이다. 이미 월 구독을 내고 있는데, 정작 가장 생산적인 사용 방식이 제한되면 “그럼 뭘 위해 이 돈을 내는가”라는 생각이 들 수밖에 없다.

특히 에이전트 도구를 쓰는 사람일수록 이런 감정을 강하게 느낀다.

  • 수동 채팅보다 자동화가 더 가치 있음
  • 반복 작업을 줄이려고 구독하는데, 그 자동화가 막힘
  • 모델의 똑똑함보다 작업 완결성이 더 중요함
  • 정작 실무 가치가 큰 흐름이 제약됨

그래서 이런 조치는 단순한 ToS 변경 이상으로 체감된다. 사용자는 기능 하나를 잃는 게 아니라, AI를 쓰는 방식 자체가 제한됐다고 느끼기 쉽다.

그럼 대안은 뭐가 남나

결국 방향은 몇 가지로 갈린다.

1. 공식 제품 안에서 허용된 범위만 쓴다

가장 단순하지만, 가장 답답할 수도 있다.

2. API 기반으로 넘어간다

자유도는 높지만 비용 예측이 어려워진다.

3. 더 저렴하거나 일관된 다른 모델로 분산한다

최고 성능보다 운영 가능성을 택하는 쪽이다.

4. 로컬 / 온디바이스 계층을 더 많이 활용한다

모든 걸 대체하진 못해도, 반복 작업과 전처리를 분산해 부담을 줄일 수 있다.

나는 앞으로 3번과 4번 조합이 꽤 현실적일 거라고 본다. 최고의 모델 하나에 모든 흐름을 몰아넣는 구조는 점점 더 비싸고 불안정해질 가능성이 크다.

OpenClaw 같은 쪽에서 배울 점도 있다

이런 일이 아쉽긴 해도, 여기서 배울 점은 분명하다. 결국 에이전트의 가치는 모델만이 아니라 하네스 구조에서 나온다는 점이다.

  • 세션 관리
  • 작업 분해
  • 도구 연결
  • 실패 복구
  • 결과 전달
  • 모델 라우팅

이 계층이 잘 되어 있으면, 특정 모델 하나에 덜 종속될 수 있다. 반대로 이 구조가 약하면 모델 정책 하나 바뀔 때 시스템 전체가 같이 흔들린다.

그래서 장기적으로 더 중요한 건 “어느 모델이 제일 좋나”보다, 모델이 바뀌거나 막혀도 작업 구조를 유지할 수 있나에 가깝다.

마무리

Claude 구독 모델과 OpenClaw 이슈를 보면서 든 생각은 단순하다. 이건 정책 논란처럼 보이지만, 실제로는 월정액 요금 구조와 에이전트형 사용 패턴의 충돌에 더 가깝다.

정리하면 이렇다.

  • 채팅형 사용과 에이전트형 사용은 비용 구조가 다르다
  • 잘 만든 harness일수록 월정액 모델에 더 큰 부담을 준다
  • 서비스는 결국 한도 강화, 가격 인상, 특정 패턴 차단 중 하나를 고르게 된다
  • 앞으로는 구독형 채팅과 에이전트형 사용이 더 분리될 가능성이 높다
  • 그래서 장기적으로 중요한 건 모델 하나보다 하네스의 독립성과 라우팅 구조다

결국 에이전트 시대의 핵심 문제는 성능만이 아니다. 누가 그 비용을 감당하고, 어떤 사용 패턴까지 허용할 것인가가 점점 더 중요한 설계 문제가 되고 있다.

댓글남기기