4 분 소요

AGENTS.md와 skill 묶음 유행의 배경을 설명하는 대표 이미지

요즘 AI 코딩 에이전트 쪽을 보다 보면 비슷한 장면이 자주 보인다. 누군가는 AGENTS.md를 올리고, 누군가는 CLAUDE.md를 정리하고, 누군가는 rules 폴더를 만들고, 또 누군가는 아예 skill 묶음을 따로 배포한다. 겉으로 보면 서로 조금씩 다른 문화처럼 보이지만, 안쪽을 보면 사실 같은 방향으로 가고 있다.

다들 결국 자기 작업 방식을 외부 파일로 꺼내고 있다.

Addy Osmani의 agent-skills도 그 흐름 안에 있다. 스펙, 계획, 구현, 테스트, 리뷰, 배포까지 개발 과정을 단계별 스킬로 패키징해 두고, 에이전트가 필요할 때 꺼내 쓰게 만든다. 물론 대부분은 이런 걸 그대로 쓰지 않는다. 결국 각자 자기 팀, 자기 프로젝트, 자기 취향에 맞게 뜯어고친다. 그런데도 이런 묶음이 계속 나오는 이유는 분명하다.

이제는 좋은 프롬프트 한 줄로는 부족하다는 걸 다들 안다

예전에는 “프롬프트를 잘 쓰면 된다”는 믿음이 꽤 강했다. 실제로 짧은 질문이나 단발성 작업에서는 지금도 어느 정도 맞는 말이다. 하지만 코딩 에이전트처럼 길게 이어지는 작업에서는 금방 한계가 드러난다.

  • 스펙 없이 바로 코드를 쓰기 시작함
  • 테스트를 나중으로 미룸
  • 리뷰 없이 얼기설기 끝냄
  • 보안이나 성능은 마지막에 생각남
  • 한번 잘 되더라도 다음 세션에서 재현이 안 됨

즉 문제는 모델의 순간 지능만이 아니다. 작업 순서와 판단 기준이 외부에 고정돼 있지 않으면 품질이 계속 흔들린다.

그래서 사람들은 점점 프롬프트 한 줄보다 아래를 보게 된다.

  • 어떤 순서로 일하게 할지
  • 어떤 체크포인트를 거치게 할지
  • 무엇을 증거로 삼을지
  • 언제 멈추고 언제 되돌릴지
  • 어떤 컨텍스트를 먼저 읽게 할지

이걸 계속 채팅창에 매번 다시 쓰는 건 비효율적이다. 결국 파일로 빼게 된다.

AGENTS.md, CLAUDE.md, rules, skills는 이름만 다를 뿐 비슷한 욕구에서 나온다

형태는 조금씩 다르다.

  • AGENTS.md
  • CLAUDE.md
  • .cursor/rules
  • plugin skill
  • instruction file
  • prompt template 모음

그런데 이걸 다 묶어서 보면 본질은 비슷하다.

1. 작업 순서를 고정하고 싶다

“코드 전에 스펙”, “작게 나눠서 구현”, “테스트는 증거”, “리뷰를 건너뛰지 말 것” 같은 흐름을 반복 가능하게 만들고 싶다.

2. 세션이 바뀌어도 기준이 남아 있길 원한다

대화창은 쉽게 사라지고 흐려지지만, 파일은 남는다. 그래서 기준을 기억이 아니라 저장된 구조로 옮긴다.

3. 모델의 기분이 아니라 프로세스를 믿고 싶다

오늘은 잘하고 내일은 못하는 걸 줄이려면, 에이전트에게 기대하는 동작을 좀 더 명시적으로 외부화해야 한다.

4. 팀이나 프로젝트의 습관을 재사용하고 싶다

좋은 작업 방식이 생기면 그걸 매번 다시 설명하지 않고, 파일 하나로 공유하고 싶어진다.

결국 이름은 달라도 목적은 거의 같다. 에이전트에게 사람의 작업 습관을 주입하는 것이다.

유행처럼 보이는 이유도 사실 자연스럽다

이런 게 요즘 갑자기 많아 보이는 이유는, 사람들이 비슷한 벽에 동시에 부딪히고 있기 때문이다.

첫 번째 단계

“와, 모델이 똑똑하다”

두 번째 단계

“근데 자꾸 같은 실수를 한다”

세 번째 단계

“내가 일하는 순서를 먼저 알려줘야겠네”

네 번째 단계

“그걸 매번 말하지 말고 파일로 빼자”

다섯 번째 단계

“이왕이면 남도 쓸 수 있게 패키징하자”

지금 보이는 skill pack, rules 묶음, agent instruction repo들은 대부분 이 흐름의 결과물처럼 보인다. 어떤 면에서는 유행이라기보다, 에이전트를 실전에 붙여본 사람들이 거의 비슷한 결론에 도달하고 있는 현상에 가깝다.

그대로 쓰는 사람보다 고쳐 쓰는 사람이 더 많다

여기서 중요한 건, 이런 공개 skill pack이 정답이라서 쓰는 건 아니라는 점이다. 오히려 대부분은 그대로 못 쓴다.

왜냐면 실제 프로젝트마다 다 다르기 때문이다.

  • 테스트 문화가 다름
  • 배포 방식이 다름
  • 리뷰 기준이 다름
  • 프론트/백/모바일 우선순위가 다름
  • 허용 가능한 리스크가 다름
  • 팀이 중요하게 보는 원칙이 다름

그래서 공개된 묶음은 보통 완제품보다 출발점에 가깝다. 읽어보면 “아, 나도 이런 식으로 내 작업 방식을 정리해야겠네”라는 생각이 드는 쪽이다.

네 말처럼 결국은 다들 자기 입맛에 맞게 바꿔 쓴다. 그런데 그게 오히려 핵심이다. 공개 skill pack의 진짜 가치는 그대로 복붙해서 쓰는 데 있는 게 아니라, 자기 작업 방식을 언어화하고 파일화하는 계기를 준다는 데 있다.

결국 모델 경쟁보다 작업 구조 경쟁으로 가고 있다

이 흐름을 보면 다시 느끼게 되는 게 있다. 에이전트 품질은 점점 모델 하나의 차이보다, 그 모델이 어떤 구조 안에서 일하느냐에 더 크게 좌우된다는 점이다.

예를 들면 같은 모델을 써도 차이가 난다.

  • 스펙을 먼저 쓰게 하느냐
  • 태스크를 작게 쪼개느냐
  • 테스트를 강제하느냐
  • 리뷰 기준을 붙이느냐
  • 보안 체크를 뒤로 미루지 않느냐
  • 실패했을 때 되돌아오는 경로가 있느냐

이건 프롬프트의 문장 미묘함보다 작업 구조의 차이에 더 가깝다. 그래서 요즘 skill이 유행하는 건 어쩌면 당연하다. 사람들은 이제 모델을 설득하는 데서 그치지 않고, 모델이 일하는 구조 자체를 설계하려고 하기 때문이다.

Addy Osmani의 사례가 흥미로운 이유

agent-skills가 흥미로운 건 단순히 스킬 수가 많아서가 아니다. 오히려 그 안에 들어 있는 메시지가 더 중요하다.

  • 코드 전에 스펙을 만들 것
  • 구현은 작게 나눌 것
  • 테스트는 증거로 남길 것
  • 리뷰를 품질 게이트로 둘 것
  • 보안/성능/접근성을 별도 체크포인트로 둘 것
  • 배포도 마지막 순간의 감이 아니라 구조로 다룰 것

이건 사실 새로운 말이 아니다. 좋은 엔지니어링 조직은 원래 이렇게 일해 왔다. 다만 이제는 그걸 사람끼리만 공유하는 게 아니라, 에이전트도 따라야 하는 운영 규칙으로 옮기고 있다는 점이 달라졌다.

앞으로 더 많아질 것 같은 이유

나는 이런 종류의 파일이 앞으로 더 많아질 거라고 본다.

  • 개인용 작업 규칙 파일
  • 팀 전용 skill pack
  • 프로젝트별 agent instruction
  • 역할별 reviewer/tester/security persona
  • 도메인별 workflow bundle

그리고 이건 단순한 프롬프트 모음보다 더 오래갈 가능성이 크다. 왜냐면 사람들은 점점 “무슨 말을 해줄까”보다 “어떤 순서와 규칙으로 일하게 할까” 쪽에 더 관심을 가지게 되고 있기 때문이다.

마무리

요즘 AGENTS.md나 skill 묶음이 유행처럼 보이는 이유는 단순하다. 사람들이 더 이상 좋은 프롬프트 한 줄만으로는 충분하지 않다는 걸 몸으로 배우고 있기 때문이다.

정리하면 이렇다.

  • 공개된 skill pack은 완제품보다 출발점에 가깝다
  • 대부분은 그대로 쓰기보다 자기 입맛에 맞게 수정해서 쓴다
  • 그래도 이런 파일이 계속 나오는 건 작업 방식을 외부화하려는 수요가 크기 때문이다
  • 결국 에이전트 품질은 모델보다 작업 구조와 운영 규칙에서 더 크게 갈릴 때가 많다
  • 그래서 앞으로는 프롬프트 경쟁보다 workflow 파일 경쟁이 더 중요해질 가능성이 높다

어쩌면 지금 유행처럼 보이는 이 흐름은, 단순한 유행이 아니라 에이전트를 실무 도구로 쓰기 시작한 사람들이 공통으로 도달하는 다음 단계인지도 모르겠다.

댓글남기기