Anthropic이 2026년 5월 28일 Claude Opus 4.8을 공개했습니다.
이번 버전은 이름만 보면 큰 세대 교체처럼 보일 수 있지만, Anthropic이 직접 쓴 표현은 조금 더 차분합니다. Opus 4.7 위에 성능과 협업성을 개선한 업데이트이고, 가격은 기존 일반 사용 가격을 유지합니다.

개발자 입장에서 핵심은 모델 점수표보다 이쪽입니다.

  • Claude Code에서 더 큰 작업을 맡기는 dynamic workflows
  • claude.ai와 Claude Code의 effort control
  • 더 빠르지만 프리미엄 가격이 붙는 fast mode
  • API의 mid-conversation system messages
  • prompt cache 최소 길이 완화
  • Opus 4.7에서 이어지는 API 제약
  • 장기 에이전트 작업에서의 도구 호출, compaction, 자기검토 개선

즉 이번 업데이트는 “채팅 답변이 조금 더 좋아졌다”보다 긴 작업을 더 오래, 더 덜 흔들리게 맡기는 방향에 가깝습니다.

바로 보기

1. Opus 4.8은 “큰 새 이름”보다 실무 보정에 가깝다

Anthropic은 Opus 4.8을 가장 강력한 일반 제공 모델이라고 설명합니다. 동시에 글 말미에서는 Opus 4.8이 이전 모델보다 modest but tangible improvement, 즉 작지만 체감 가능한 개선이라고 정리합니다.

이 표현이 중요합니다.

이번 업데이트를 “모든 일을 새로 바꿔야 하는 모델”로 보면 과장입니다.
반대로 “별 변화 없는 소수점 업데이트”로 보면 Claude Code와 API를 쓰는 사람에게 중요한 기능을 놓칩니다.

정리하면 이렇습니다.

  • 일반 가격은 Opus 4.7과 동일합니다.
  • 모델 ID는 claude-opus-4-8입니다.
  • 장기 agentic coding, 복잡한 추론, 고자율 작업에 초점을 둡니다.
  • 1M token context window를 Claude API, Amazon Bedrock, Vertex AI에서 기본 지원합니다.
  • Microsoft Foundry에서는 200k context로 안내됩니다.
  • 최대 출력은 128k tokens로 안내됩니다.

초급자 기준으로는 한 번에 끝나는 답변보다 오래 이어지는 작업에서 차이를 봐야 합니다.

2. Claude Code의 핵심 변화는 dynamic workflows다

이번 발표에서 가장 실무적인 기능은 Claude Code의 dynamic workflows입니다.

Anthropic 설명 기준으로 dynamic workflows는 Claude가 큰 작업을 계획하고, 여러 하위 작업으로 나누고, 수십에서 수백 개의 subagent를 병렬로 실행한 뒤, 결과를 검증해 하나의 답으로 합치는 방식입니다.

잘 맞는 작업은 이런 쪽입니다.

  • 코드베이스 전체 bug hunt
  • 성능 병목 탐색
  • 보안 점검
  • API deprecation 대응
  • 대규모 프레임워크 마이그레이션
  • 레거시 코드 현대화
  • 여러 접근을 독립적으로 검증해야 하는 고위험 작업

Anthropic은 예시로 Claude Code와 Opus 4.8이 수십만 줄 규모 코드베이스 마이그레이션을 테스트 스위트를 기준으로 진행할 수 있다고 설명합니다. Dynamic workflows 발표 글에서는 Bun의 Zig에서 Rust로의 대규모 포팅 사례도 소개합니다.

다만 여기에는 중요한 단서가 있습니다.

Dynamic workflows는 일반 Claude Code 세션보다 토큰을 훨씬 많이 쓸 수 있습니다. 처음 workflow가 실행될 때 Claude Code가 실행 내용을 보여주고 확인을 받는 구조이며, 조직 관리자는 managed settings로 기능을 제어할 수 있습니다.

따라서 처음부터 “전체 저장소를 마음대로 고쳐줘”로 시작하면 비용과 변경 범위가 커질 수 있습니다.
처음에는 아래처럼 좁힌 작업이 낫습니다.

  • src/lib 안에서만 dead code 후보를 찾아줘
  • 인증 관련 변경 없이 입력 검증 누락만 찾아줘
  • 마이그레이션 계획만 만들고 파일 수정은 하지 마
  • 테스트가 있는 모듈 1개만 대상으로 workflow를 만들어줘

3. effort control은 속도와 품질을 사용자가 고르는 장치다

Opus 4.8은 effort 개념도 더 전면에 나왔습니다.

Claude.ai와 Cowork에는 모델 선택 옆에 Claude가 얼마나 깊게 작업할지 고르는 control이 생겼습니다. 낮은 effort는 더 빠르고 사용 한도를 덜 쓰는 방향이고, 높은 effort는 더 깊게 생각해 품질을 올리는 방향입니다.

개발자가 봐야 할 점은 기본값입니다.

Claude Opus 4.8의 effort 기본값은 high입니다. Anthropic은 이 값이 품질과 사용자 경험의 균형이 가장 좋다고 판단했다고 설명합니다. Claude Code에서는 어려운 작업과 오래 걸리는 비동기 workflow에 extra, Claude Code 설정상 xhigh를 권장합니다.

실무에서는 이렇게 나누면 됩니다.

작업권장 감각
짧은 질문, 문법 확인, 단순 요약낮은 effort
버그 원인 추적, 설계 비교, PR 리뷰high
장기 마이그레이션, 여러 모듈 동시 분석extra 또는 xhigh
비용이 더 중요하고 결과 검토가 쉬운 작업낮은 effort로 시작

중요한 건 높은 effort = 항상 정답이 아니라는 점입니다.
검증 가능한 테스트, lint, 타입체크, 리뷰 기준이 같이 있어야 합니다.

4. fast mode는 더 빠르지만 무료 가속은 아니다

Opus 4.8에는 fast mode도 붙었습니다.

Anthropic 발표 기준 fast mode는 같은 모델에서 출력 속도를 최대 2.5배 높이는 옵션입니다. 기존 모델의 fast mode보다 가격을 크게 낮췄다는 설명도 같이 나왔습니다.

가격은 구분해서 봐야 합니다.

구분입력 100만 토큰출력 100만 토큰
일반 Opus 4.8$5$25
Opus 4.8 fast mode$10$50

즉 일반 사용 가격은 Opus 4.7과 같고, fast mode는 더 빠른 대신 프리미엄 가격입니다.
긴 보고서나 대규모 코드 작업에서 체감 시간은 줄 수 있지만, 반복 호출이 많은 agent loop에 무심코 켜두면 비용이 늘 수 있습니다.

fast mode는 이런 경우에 먼저 검토할 만합니다.

  • 사람이 기다리고 있는 대화형 개발 세션
  • CI/CD 앞단에서 빠르게 판단해야 하는 검토 작업
  • 품질보다 응답 지연이 병목인 내부 도구
  • 같은 작업을 일반 모드와 비교해 비용 대비 시간을 측정할 수 있는 팀

5. API 개발자는 mid-conversation system messages를 봐야 한다

API 쪽에서 가장 눈에 띄는 변화는 messages 배열 안에 role: "system" 항목을 중간에 넣을 수 있다는 점입니다.

기존에는 장기 작업 중 시스템 지시를 바꾸려면 전체 system prompt를 다시 구성하거나, 사용자 턴에 지시를 섞어 넣는 식의 우회가 필요했습니다. Opus 4.8에서는 사용자 턴 뒤에 system message를 배치해 중간 지시를 갱신할 수 있습니다.

이 기능이 유용한 경우는 명확합니다.

  • agent 실행 중 권한 범위를 바꿔야 할 때
  • 남은 token budget을 갱신해야 할 때
  • 환경 정보가 중간에 바뀔 때
  • 긴 작업에서 prompt cache hit를 유지하고 싶을 때
  • 사용자 메시지와 시스템 지시를 더 깔끔하게 분리하고 싶을 때

특히 prompt cache와 같이 보면 의미가 큽니다.
API 문서는 Opus 4.8에서 cache 가능한 prompt 최소 길이가 1,024 tokens로 낮아졌다고 안내합니다. Opus 4.7에서는 cache가 안 걸리던 비교적 짧은 prompt도 cache entry를 만들 수 있는 구간이 생긴 셈입니다.

6. Opus 4.7의 API 제약은 그대로 이어진다

업그레이드할 때 좋은 소식만 보면 안 됩니다.
Opus 4.8은 Opus 4.7에서 이어지는 제약도 그대로 갖고 있습니다.

API 문서 기준으로 Messages API에서 아래 제약은 유지됩니다.

  • temperature, top_p, top_k를 non-default 값으로 설정하면 400 error가 날 수 있습니다.
  • thinking: {"type": "enabled", "budget_tokens": N} 방식의 extended thinking budget은 지원하지 않습니다.
  • thinking을 쓰려면 thinking: {"type": "adaptive"}와 effort parameter를 조합하는 방향입니다.

이미 Opus 4.7에 맞춰둔 코드는 큰 변경 없이 넘어갈 가능성이 높습니다.
하지만 Opus 4.6이나 그 이전 모델에서 바로 넘어온다면 sampling parameter와 thinking 설정을 먼저 정리해야 합니다.

간단히 말하면:

  • 온도값으로 성격을 조절하던 코드는 prompt와 평가셋으로 옮깁니다.
  • 긴 사고 예산을 직접 숫자로 주던 코드는 adaptive thinking과 effort로 바꿉니다.
  • agent harness는 stop reason, refusal, tool 호출 실패를 로그로 남깁니다.

7. “더 정직하다”는 주장도 검증 기준이 필요하다

Anthropic은 Opus 4.8의 큰 개선점 중 하나로 honesty를 들었습니다.
초기 테스터와 내부 평가에서 Opus 4.8이 불확실성을 더 잘 표시하고, 코드에 결함이 있는데도 그냥 넘어가는 경우가 Opus 4.7보다 줄었다고 설명합니다.

이건 개발자에게 좋은 방향입니다.
AI 코딩 도구에서 가장 위험한 답변은 “모른다”가 아니라 “다 된 것처럼 말하지만 실제로는 깨져 있는 상태”이기 때문입니다.

다만 이 주장은 그대로 믿기보다 팀의 검증 흐름에 연결해야 합니다.

  • Claude가 “완료”라고 말한 뒤에도 테스트를 돌립니다.
  • 변경 파일 수, 실패 테스트, type error를 자동으로 요약하게 합니다.
  • 확신이 낮은 부분을 별도 섹션으로 쓰게 합니다.
  • 보안, 결제, 인증, 데이터 삭제 로직은 사람 리뷰를 강제합니다.
  • “검증했다”는 문장만 믿지 말고 어떤 명령을 실행했는지 확인합니다.

Opus 4.8의 장점이 실제로 의미 있으려면, 모델의 자기검토 능력을 테스트 가능한 루프 안에 넣어야 합니다.

누가 바로 써볼 만한가

Claude Code를 매일 쓰는 개발자

가장 먼저 체감할 가능성이 큽니다.
특히 긴 코드 탐색, 여러 파일을 넘나드는 버그 수정, 마이그레이션 계획 수립에서 Opus 4.8과 dynamic workflows를 시험해볼 만합니다.

단, 처음부터 자동 수정 권한을 넓게 주기보다 계획만, 분석만, 테스트 있는 모듈만으로 시작하는 편이 좋습니다.

API로 agent를 만드는 팀

claude-opus-4-8 전환 자체보다 주변 옵션 정리가 중요합니다.

확인할 것은 네 가지입니다.

  • sampling parameter를 non-default로 보내고 있지 않은가
  • thinking budget을 옛 방식으로 쓰고 있지 않은가
  • 중간 system message로 agent 지시 갱신을 단순화할 수 있는가
  • prompt cache 최소 길이 완화로 비용 구조가 달라지는가

일반 Claude 사용자

일반 사용자는 effort control을 먼저 보면 됩니다.
빠른 답이 필요한 질문은 낮은 effort, 기획서나 코드 리뷰처럼 검토가 필요한 작업은 높은 effort로 나누는 식입니다.

팀 관리자

관리자는 모델 품질보다 비용과 권한을 먼저 봐야 합니다.

Dynamic workflows는 강력하지만 긴 시간, 많은 subagent, 많은 토큰을 쓸 수 있습니다. 팀 단위로 켠다면:

  • 누가 dynamic workflows를 쓸 수 있는지 정합니다.
  • repo 접근 범위를 좁힙니다.
  • 비용 알림과 사용량 리포트를 확인합니다.
  • production 변경은 PR과 CI를 반드시 거치게 합니다.
  • 민감한 저장소에서는 먼저 read-only 분석부터 시작합니다.

전환 체크리스트

Opus 4.8을 바로 붙이기 전에 아래만 확인해도 큰 문제를 줄일 수 있습니다.

  1. 모델 ID를 claude-opus-4-8로 바꿀 위치를 확인합니다.
  2. Opus 4.7과 같은 테스트셋으로 결과를 비교합니다.
  3. temperature, top_p, top_k를 보내는 코드를 제거하거나 기본값으로 둡니다.
  4. extended thinking budget을 쓰던 코드는 adaptive thinking과 effort로 바꿉니다.
  5. fast mode는 기본값으로 켜지 말고 지연시간이 병목인 경로에서만 실험합니다.
  6. prompt cache hit rate와 입력 토큰 비용 변화를 봅니다.
  7. Claude Code dynamic workflows는 작은 저장소나 제한된 디렉터리에서 먼저 테스트합니다.
  8. 모델이 불확실성을 표시하도록 프롬프트에 실패, 가정, 미검증 항목을 분리하게 합니다.

한 줄 결론

Claude Opus 4.8은 “완전히 새 AI”라기보다, Claude를 긴 개발 작업과 전문 업무에 더 오래 맡기기 위한 업데이트입니다.
특히 Claude Code 사용자와 API agent를 운영하는 팀은 dynamic workflows, effort, fast mode, mid-conversation system messages를 먼저 봐야 합니다.

반대로 일반 사용자는 모델 이름보다 effort를 언제 높일지, 개발자는 모델이 끝냈다고 말한 일을 어떻게 검증할지가 더 중요합니다.

같이 보면 좋은 글

출처