Claude Opus 4.6, Anthropic 최강 모델 등장
AI

Claude Opus 4.6, Anthropic 최강 모델 등장

zaq · · 3 min read

Anthropic이 새로운 최상위 모델 Claude Opus 4.6을 공개했습니다. 코딩, 추론, 에이전트 작업 등 모든 영역에서 이전 모델을 능가하며, Opus 최초로 1M 토큰 컨텍스트 윈도우를 지원합니다.

한마디로 요약하면

GDPval-AA에서 GPT-5.2보다 144 Elo 포인트 우위를 기록했고, Terminal-Bench 2.0과 Humanity's Last Exam에서 최고 점수를 달성했습니다. 가격은 기존과 동일한 백만 토큰당 $5/$25입니다.

핵심 변화

코딩 능력 대폭 향상

Opus 4.6은 이전 모델보다 더 신중하게 계획하고, 에이전트 작업을 더 오래 지속하며, 대규모 코드베이스에서 더 안정적으로 작동합니다. 자체 코드 리뷰와 디버깅 능력도 향상되어 실수를 스스로 잡아냅니다. 실제로 여러 기업 파트너들이 "이전 모델에서 실패하던 작업이 갑자기 쉬워졌다"고 평가했습니다.

1M 토큰 컨텍스트 (Opus 최초)

Opus 클래스 모델 최초로 100만 토큰 컨텍스트 윈도우를 베타로 지원합니다. 20만 토큰을 초과하는 프롬프트에는 프리미엄 가격($10/$37.50)이 적용됩니다. MRCR v2 벤치마크에서 Opus 4.6은 76%를 기록한 반면, 이전 Sonnet 4.5는 18.5%에 그쳤습니다. "컨텍스트 부패" 문제가 크게 개선되었습니다.

새로운 컨트롤 기능

adaptive thinking과 effort 컨트롤이 추가되었습니다. 이제 네 단계의 effort(low, medium, high, max)를 선택할 수 있고, 모델이 상황에 따라 extended thinking 사용 여부를 결정합니다. context compaction 기능으로 긴 대화도 자동으로 요약하여 컨텍스트 한계를 넘어서 작업할 수 있습니다.

실용 활용

에이전트 팀

Claude Code에서 이제 에이전트 팀을 구성할 수 있습니다. 여러 에이전트가 병렬로 작업하고 자율적으로 조율합니다. 코드베이스 리뷰처럼 독립적인 작업에 특히 유용합니다.

오피스 도구 통합

Claude in Excel이 대폭 개선되어 장시간 작업과 복잡한 작업을 더 잘 처리합니다. 구조화되지 않은 데이터를 추론하여 적절한 구조로 변환하고, 멀티스텝 변경을 한 번에 처리합니다. Claude in PowerPoint도 연구 미리보기로 출시되어 레이아웃, 폰트, 슬라이드 마스터를 인식해 브랜드에 맞는 프레젠테이션을 생성합니다.

128k 출력 토큰

최대 128k 토큰 출력이 가능해 긴 콘텐츠를 여러 요청으로 나누지 않고 한 번에 완성할 수 있습니다.

마무리

안전성 평가에서도 전임 모델인 Opus 4.5만큼, 혹은 그 이상으로 잘 정렬되어 있습니다. 사이버보안 능력이 향상된 만큼 새로운 가드레일도 적용했습니다. Opus 4.6은 진짜 "최강"이라는 수식어가 아깝지 않은 모델입니다.


태그: AI, Claude, Anthropic

출처: https://www.anthropic.com/news/claude-opus-4-6