CDSA | 홈페이지 블로그
Curation · 키노트 해설

Code with Claude 2026 키노트
비개발자가 알아둘 것만 풀어 씁니다

모델은 지수곡선으로 좋아지는데, 조직은 여전히 직선으로 움직입니다. 그 간격을 메우는 다섯 가지 무기를, 회사에서 동료에게 그대로 설명할 수 있는 표현으로 옮겨 놓습니다.

큐레이션 · CDSA 편집팀  ·  원문 Anthropic Code with Claude 2026 키노트 2026. 5. 9

앤트로픽의 연례 개발자 행사 Code with Claude 2026 오프닝 키노트가 끝났습니다. 47분짜리 발표였고, 그 안에 새로 들어온 용어가 적지 않았습니다. Managed Agents, Multi-Agent Orchestration, Outcomes, Dreaming, Routines, CI Autofix, Advisor Strategy. 영문 약어와 신조어가 빽빽이 박혀 있어서, 평소 코드를 직접 짜지 않는 분들에게는 한 번 흘려듣고 끝나기 쉬운 자리였을 것입니다.

그래서 이 글에서는 키노트의 흐름을 다섯 가지 화두로 추려, 각 화두에서 등장한 핵심 용어를 짧게 정의하고 그 의미를 평어로 풀어내려고 합니다. 회사에서 임원이나 동료에게 "지금 AI 도구가 어디까지 와 있느냐"고 질문받았을 때, 그대로 옮겨 쓸 수 있는 표현을 찾는 것이 목적입니다.

01 / 큰 그림모델은 지수곡선, 조직은 직선

키노트는 앤트로픽의 최고제품책임자(CPO) 발언으로 열렸습니다. 핵심 메시지는 한 문장으로 요약됩니다. 모델 능력은 지수곡선으로 좋아지고 있는데, 대부분의 조직은 여전히 직선으로 도입하고 있다는 것입니다. 그래서 "AI가 할 수 있는 일"과 "사람들이 실제로 시키고 있는 일" 사이에 점점 큰 간격이 벌어지고 있고, 이 간격이 곧 비즈니스 기회라는 이야기입니다.

발표자는 1년 전 발표 자리에서는 "에이전트가 사람의 확인 없이 한 시간 정도 일하는 것"을 비현실적인 목표처럼 이야기했었는데, 지금은 "에이전트가 밤새 끝까지 작업해서 다음 날 아침에 결과물을 받는 일"이 일상이 됐다고 짚었습니다. 또 한 달 전에는 차세대 모델(Mythos·코드네임)이 OpenBSD 운영체제 전체 코드를 읽고, 27년 동안 어떤 사람·퍼저·정적분석기도 잡아내지 못했던 보안 취약점을 찾아냈다는 사례도 인용했습니다.

Task Horizon태스크 호라이즌 "에이전트가 사람 개입 없이 얼마나 긴 호흡으로 한 가지 일을 끝까지 해낼 수 있는가"를 측정하는 지표입니다. 작년에는 분 단위, 올해는 시간 단위, 내년에는 며칠 단위로 늘어나고 있다는 것이 발표자의 진단입니다.

구체적인 사용량 숫자도 함께 공개됐습니다. 1년 전 대비 Claude 플랫폼의 API 호출량은 17배로 늘었고, Claude Code 평균 사용자는 일주일에 20시간을 그 안에서 보낸다고 합니다. 도구 하나를 일주일에 사흘 가까이 쓴다는 의미입니다. 또한 발표 시점에 Pro·Max·Team 등 유료 플랜의 5시간 단위 사용량 한도를 두 배로 늘리고, Opus 모델의 API 한도도 크게 올린다고 발표했습니다.

1년 전에는 "사람이 한 시간 자리를 비워도 AI가 알아서 일을 이어 가는 것"이 도전 과제였고, 지금은 밤새 일이 끝나 있는 게 일상입니다. 그 간격이 조직과 모델 사이에 그대로 쌓이고 있습니다.

02 / 모델 층업그레이드를 비즈니스 기회로 보는 자세

두 번째 발표자는 리서치 PM 팀의 다이앤이었습니다. 모델은 어디까지 왔고, 어디로 가고 있는지를 정리했습니다. 그가 던진 가장 실용적인 메시지는 "모델 업그레이드를 비즈니스 기회로 다루라"는 한 문장입니다.

프런티어 모델Frontier model 그 시점에 인류가 실제로 사용할 수 있는 최첨단 AI 모델을 가리키는 표현입니다. 앤트로픽은 지난 12개월간 8개의 프런티어 모델을 내놓았고, 현재 주력은 Opus 4.7, 미리보기로 공개되는 차세대 모델은 Mythos라는 코드명으로 불리고 있습니다.
스캐폴딩Scaffolding 원래 건축의 비계(아래에서 받쳐주는 임시 구조)에서 온 말입니다. 모델이 부족할 때 사람이 짜둔 안내 코드와 안내 프롬프트로 모델을 받쳐주는 작업을 통칭합니다. 다이앤은 "예전에는 모델을 일으켜 세우려고 스캐폴딩을 짰지만, 지금은 모델의 능력을 더 끌어내려고 스캐폴딩을 쓴다"고 표현했습니다.
Eval(평가셋)evaluation suite 한 모델이 실무에서 얼마나 잘 작동하는지 측정하려고 미리 만들어둔 문제 세트입니다. 새 모델이 나올 때마다 같은 문제 세트를 자동으로 돌려 보면, 어떤 능력이 갑자기 뛰어올랐는지 즉시 보입니다. 다이앤은 "평가셋이 단단하고, 새 모델이 나왔을 때 사람 손을 거의 거치지 않은 채 곧바로 갈아끼워 비교해 볼 수 있는 절차까지 마련해 둔 팀이 새 모델 발표를 기회로 바꾼다"고 말했습니다.

실제 사례도 함께 인용됐습니다. 코딩 에이전트 회사 AMP는 자사 벤치마크에서 Opus 4.7이 가장 높은 점수를 내자, 똑똑이 모드를 통째로 그 모델로 옮기고 자체 스캐폴딩 일부를 제거했다고 합니다. 모델이 충분히 좋아져서 받쳐줄 사다리가 줄어들었다는 의미입니다. 라쿠텐은 같은 모델로 운영 환경에서 풀어낸 엔지니어링 작업의 양이 직전 대비 세 배가 됐고, 인튜이트는 Opus 4.7이 자기 추론의 결함을 스스로 짚어내고 다시 푸는 모습을 확인했다고 합니다.

03 / 플랫폼 층관리형 에이전트와 세 가지 신무기

세 번째 블록은 클라우드 플랫폼 팀의 케이틀린과 안젤라가 맡았습니다. "비즈니스에서 모델을 잘 쓰지 못하게 막는 두 가지 벽"을 짚는 데서 시작했습니다. 하나는 원하는 결과를 정확히 끌어내기가 여전히 어렵다는 점, 다른 하나는 빠르게 출시하면서도 운영 가능한 품질로 굴리기가 어렵다는 점입니다.

Claude Managed Agents관리형 에이전트 앤트로픽이 에이전트 운영의 뒷일까지 통째로 책임지는 묶음 상품입니다. 사용하는 회사 입장에서는 두 가지만 정해 두면 됩니다 — "이 비서가 무슨 일을 하느냐"와 "어떤 도구를 쓰게 할 것이냐". 비서가 사용자 취향을 어떻게 기억해 둘지, 일을 어디서 돌릴지, 잘 굴러가고 있는지 어떻게 살필지 같은 운영의 잡일은 모두 앤트로픽 쪽이 안에 묶어 두고 알아서 처리해 줍니다. 시연에서는 노션이 자기 제품 안에 Claude 에이전트를 띄울 때 이 위에 올렸다는 사례가 소개됐습니다.
Advisor Strategy어드바이저 전략 같은 일을 두 모델이 나눠 맡는 방식입니다. 빠르고 저렴한 모델(예: Sonnet, Haiku)이 실제 실행을 하다가, 막히면 더 똑똑한 모델(예: Opus)에게 자문을 구합니다. 법률 분야 소프트웨어 회사 Eve Legal이 이 방식으로 "프런티어 수준 품질을 5분의 1 비용에" 달성했다는 사례가 인용됐습니다.

이 위에 새로 추가된 세 가지가 키노트의 발표 핵심입니다.

Multi-Agent Orchestration멀티 에이전트 오케스트레이션 여러 에이전트를 조 단위로 묶어 한 가지 큰 일을 시키는 방식입니다. 시연에서는 가상의 우주 스타트업 루마라(Lumara)가 달에 드론을 착륙시키는 일을 셋으로 쪼개 보여 줬습니다. 커맨더 에이전트가 전체 미션을 총괄하고, 디텍터 에이전트가 좋은 착륙 지점을 찾고, 네비게이터 에이전트가 안전 비행과 착륙을 책임지는 식입니다. 각자에게 자기만의 작업 메모장을 따로 쥐어 줘서 서로의 머릿속이 섞이지 않도록 분리해 두고, 결과물만 마지막에 모아 더 나은 답을 만듭니다.
Outcomes아웃컴(목표 정의) "어떤 결과가 성공인가"를 글로 적은 한 장짜리 메모로 정해 두면, 에이전트가 그 기준을 만족할 때까지 스스로 다시 시도하게 만드는 기능입니다. 시연에서는 "드론은 부드럽게 착지해야 하고, 깨끗한 지면에 내려야 하며, 지구로 돌아갈 만큼의 연료를 남겨야 한다"는 세 줄짜리 기준이 그대로 합격 기준표가 됐습니다. 시도해도 안 되면 그만두는 한계 횟수도 사용자가 직접 정할 수 있습니다.
Dreaming드리밍(자기 학습) 이번 키노트에서 가장 화제가 된 기능입니다. 에이전트가 자기의 과거 작업 기록을 스스로 다시 들여다보고, 거기서 빠뜨린 기술과 배웠어야 할 교훈을 추려 자기의 메모리에 직접 적어 두는 자기 학습 회로입니다. 사용자는 콘솔에서 "Dream" 버튼만 누르면 됩니다. 시연에서는 6개 후보 착륙지 중 4곳만 성공시키던 시스템이, 하룻밤의 드리밍 후 6곳 전부를 성공시키는 모습이 공개됐습니다. 이때 에이전트가 자기 손으로 만들어 낸 산출물 중 하나가 "착륙 플레이북"이라 불리는 — 일이 잘 풀릴 때 자주 통하는 요령들을 모아 정리한 — 메모 모음 문서였습니다.

세 가지를 한 줄로 묶으면 다음과 같습니다. 멀티 에이전트는 일을 나누고, 아웃컴은 합격선을 정의하고, 드리밍은 시간이 지날수록 시스템 스스로 좋아지게 만듭니다. 비개발자에게 가장 와닿는 표현으로 옮기면, "한 번 잘 짜두면, 자고 일어나면 더 똑똑해져 있는 비서"를 쓰는 일이 가능해진다는 이야기입니다.

04 / 도구 층Claude Code, "코드를 시키는 코드"로

네 번째 블록은 Claude Code 책임자 안젤라와 보리스 셔니의 발표였습니다. 1년 전과 가장 많이 달라진 부분이라고 직접 짚었습니다. 1년 전에는 사용자가 한 줄 한 줄 모든 코드 변경을 직접 검토했고, "이 작업을 진행해도 됩니까" 식의 허락을 묻는 알림이 100~200번씩 떴습니다. 지금은 대부분의 사용자가 자동 모드로 두고, 작업이 끝났을 때 동료에게 검토 요청을 보내듯 결과물 단위로만 살펴봅니다. 개발 현장에서는 이 결과물 단위를 PR(풀 리퀘스트)이라 부릅니다 — "한 묶음의 변경 사항을 회사 본 코드에 합쳐 달라고 요청하는 단위"라고 이해하시면 됩니다.

Claude Code 데스크톱Claude Code Desktop Claude Code를 쓸 수 있는 세 번째 환경입니다. 그동안은 검은 화면에 글자만 입력해서 주고받는 방식(터미널)이나, 코드를 짜는 작업 화면(편집기) 안에서 썼는데, 이번에 일반 앱처럼 마우스로 누르고 옆 창을 보며 쓰는 — 전체 화면을 채우는 사용자 친화 화면이 추가됐습니다. Claude가 만들어 내는 결과물(예를 들어 만들고 있는 앱이 어떻게 생겼는지)을 옆에서 같이 보여 주고, 진행 중인 여러 작업을 화면 옆 막대에서 한눈에 살피게 해 주며, 그림이나 표 같은 시각 자료도 그 안에서 함께 확인할 수 있습니다. 내 컴퓨터에서 도는 작업과 멀리 떨어진 회사 서버에서 도는 작업을 한 화면에서 같이 본다는 점이 특징입니다.
Claude Agent SDK에이전트 SDK Claude Code가 쓰는 모든 사용 환경(편집기 안, 전체 화면 앱, 외부 서비스 연결)이 그 위에 올라가 있는 "토대 부품 묶음"입니다. 회사 밖 개발자들도 같은 토대 부품을 가져다 자기 회사용 도구를 만들 수 있다는 의미입니다.

도구 자체보다 더 의미 있는 것은 사용 규모의 사례였습니다. 쇼피파이는 엔지니어뿐 아니라 디자인·기획·데이터 직군까지 Claude Code를 일상 도구로 쓰고 있다고 소개됐고, 라틴아메리카 최대 e커머스 메르카도리브레는 엔지니어 23,000명 전원이 Claude Code 위에서 일하면서 50만 건이 넘는 PR을 사람 검수와 함께 검토했고, 9,000개 이상의 앱을 현대화했다고 합니다. 같은 회사의 기술 책임자 오스카 멀런은 올해 3분기까지 90% 자율 코딩과 완전 에이전트 주도 PR 루프를 목표로 잡고 있다고 합니다.

앤트로픽 자체도 같은 흐름입니다. Claude Code를 사내 전면 도입하고 나서 엔지니어 1인당 PR 생성량이 200% 증가했고, 그 와중에도 코드 품질 기준은 그대로 유지되고 있다는 발표가 있었습니다.

Claude Code를 잘 쓰는 회사들의 공통점은 한 가지입니다. 매니저와 임원이 다시 코드 베이스에 손을 대기 시작했다는 것. 로드맵과 리뷰만 보던 사람들이 다시 빌딩으로 돌아왔습니다.

05 / 자동화 층Routines — 깨어 있지 않아도 흐르는 일

마지막 블록은 보리스 셔니가 시연한 한 가지 개념에 모입니다. Routines. 발표자가 "내 코드의 상당량을 이제 내가 직접 지시문(프롬프트)을 입력해서 짜지 않는다. 내가 짜는 것은 그 지시문을 자동으로 던져 주는 루틴이다"라고 표현한 부분이 가장 정확한 정의입니다.

Routines루틴 Claude Code를 알아서 깨워 일을 시키는 자동 호출 규칙을 미리 등록해 두는 기능입니다. 깨우는 방법은 세 가지입니다. 첫째, 매일 오전 9시처럼 정해진 시간에 깨우는 방식. 둘째, 사내 게시판에 새 안건이 올라오거나 고객 문의가 들어오는 식의 외부 사건이 발생하면 그 신호를 받아 깨우는 방식. 셋째, 다른 프로그램이 "이거 좀 처리해 줘" 하고 부르면 거기에 맞춰 깨우는 방식입니다. 비개발자식 표현으로 옮기면, "퇴근 후에도 회사의 일이 자동으로 자기에게 도착하도록 정의해 두는 작업 흐름"입니다.
CI Autofix합치기 직전 자동 수정 동료가 짠 코드를 회사의 본 코드에 합치기 직전 단계에서 자동으로 발생하는 잡일을, Claude가 곁에서 대신 처리해 주는 루틴입니다. 본 코드에 합치기 전, 보통 자동 검사기가 한 번 돌아갑니다 — 잘 짜였는지, 보안 문제는 없는지, 다른 사람의 작업과 부딪히지 않는지를 살피는 자동 도구로, 업계에서는 이걸 CI라고 부릅니다. 이 검사 단계에서 검토자가 남긴 지적을 반영하거나, 잠깐 인터넷이 끊겨 검사가 멈춘 경우 다시 돌리거나, 보안 검토에서 지적된 부분을 수정하거나, 다른 사람의 작업과 부딪힌 부분을 자동으로 정리하는 일이 모두 여기에 포함됩니다. 시연에서는 인터넷이 잠시 끊겨 검사기가 "실패" 빨간불을 띄운 상태를, 루틴이 알아서 깨어나 "이건 인터넷 문제니까 한 번 더 돌려 보자"고 판단하고 "성공" 초록불로 바꿔놓는 모습이 공개됐습니다.
Claude Security코드 보안 자동 점검 밤사이 회사 코드 전체를 훑어 보안 약점을 찾아내고, 발견된 항목을 곧바로 Claude Code로 넘겨 수정 요청까지 띄워 두는 루틴 기반 도구입니다. "보안팀이 출시 속도를 따라잡기 어렵다"는 현장 피드백에서 출발했다고 발표자가 직접 설명했습니다.

그리고 모바일도 함께 짚어둘 만합니다. iOS와 안드로이드 Claude 앱 안에 Claude Code 원격 제어가 들어왔습니다. 노트북을 열고 균형을 잡으며 거리를 걷지 않아도, 공원에서도 작업을 던질 수 있다는 것이 발표자의 표현이었습니다.

06 / 닫는 말비개발자에게 남는 한 가지

키노트 전체를 한 문장으로 압축하면 이렇습니다. 이제 기본값이 바뀌었습니다. 발표자 보리스의 표현을 그대로 옮기면, "기본값은 더 이상 '내가 Claude Code에 프롬프트를 넣는다'가 아니라, '내가 Claude로 하여금 Claude Code에 프롬프트를 넣게 한다'입니다."

코드를 직접 짜지 않는 분들에게 이 변화는 어떻게 닿을까요. 두 가지로 정리할 수 있습니다.

하나는 업무 위임의 단위가 바뀝니다. 어제까지는 동료에게 "이 보고서 좀 정리해 줘"라고 부탁했다면, 이제는 "이 일이 들어올 때마다 Claude가 자동으로 정리해서 내 메일함에 넣어두도록 하는 루틴 한 개"를 만드는 일이 비교 대상이 됩니다. 한 번의 부탁이 한 번의 결과를 만들던 패러다임이, 한 번의 설계가 무한히 반복되는 결과를 만드는 패러다임으로 옮겨가고 있습니다. 이 옮겨감을 이해하고 본인의 업무 흐름에 적용하는 것이, 향후 1~2년 가장 큰 차이를 만드는 변수가 됩니다.

다른 하나는 책임의 무게가 더 분명해집니다. 에이전트가 한 번에 끝까지 일을 처리할수록, 그 결과를 검수하고 승인하는 사람의 자리는 더 무거워집니다. AI가 99.9%를 잘 해내도 0.1%의 오류는 반드시 발생하고, 그 0.1%에 책임을 지는 일은 외주화되지 않습니다. 키노트의 안젤라·케이틀린 발표가 거듭 강조했듯이, 검수와 승인의 자리에 있는 사람의 역할이 오히려 더 커진다는 의미입니다.

요약하면, AI가 더 잘하게 됐다는 사실보다, 그 잘함을 일상 업무 흐름에 어떻게 끼워 넣는지가 새로운 격차의 원천이라는 것이 이번 키노트의 핵심입니다. 발표자들이 거듭 짚은 표현으로 닫겠습니다. 모델은 지수곡선으로 좋아집니다. 우리 조직이 직선에 머물러 있을지, 같은 곡선 위에 올라탈지를 결정하는 것은, 더 이상 모델이 아니라 우리입니다.

출처 · 본 글은 앤트로픽이 2026년 5월 진행한 개발자 컨퍼런스 Code with Claude의 오프닝 키노트 자동 전사 자료를 바탕으로 합니다. 발표는 앤트로픽 최고제품책임자(CPO)의 오프닝, 리서치 PM 다이앤의 모델 발표, 클라우드 플랫폼 팀(케이틀린·안젤라)의 Managed Agents 발표, Claude Code 팀(안젤라·보리스 셔니·캣)의 도구·루틴 시연 순으로 이어졌습니다. CDSA 편집팀이 한국어 비개발자 독자 관점에서 용어 풀이 중심으로 재구성했으며, 발표 시연 시 사용된 가상 회사 이름(Lumara, AcmePay)과 인용된 고객 사례(Stripe, Binti, Eve Legal, Notion, Shopify, MercadoLibre, Rakuten, Intuit, AMP)는 키노트에서 발화된 그대로 옮겼습니다. 자동 전사 자료의 한국어 전체 전사록은 별도 글로 함께 올렸습니다.