코드가 사라진 자리에
무엇이 들어오는가
테슬라 전 AI 책임자 안드레이 카파시의 최근 인터뷰 여러 편을 엮었습니다. 소프트웨어 3.0, 들쭉날쭉한 지능, 유령이라는 비유, 바이브 코딩과 에이전틱 엔지니어링, 채용 방식의 전환, 싱킹과 이해의 구분, 오토 리서치, 그리고 지능이라는 기적까지 — 여덟 가지 통찰을 비전공자 어휘로 옮깁니다.
안드레이 카파시라는 이름을 처음 듣는 분도 계실 겁니다. 슬로바키아에서 태어나 캐나다에서 자랐고, 스탠퍼드에서 컴퓨터 비전으로 박사를 받았고, 오픈AI 초기 멤버로 GPT-2를 만들었고, 테슬라로 건너가 오토파일럿의 AI를 총괄했고, 다시 오픈AI로 돌아갔다가 2024년에 독립해 자신의 AI 교육 회사를 세운 사람입니다. AI를 직접 만들어 본 경험과, 그것을 누구에게나 알아듣게 설명하는 언어 감각을 동시에 가진 드문 사람이라고 할 수 있습니다. 최근 한 달 사이에 여러 편의 인터뷰와 강연이 쏟아졌는데, 거기서 반복적으로 등장하는 생각들이 눈에 들어왔습니다. 비전공자가 읽어도 남는 것이 있는 통찰이라 판단해 정리합니다.
012023년 12월, AI 코딩 능력이 급변했다
카파시는 AI 코딩 능력에 뚜렷한 분기점이 있었다고 말합니다. 2023년 12월입니다. 그 이전에는 AI가 생성한 코드를 사람이 직접 수정해야 하는 경우가 많았습니다. 코드의 70퍼센트를 AI가 쓰면 나머지 30퍼센트를 사람이 고치는 식이었습니다. 그런데 12월을 기점으로 AI가 완벽한 코드 뭉치를 통째로 생성하기 시작했고, 수정할 필요가 거의 사라졌습니다. 카파시 본인의 표현을 빌리면, 코드를 마지막으로 직접 수정한 게 언제인지 기억이 안 날 정도라고 합니다.
단순히 자동완성이 좋아진 수준이 아닙니다. 그 시점부터 AI는 리서치, 계획 수립, 코드 작성, 테스트, 디버깅이라는 일련의 과정을 하나의 일관된 흐름으로 처리하는 에이전트적 워크플로우가 가능해졌습니다. AI가 단순한 도우미에서 자율적인 작업 수행자로 올라선 겁니다.
이 이야기를 꺼내는 이유가 있습니다. 카파시는 2022년 ChatGPT 수준에서 AI 코딩을 경험하고 "별로"라고 결론 내린 사람들이 아직 많다고 봅니다. 그 결론은 2023년 12월 이전의 판단이고, 그 이후에 AI 코딩 능력이 근본적으로 달라졌으니 다시 확인해 봐야 한다는 것입니다.
02소프트웨어 3.0 — 프롬프트가 프로그래밍이 된다
카파시는 소프트웨어의 역사를 세 겹으로 나눕니다. 소프트웨어 1.0은 사람이 직접 규칙과 코드를 작성하는 전통적인 프로그래밍입니다. OS별 환경에 맞춰 복잡한 배시 스크립트를 짜는 것이 여기에 해당합니다. 소프트웨어 2.0은 데이터셋을 만들고 모델 아키텍처를 설계해서 신경망을 훈련시키는 것 자체가 프로그래밍이 되는 방식입니다. 사람이 코드를 일일이 짜는 대신, 방대한 데이터를 통해 신경망이 스스로 가중치를 학습합니다.
핵심은 세 번째입니다. 소프트웨어 3.0에서는 LLM 자체가 하나의 거대한 컴퓨터가 되고, 프롬프트를 작성하는 것이 곧 프로그래밍이 됩니다. 컨텍스트 윈도우에 무엇을 넣느냐가 이 거대한 컴퓨터를 조정하는 핵심 레버입니다.
그는 두 가지 사례를 듭니다. 첫째, OpenClaw 설치. OS별로 다른 복잡한 스크립트를 짜는 대신, 설치 안내 텍스트를 에이전트에 붙여 넣으면 AI가 현재 환경을 파악하고 스스로 디버깅하며 설치를 완료합니다. 둘째, 메뉴젠이라는 앱. 식당 메뉴판 사진을 찍으면 OCR로 항목을 추출하고 이미지 생성기로 음식 사진을 만들어 보여주는 앱인데, 이걸 만들기 위해 여러 API를 연동하고 후처리 코드를 짜느라 상당한 작업이 필요했습니다. 소프트웨어 3.0 방식으로는 메뉴 사진을 AI에 넘기면서 "음식 사진을 위에 얹어줘" 한 줄이면 끝납니다. 앱 자체가 불필요해집니다. 코드가 사라진 자리에 신경망이 직접 들어가는 겁니다.
소프트웨어 3.0은 기존 패러다임의 속도 향상이 아니라, 이전에는 불가능했던 것이 가능해진 것이다. 새로운 앱을 기획할 때 가장 먼저 던져야 할 질문이 있다. "이 앱이 신경망 한 번 호출로 되는 것은 아닌가?"
더 먼 미래에 대해서도 그림을 그립니다. 카파시는 이것을 신경 컴퓨터라 부릅니다. 극단적으로는 기기가 카메라와 마이크에서 들어오는 원시 신호를 신경망에 직접 넣고, 화면에 보여줄 UI까지도 그 순간에 디퓨전으로 렌더링하는 세계를 상상합니다. 1950~60년대에는 컴퓨터가 계산기형이 될지 신경망형이 될지 불분명했으나 결국 계산기 경로를 택했고, 현재 신경망은 계산기형 컴퓨터 위에서 가상화되어 돌아가고 있습니다. 카파시는 이 관계가 뒤집힐 수 있다고 봅니다. 신경망이 호스트 프로세스가 되고, CPU는 코프로세서로 격하되는 구조입니다. 물론 한꺼번에 일어날 변화는 아닙니다. 하지만 지금 짜는 코드의 상당 부분이 5년에서 10년 안에 신경망으로 흡수될 수 있다는 것이 그의 판단입니다.
03들쭉날쭉한 지능 — 수학과 코딩은 잘하는데 상식은 틀린다
카파시가 반복적으로 강조하는 개념이 있습니다. 들쭉날쭉한 지능, 영어로는 Jagged Intelligence. AI가 어떤 영역에서는 인간 천재 수준의 능력을 보여주다가, 바로 옆 영역에서는 초등학생도 안 할 실수를 저지르는 현상입니다.
왜 이런 일이 벌어지는지를 그는 훈련 방식으로 설명합니다. LLM은 강화 학습 환경에서 답이 맞으면 보상을 주고 틀리면 감점하는 방식으로 훈련됩니다. 그래서 답이 맞는지 채점할 수 있는 영역에서 강력한 성능을 발휘합니다. 수학은 답이 정해져 있으니 채점이 됩니다. 코딩도 컴파일 여부, 테스트 통과 여부로 채점이 됩니다. 문제는 채점이 안 되는 영역입니다.
황당한 사례들이 있습니다. 과거 GPT는 'strawberry'에 'r'이 몇 개 있는지 세지 못했습니다. 10만 줄짜리 코드를 리팩토링하고 제로데이 보안 취약점을 찾아내는 AI가, 50미터 거리의 드라이브스루 세차장에 "걸어서 가세요"라고 답합니다. ChatGPT에게 농담을 해달라고 하면 5년 전과 똑같은 농담 서너 개를 돌려쓰고, 아무리 다른 농담을 요청해도 레퍼토리가 늘지 않습니다. 농담의 재미를 자동으로 채점할 방법이 없으니, 강화 학습 환경 바깥에 놓인 영역인 겁니다.
AI의 능력은 훈련 데이터에 무엇을 넣고 어떤 강화 학습 환경을 만드느냐에 따라 크게 좌우됩니다. 예를 들어 GPT-3.5에서 GPT-4로 갈 때 체스 능력이 눈에 띄게 향상된 것은 체스 데이터가 프리트레이닝에 대량으로 추가되었기 때문입니다. 모델이 "똑똑해져서"가 아니라 데이터가 들어가서 그렇습니다. 따라서 AI 모델에는 매뉴얼이 없습니다. 사용자가 직접 탐험해서 이 AI가 어떤 회로 안에 들어와 있는지, 어디서 잘하고 어디서 못 하는지를 알아내야 합니다.
04AI는 동물이 아니라 유령이다
들쭉날쭉한 지능 이야기와 이어지는 비유가 있습니다. 카파시는 AI를 동물에 비유하는 습관을 버려야 한다고 말합니다. 우리가 흔히 생각하는 동물 지능 — 강아지, 고양이, 사람 — 은 진화의 산물입니다. 수억 년에 걸쳐 생존 본능, 호기심, 재미를 느끼는 능력이 DNA에 새겨진 존재들입니다. LLM은 그런 것이 전혀 없습니다. 진화의 산물이 아니라 데이터와 보상 함수로 빚어진 통계적 시뮬레이션입니다.
우리는 동물을 만드는 게 아닙니다. 유령 혹은 정령이라고 불러야 할 존재들을 만들고 있는 겁니다. 안드레이 카파시
동물은 생존 본능을 갖고 태어나지만, AI 유령들은 아무런 본능도 없는 백지 상태에서 시작합니다. 인터넷이라는 거대한 디지털 공간에 인간이 남긴 희미한 흔적들을 모방해서 훈련된 존재입니다. 그래서 AI에게 소리를 지르거나 사정해도 결과가 나아지지 않습니다. "제발 잘 좀 해줘"라고 쓴다고 정확도가 올라가지 않고, "화가 난다"고 쓴다고 주눅 들지 않습니다. 감정적 반응에 영향을 받는 존재가 아니기 때문입니다. 반면에 "하지 마"와 같은 명확한 금지 지시에는 잘 따르는 경향이 있다고 합니다.
이 구분을 받아들이면 AI를 다루는 태도가 달라집니다. 동물을 대하듯 감정으로 접근하는 대신, 어떤 회로가 작동하고 어떤 회로가 꺼져 있는지를 냉정하게 탐색하는 태도로 바뀝니다.
05바이브 코딩과 에이전틱 엔지니어링 — 누구나 만들 수 있게 되었지만, 잘 만드는 건 다른 문제다
카파시는 AI 시대의 코딩을 두 겹으로 나눕니다. 바이브 코딩과 에이전틱 엔지니어링입니다.
바이브 코딩은 모두를 위한 창작의 바닥을 높이는 것입니다. 코딩을 못 하던 사람도 AI에게 대략적인 느낌만 말해도 앱을 만들 수 있게 됩니다. 에이전틱 엔지니어링은 다릅니다. 기존 전문 소프트웨어의 품질 기준을 유지하면서 더 빠르게 개발하는 것을 목표로 합니다. 변덕스러운 AI 에이전트들을 통제하고, 보안 취약점 발생을 완벽하게 차단하고, 수많은 에이전트를 조율해서 기술의 천장을 높이는 것이 에이전틱 엔지니어의 역할입니다. 책임은 여전히 인간에게 있으며, 책임 있는 엔지니어링 절차를 따라야 합니다.
과거에는 10배의 생산성을 내는 '10배 엔지니어'라는 말이 있었는데, 카파시는 에이전트를 잘 다루는 사람이 1000배 엔지니어가 될 수 있다는 톤으로 이야기합니다.
채용 방식도 바뀌어야 한다고 봅니다. 대부분의 회사가 아직 에이전트 시대에 맞는 채용 방식을 리팩토링하지 못했다는 것이 그의 지적입니다. 알고리즘 문제 풀이 같은 옛날 패러다임의 퍼즐 풀기 인터뷰는 더 이상 유효하지 않습니다. 카파시가 제안하는 방식은 이렇습니다. 후보자에게 트위터 클론 같은 대규모 프로젝트를 안전하고 빠르게 구축하도록 시킵니다. 그 다음 구축된 시스템에 10개의 AI 에이전트를 공격수로 투입해서 해킹을 시도하게 하고, 이를 방어하는 능력을 평가합니다. 손으로 알고리즘을 푸는 능력보다, 에이전트와 협업해서 큰 시스템을 안전하게 빌드하는 능력이 중요해졌다는 뜻입니다.
평범한 사용자와 AI 네이티브 사용자의 격차도 커지고 있습니다. 과거에는 빔이나 VS 코드 단축키 활용 능력이 개발자의 생산성을 갈랐는데, 이제는 클로드 코드나 코덱스 같은 AI 도구의 활용 능력이 새로운 격차를 만들고 있습니다. AI 도구에서 최대한의 기능을 활용하고, 본인의 셋업에 투자하는 것이 차이를 만든다고 카파시는 강조합니다.
06싱킹은 외주할 수 있지만, 이해는 외주할 수 없다
카파시가 AI 시대의 인간 역할에 대해 가장 깊이 있는 이야기를 하는 부분입니다.
AI 에이전트를 그는 "기억력은 완벽하지만 취향과 센스는 제로인 강력한 인턴"에 비유합니다. 복잡한 라이브러리의 API 문법을 완벽하게 기억하지만, 효율적인 구조나 우아한 사용자 경험에 대한 판단력은 없습니다. 깐깐한 아키텍처 설계, 엄격한 감독, 디자인 감각, 논리 검증은 여전히 인간의 몫입니다. 인간이 상위 카테고리의 전체 감독을 맡고, 에이전트가 세부 사항을 채우는 구조가 되어야 합니다.
실제로 벌어진 사례가 있습니다. 메뉴젠이라는 앱의 결제 시스템을 AI 에이전트에게 맡겼더니, 결제 계정과 로그인 계정을 이메일 주소가 같다는 이유만으로 자동 연동해 버렸습니다. 보안상 위험한 실수입니다. AI는 논리적 고민 없이 표면적인 데이터만 엮는 경향을 보여줍니다. 올바른 뼈대를 잡고 논리를 검증하는 것은 인간만이 할 수 있습니다. 파이토치와 넘파이의 API 디테일은 AI가 기억할 수 있지만, 텐서의 스토리지 구조나 메모리 효율성 같은 시스템 모델에 대한 이해는 여전히 인간의 영역입니다.
그리고 여기서 카파시가 가장 중요한 구분을 제시합니다. 싱킹과 언더스탠딩의 차이입니다.
싱킹은 아웃소싱할 수 있지만, 언더스탠딩은 아웃소싱할 수 없다.
싱킹, 즉 사고는 정보를 분석하고 결론에 도달하는 처리 작업입니다. AI가 잘합니다. 언더스탠딩, 즉 이해는 정보가 뇌에 들어와서 이미 알고 있던 것들과 연결되고, 그 연결에서 깨달음이 생기는 과정입니다. 이것은 외주할 수 없습니다. AI가 아무리 기계적인 정보 처리를 대신해도, 무엇을 왜 만들고 있는지 그 본질을 이해하는 주체는 반드시 인간 자신이어야 합니다. 기술이 발전할수록 AI에게 올바른 지시를 내리기 위한 인간의 깊은 통찰력과 이해력이 전체 시스템의 질을 결정하는 가장 궁극적인 병목이 됩니다.
07AI가 스스로 진화하는 법 — 데이터 붕괴, 문화, 오토 리서치
카파시는 현재 LLM의 근본적인 한계를 두 갈래로 짚습니다.
첫째는 성찰의 부재입니다. 인간은 책을 읽을 때 단순히 정보를 받아들이는 것이 아니라, 읽으면서 동시에 성찰하고 되새김질하며 자기 안에서 새로운 생각을 합성합니다. 책이 지식을 나열한 설명서가 아니라 뇌를 자극해서 스스로 합성 데이터를 생성하는 프롬프트로 작동하는 겁니다. 현재 LLM에는 이 성찰과 통합 과정이 전무합니다. 실제로 생각을 하지 않습니다.
둘째는 데이터 붕괴 문제입니다. AI가 스스로 데이터를 생성해서 다시 훈련하면 모델 성능이 나빠집니다. 생성된 데이터는 겉보기엔 멀쩡해 보여도, 가능한 생각의 전체 공간에서 아주 좁은 영역만 차지하게 되어 다양성이 죽어버립니다. ChatGPT에게 농담을 해달라고 하면 고작 세 개 정도만 반복하는 것이 대표적 증상입니다. 인간은 풍요로운 다양성과 높은 엔트로피를 갖지만, AI는 그렇지 못합니다. 붕괴를 막으면서 인간 같은 엔트로피를 가진 합성 데이터를 만드는 방법을 찾는 것이 해결 과제입니다.
이 한계를 넘기 위해 카파시가 주목하는 방향이 세 가지 있습니다.
첫째, AI 간의 문화 형성입니다. 현재 LLM은 진정한 문화를 가지고 있지 않습니다. 미래에는 AI 에이전트들이 서로를 위해 책을 쓰고, 지식을 기록하고 공유하며, 집단적으로 지식 레퍼토리를 축적하는 문화가 형성될 수 있습니다. 단순히 혼자 배우는 것을 넘어, AI끼리 서로 영향을 주고받는 과정입니다.
둘째, 경쟁을 통한 자기 개선입니다. 알파고가 자기 자신과 끊임없이 대국하며 인간의 한계를 넘어선 것처럼, AI 간의 치열한 경쟁은 지능과 발전을 가속화하는 강력한 방법입니다. 현재 LLM에는 이 스스로 플레이하는 메커니즘이 없습니다. 미래에는 선생 LLM이 학생 LLM을 위해 점점 더 어려운 문제를 만들어 제공하는 자동 커리큘럼이 가능해질 것이라고 봅니다. 인간 데이터의 한계를 넘어서기 위한 필수적인 자기 개선 루프입니다.
셋째, 오토 리서치입니다. AI 에이전트의 능력을 AI 자기 자신에게 적용해서 스스로를 개선하게 만드는 방법입니다. 인간의 시간과 판단력이라는 병목을 시스템에서 제거하는 것이 목표입니다. 인간이 연구를 위한 판만 깔아주고 목표를 알려준 뒤 시작 버튼을 누르면, AI가 스스로 수만 가지 실험을 하며 더 나은 방법을 찾아냅니다. 카파시는 직접 실험한 결과를 밝힙니다. 하룻밤 만에 자신의 20년 경력으로도 놓쳤던 코드 최적화 방법을 AI가 찾아냈다고 합니다.
더 나아가 분산형 오토 리서치도 이야기합니다. 인터넷상의 신뢰할 수 없는 작업자 풀을 활용하는 방식입니다. SETI@Home이나 Folding@Home처럼, 비용이 많이 드는 생성 작업을 분산하고 저렴한 검증 작업으로 신뢰성을 확보하는 구조입니다. 궁극적으로 인터넷상의 에이전트 무리가 LLM을 개선하고 프론티어 연구소를 능가할 수도 있으며, 이런 시스템에서는 컴퓨팅 자원 자체가 부의 척도가 될 수 있다고 봅니다.
08고등 지능은 왜 희귀한가 — 박테리아 20억 년, 까마귀의 한계, 인간의 손과 불
마지막 풍경은 가장 넓은 시야에서 바라본 이야기입니다. 카파시는 고등 지능의 탄생이 매우 희귀한 사건이라고 생각합니다. 닉 레인의 분석을 인용하면서, 지구와 비슷한 환경의 행성 1000개가 있다면 대부분은 박테리아 같은 초기 생명체만 존재할 것이라고 말합니다. 단순 세포에서 복잡한 진핵 생물로 넘어가는 것 자체가 확률적으로 매우 어려운 일이었습니다.
박테리아는 20억 년 동안 존재했지만 아무 일도 없었습니다. 생화학적 다양성은 있었으나 동물로 성장하지 못하는 거대한 병목 현상이 있었습니다. 다세포 동물이 출현한 것도 지구 역사에서 짧은 기간이지만, 단순한 동물을 넘어 문화를 만들고 지식을 창조해 다음 세대로 축적하는 존재가 나타난 것은 여전히 놀랍습니다.
흥미로운 것은 지능이 한 번만 출현한 것이 아니라는 점입니다. 까마귀 같은 조류도 지능을 가지고 있으며, 뇌 구조가 인간과 뚜렷하게 다릅니다. 지능이 진화 과정에서 여러 번 독립적으로 출현했을 가능성을 시사합니다. 하지만 새들은 뇌를 키우면 비행에 불리해지는 물리적 한계에 부딪혔습니다. 하드웨어의 부재가 병목이었습니다.
인간의 지능 폭발에는 두 가지 우연이 겹쳤습니다. 도구 사용에 유리한 '손'이라는 하드웨어, 그리고 불을 이용한 소화의 외주화. 불로 음식을 익히면서 소화에 들어가는 에너지를 아끼고 그 에너지를 뇌로 보낼 수 있었습니다. 돌고래는 똑똑하지만 도구가 없어 문명을 만들기 어렵고, 물속에서는 불을 피우기 어려워 화학적으로 할 수 있는 일의 범위가 육지보다 좁습니다.
카파시는 이 모든 이야기를 한 문장으로 수렴시킵니다. 지능을 택한 진화 자체가 기적이며, 우리는 지금 그 기적의 두 번째 판을 인공적으로 만들고 있는 것이라고.
정리하며여덟 가지 통찰을 관통하는 하나의 메시지
카파시의 인터뷰를 관통하는 메시지는 결국 하나입니다. AI 시대에 가장 중요한 것은 도구를 잘 쓰는 기술이 아니라, 무엇을 왜 만들고 있는지에 대한 깊은 이해라는 것.
코드가 사라지는 자리에 신경망이 들어오고 있습니다. 하지만 그 신경망은 한쪽에서는 천재이면서 다른 쪽에서는 어처구니없는, 들쭉날쭉한 지능을 가지고 있습니다. 동물처럼 감정으로 다루면 안 되고, 회로를 냉정하게 탐색해야 합니다. 누구나 만들 수 있는 시대가 왔지만, 잘 만드는 것은 여전히 다른 문제이고, 채용 방식까지 이 변화를 따라가야 합니다. 정보 처리는 외주할 수 있지만 이해는 외주할 수 없으며, 기술이 강해질수록 오히려 인간의 이해력이 전체 시스템의 질을 결정하는 병목이 됩니다. AI가 스스로를 개선하는 오토 리서치가 현실이 되고 있고, 그 너머에서는 인류가 지능이라는 기적을 인공적으로 재현하려는 시도가 진행 중입니다.
카파시가 그린 것은 지도입니다. 남은 질문은 골목길입니다.
카파시가 이해는 외주할 수 없다고 말할 때, 우리가 150여 기관의 현장에서 매일 마주하는 장면이 떠오릅니다. 도구는 이미 있는데, "이걸 우리 업무에 왜, 어디에 쓰는가"를 판단하지 못해 멈춰 있는 조직들. AI 리터러시 교육이든 바이브 코딩 실습이든, 우리가 현장에서 하는 일의 본질은 결국 그 이해를 심는 것이었고, 카파시의 언어를 빌리자면 궁극적 병목을 한 조직씩 풀어가는 일입니다.
카파시는 소프트웨어 3.0이라는 고속도로를 그렸습니다. 하지만 고속도로가 깔려도 공문 하나 쓰는 데 반나절, 엑셀 정리에 매주 반복되는 야근 같은 골목길의 비효율은 저절로 바뀌지 않습니다. 대규모 시스템의 손이 닿지 않는 그 미시적 문제들을, 현장의 사람이 AI 도구를 직접 조합해 해결하는 것 — 그것이 우리가 교육이라는 이름으로 하고 있는 일의 실체입니다.
들쭉날쭉한 지능의 지도를 그리고, 유령의 회로를 탐색하고, AI가 잘하는 일과 인간이 남겨야 할 판단을 정확히 짚어내는 것. 카파시가 이론으로 정리한 이 과제를, 우리는 공공기관 회의실과 대기업 연수원에서 매일 실전으로 풀고 있습니다.
이 글은 안드레이 카파시(Andrej Karpathy)의 2026년 4~5월 공개 인터뷰 및 강연 여러 편의 핵심 논점을 CDSA 편집팀이 재구성한 큐레이션입니다. 특정 인터뷰 한 편의 번역이 아니라, 여러 출처에서 반복적으로 등장한 주제를 엮어 정리했습니다.