---
title: '마지막으로 코드를 진지하게 읽은 게 언제인가'
tags:
  - ai
  - essay
  - software-engineering
  - learning
  - future-of-work
published: true
date: 2026-06-21 11:00:00
description: '판단을 비싸게 만든 마찰이, 동시에 판단을 못 배우게 만든다. AI 시대에 가장 비싸지는 능력이 가장 덜 길러지는 이유'
series: 'AI 시대의 판단'
seriesOrder: 3
thumbnail: /thumbnails/2026/06/learning-what-ai-cant-do.png
---

## 신호가 꺼진다

마지막으로 코드를 진지하게 읽은 게 언제인가. 여기서 "진지하게" 라는 건 줄을 눈으로 훑었다는 뜻이 아니다. 이게 왜 이렇게 짜였는지, 여기서 뭐가 깨질 수 있는지, 이 코드가 주장하는 내용이 옳은지를 끝까지 따라가 본 것 말이다.

이 질문을 나한테 던지는 게 아니다, 라고 쓰려다 멈칫한다. 나는 여전히 읽는다. 정확히는 읽으려고 노력한다가 맞을 것이다. 다만 솔직히, 그 읽기가 요즘은 가끔 희미해진다. diff를 열고 테스트가 초록불인 걸 확인하는 순간 끝까지 따라가려던 집중이 슬그머니 풀리는 날이 있다. 그래도 대체로는 읽는다. 그러니 이 질문은 나보다 먼저, 요즘 코드를 짜는, 정확히는 코드를 짜라고 시키는 사람들을 향한다. 그런데 솔직히, 이 질문을 남들에게 던질 수 있는 안전한 자리에 내가 앉아 있다는 게 마음에 걸린다. 그리고 이건 한가한 질문이 아니다. 코드를 진지하게 읽어야 할 *이유*가 사방에서 빠지고 있어서다.

먼저 생산이 사람 손을 떠났다. Microsoft도 Google도 새 코드의 30% 안팎을 AI가 쓴다고 [말한다](https://www.itpro.com/software/development/developers-will-need-to-adapt-microsoft-ceo-satya-nadella-joins-googles-sundar-pichai-in-revealing-the-scale-of-ai-generated-code-at-the-tech-giants-and-its-a-stark-warning-for-software-developers). 어떻게 셌는지는 회사마다 흐릿하지만 방향은 분명하다.

그 다음 평가가 형식이 됐다. 코드 리뷰는 점점 diff를 열고 테스트가 초록불인지 확인하고 큰 그림에서 어긋난 게 없으면 승인하는 절차로 수렴한다. 줄 단위로 끝까지 읽는 건 뭔가 정말로 진하게 냄새가 날 때뿐이고, 그 빈도는 AI의 성능이 좋아질수록 줄어든다.

마지막으로 면접도 점차 코드를 비켜 간다. 면접관으로 앉았을 때, 우리가 지원자에게 물은 건 자료구조도 그가 직접 짠 코드도 아니었다. AI를 어떻게 쓰는지, 에이전트가 틀렸을 때 어떻게 알아채는지, 어디까지 맡기고 어디서 멈추는지였다.

세 장면을 따로 보면 각자 합리적이다. 코드를 _평가하던_ 자리(리뷰)와 코더를 _선발하던_ 자리(면접)가, 같은 시기에, 약속이라도 한 듯 코드를 깊이 안 본다. 코드를 만드는 일에서 사람이 물러나는 것까지는 그렇다 치자. 문제는 코드를 _판단하는_ 신호마저 같이 꺼지고 있다는 것이다.

그리고 하필, 꺼지고 있는 그 능력(무엇이 맞는지, 어디서 의심해야 하는지를 아는 판단)이 점점 더 비싸지는 바로 그 능력이다. [코드를 읽는 일](https://yceffort.kr/2026/06/do-you-need-to-read-code)과 [직군 경계](https://yceffort.kr/2026/06/when-job-titles-blur)를 두고 쓴 지난 두 글에서 나는 그렇게 썼다. 만드는 일은 흔해지고, 판단과 책임은 남고 오히려 비싸진다고. 이 글은 그 두 글의 어두운 거울이다. 더 비싸지는 그 능력이, 동시에 점점 덜 길러진다. 그리고 이건 누가 게을러졌다는 얘기가 아니다. 배울 필요가 사라졌다는 얘기다.

## 사라짐은 기분 탓이 아니다

여기까지는 생산과 평가가 사람 손을 떠난다는 얘기다. 그건 받아들이기 쉽다. 어려운 주장은 그다음이다. 그 과정에서 사람의 *능력*과 *학습*까지 깎여 나간다는 것이다. 이건 인상만으로는 약하다. "예전 사람이 새 도구 앞에서 엄살 부린다"로 치우면 그만이니까. 그 의심은 정당하다. 어셈블리를 손으로 짜는 사람은 이제 거의 없지만 소프트웨어는 망하지 않았다. 플라톤은 문자가 기억을 망친다고 했지만(Phaedrus), 우리는 글자 덕에 더 멀리 생각하게 됐다. 새 도구가 옛 능력을 지운다는 불평은 매번 나왔고 매번 틀렸다. 사전 확률부터가 이 글에 불리하다.

그래도 이게 기분 탓이 아니라는 증거가 있다. 많지는 않지만.

METR가 2025년에 숙련된 오픈소스 개발자들을 무작위 배정해 측정한 [실험](https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/)이 있다. AI를 쓴 작업이 안 쓴 작업보다 평균 19% _느렸다_. 그런데 같은 개발자들은 AI 덕에 20% *빨라졌다*고 느꼈다. 체감과 실측이 통째로 뒤집혀 있다. 이 역전이 왜 일어나는지는 다음 절에서 다시 본다. 그게 이 글의 핵심에 닿아 있다.

Shen과 Tamkin이 2026년에 낸 [연구](https://arxiv.org/abs/2601.20245)는 다른 각도다. 개발자들이 새 비동기 라이브러리를 익히는 과정을 AI 도움 유무로 나눠 봤더니, AI를 쓴 쪽은 개념 이해도, 코드 읽기도, 디버깅 능력도 덜 길러졌다. 그러면서 평균적으로 유의미한 효율 이득도 없었다. 일을 하면서도 학습은 일어나지 않았다는 것이다.

코드 자체에도 흔적이 남는다. GitClear가 2020–2024년에 걸쳐 2억 1천만 줄을 분석한 [보고서](https://www.gitclear.com/ai_assistant_code_quality_2025_research)에서, 복사-붙여넣기 줄의 비율은 8.3%에서 12.3%로 늘고, 리팩토링으로 옮겨진 코드의 비율은 2021년 25%에서 2024년 10% 아래로 떨어졌다. 갈아엎고 다듬는 일은 줄고, 찍어내고 복제하는 일이 늘었다. 이해를 쌓는 쪽이 아니라 출력을 쌓는 쪽으로.

여기서 선을 하나 긋자. AI가 사람의 능력을 깎는다는 말은 자칫 오래된 자본주의 비판처럼 들리기 쉽다. 생산성이 올라 생긴 이득은 일하는 사람이 아니라 자본이 가져가고, 한때 숙련공이 통째로 하던 일은 잘게 쪼개져 아무나 할 수 있는 단순 작업으로 분해된다. 이런 탈숙련(deskilling) 논의는 Braverman이 *Labor and Monopoly Capital*에서 정리한 게 1974년이니, 벌써 50년 된 이야기다. "기술이 숙련을 깎는다"는 명제 자체는 전혀 새롭지 않다는 뜻이다. 내가 하려는 말은 그 일반론이 아니다.

"다들 안 배운다"는 일반화도 하지 않겠다. 그건 틀렸다. 어느 시대에나 끝까지 파고드는 1%는 있었고 지금도 있다. 안 배우는 사람도 늘 있었다. 변한 건 양 끝이 아니라 가운데다. median을 떠받치던 무언가가 빠졌다. 1%의 호기심도, 게으른 사람의 핑계도 아니라, 중간에 있는 대부분을 억지로라도 배우게 만들던 그 무언가. 그게 뭔지가 다음 절이다.

## 양날

판단이 뭔지부터 좁히자. 거창한 게 아니다. 이 추상이 옳은지, 이 코드가 어디서 깨질지, 무엇을 검증해야 하고 어디를 의심해야 하는지를 아는 것. AI가 대신 책임져 주지 않는 것. 코드를 *생산*하는 일은 에이전트가 가져갔지만, 생산물이 맞는지 *판단*하는 일은 여전히 사람에게 남아 있다. 지난 글의 결론이 거기였다.

문제는 그 판단이 어디서 왔느냐다. 나는 그걸 책에서 배우지 않았다. 직접 짓고, 부수고, 디버깅하면서 배웠다. 잘못된 추상을 세웠다가 몇 주 뒤에 무너지는 걸 보면서, 한 줄을 못 찾아 새벽까지 로그를 들여다보면서, "이쯤이면 되겠지" 하고 넘긴 게 프로덕션에서 터지는 걸 겪으면서 배웠다. 막히고, 헤매고, 고생한 시간이 곧 학습이었다. 편하게 넘어간 건 남지 않았다.

이건 내 감상이 아니라 학습과학이 못 박은 사실이다. Robert Bjork가 desirable difficulties(바람직한 어려움)라고 부른 것이다. 학습을 _느리고 힘들게_ 만드는 조건이, 역설적으로 _오래 가는_ 학습을 만든다. 막힘 없이 술술 넘어간 정보는 그 순간엔 잘 아는 것 같지만 금세 증발한다. 더듬거리며 어렵게 꺼낸 것이 남는다. 고생이 비용이 아니라 메커니즘이다.

여기서 양날이 보인다.

판단을 _비싸게_ 만든 그 성질(마찰, 고생, 막힘, 느림)이 정확히 판단을 _길러 주던_ 성질이다. 둘은 다른 두 가지가 아니라 같은 한 가지의 두 날이다. 마찰이 있어서 희소하고, 마찰이 있어서 길러졌다. 비싸다는 것과 배워진다는 것이 같은 뿌리에서 나온다.

그리고 AI가 없애는 게 정확히 그 마찰이다.

AI는 막힘을 없앤다. 잘못된 추상을 세워 보기 전에 맞는 걸 건네고, 새벽까지 로그를 뒤지기 전에 버그를 고쳐 준다. 도구로서 이건 훌륭하다. 비용을 없애니까. 그런데 그 비용이 곧 학습의 메커니즘이었다. 마찰을 없애는 순간, 판단이 비싸지는 것과 판단이 안 길러지는 것이 동시에 일어난다. 두 개의 별도 문제가 아니라 한 원인의 두 결과다. 한쪽은 판단을 희소하게(비싸게) 만들고, 다른 쪽은 못 배우게(안 길러지게) 만든다. 같은 마찰을 없앤 데서 둘 다 나온다.

이제 METR의 역전으로 돌아가자. AI를 쓴 개발자가 19% 느려지고도 20% 빨라졌다고 느낀 그 미스터리.

그건 미스터리가 아니라 예상된 결과다. Bjork의 같은 연구 줄기에 fluency illusion(유창성 착각)이라는 게 있다. 어떤 정보가 매끄럽게 술술 처리되면, 그 수월함 자체를 "내가 이해했다"는 신호로 착각하는 현상이다. 교과서를 반복해 읽으면 눈에 익어 다 아는 것 같지만 막상 떠올리려 하면 안 나오는, 그 익숙함과 실력의 혼동이다. AI가 내놓는 코드는 매끄럽다. 술술 읽히고, 그럴듯하고, 막힘이 없다. 그 유창함(fluency)을 우리는 이해로 오독한다. 그리고 힘이 덜 든 것을 일이 잘되는 증거로 오독한다. 막힘이 사라졌으니 빨라졌다고 느끼는데, 정작 그 막힘이야말로 내가 뭘 모르는지를 알려 주던 신호였다. 신호가 꺼졌으니 모른다는 사실조차 모른다. Microsoft와 CMU가 지식노동자 319명을 조사한 [연구](https://dl.acm.org/doi/full/10.1145/3706598.3713778)는 이걸 측정으로 잡아냈다. AI를 더 신뢰할수록 비판적 사고를 덜 했고, 자기 자신을 더 신뢰할수록 더 했다. 유창함을 믿는 만큼 판단을 내려놓는다는 뜻이다. 체감이 실측을 19%나 앞지르는 건 그래서다. 마찰이 사라지면 일이 빨라진 것 같은 *느낌*이 먼저 오고, 능력은 조용히 뒤처진다.

## 필요는 왜 빠져나갔나

여기까지는 능력 얘기다. 마찰이 사라지면 능력이 안 길러진다. 그런데 더 무서운 건 동기 쪽이다. 능력을 기를 마찰만 사라진 게 아니라, 그 마찰을 견디게 만들던 *필요*가 같이 빠졌다. 두 갈래로 빠진다.

첫째, 수동적으로 빠진다. 예전엔 막히면 배워야 했다. 막힘이 곧 강제였다. 이 에러를 이해하지 못하면 다음으로 못 넘어가니까, 싫어도 파고들었다. 그런데 AI는 그 막힘을 그 자리에서 녹인다. 막힐 일이 없으니 배울 트리거가 없다. 배우기 싫어서 안 배우는 게 아니라, 배워야 하는 *순간*이 오지 않는다. 막힘은 학습의 입구였는데, 그 입구가 닫혔다.

둘째, 능동적으로 빠진다. 이쪽이 더 독하다. 실무는 throughput에 점수를 준다. 얼마나 빨리, 얼마나 많이 쳐냈는가. 그 잣대 위에서 학습은 단지 불필요한 게 아니라 *불리*하다. 막힘을 AI로 넘기지 않고 직접 파고드는 사람은 그 분기에 느린 사람이다. 느리면 점수에서 진다. 잉여 생산력은 더 적은 인원으로 더 많은 일을 하는 쪽으로 흡수되고([감원은 지난 글에서 다뤘다](https://yceffort.kr/2026/06/when-job-titles-blur)), 사람당 슬랙(slack, 당장의 산출에 안 잡히는 여유)이 제거된다. 학습이 요구하는 그 여유 시간이 가장 먼저 잘린다.

조직은 입으로는 품질을 말한다. 그런데 실제로 보상하는 건 속도다. 문서에 뭐라고 쓰여 있든, 분기말에 누가 칭찬받고 누가 평가에서 밀리는지를 보면 진짜 잣대가 드러난다. 말한 것이 아니라 보상한 것이 진짜 규칙이다. 그리고 보상받는 규칙은 속도다.

개인 쪽 신호도 같은 걸 가리킨다. Stack Overflow의 [2025년 설문](https://survey.stackoverflow.co/2025/ai/)에서 AI 출력이 정확하다고 믿는 개발자 비율은 2024년 40%에서 29%로 떨어졌고, 정확성을 적극적으로 불신하는 쪽(46%)이 신뢰하는 쪽(33%)보다 많다. 그러면서도 84%가 쓴다. 안 믿는 도구를 굳이 쓰는 건 게을러서가 아니다. 안 쓰면 느린 사람이 되기 때문이다. 회피가 합리적이 되는 그 구조에서, 신뢰하지 않는 도구에 의존하는 것도 똑같이 합리적이 된다.

그래서 동기가 무너지는 건 도덕의 실패가 아니다. 예측된 행동이다. Bjork는 학습자에게 효과적인 방법을 알려 줘도, 강제되지 않으면, 더 쉽고 더 유창하게 느껴지는 쪽으로 돌아간다는 걸 보였다. 아는 것이 행동을 바꾸지 않는다. desirable difficulty는 _바람직하지만_ 아무도 자발적으로 선택하지는 않는다는 게 핵심이다. 그러니 "왜 요즘은 깊이 안 배우나"라는 질문은 틀렸다. 필요와 보상이 둘 다 학습에서 등을 돌린 환경에서, 회피는 게으름이 아니라 합리적 적응이다.

그리고 이건 의지로 풀리지 않는다. 학습이 순전히 재량이고 무보상이면, 의욕 있는 소수도 진다. 옆자리가 AI로 두 배 빨리 쳐내는데 나 혼자 막힘을 끌어안고 느리게 배우면, 나는 그저 평가에서 밀리는 사람이 된다. 집단행동 문제다. 혼자 옳게 행동해서 손해 보는 구조에서는, 옳게 행동하려는 의지조차 비용이 된다.

그리고 마찰을 없애는 건 AI라는 도구 하나가 아니다. throughput을 요구하는 조직이 같이 없앤다. 도구는 막힘을 녹이고, 조직은 막힘을 견딜 여유를 없앤다. 양쪽에서 마찰이 사라지면, 판단은 비싸지면서 동시에 안 길러지고, 그걸 배울 필요와 동기까지 빠진다.

## 처방을 쓰고 싶은 손

여기서 글을 어떻게 닫아야 하는지 나는 안다. 명백한 수가 있다. "그러니 의식적으로 마찰을 만들어라. AI를 끄고 직접 디버깅하는 시간을 떼어 두고, 막혀도 바로 묻지 말고…" 손이 그쪽으로 움직인다. 그리고 요즘 대부분의 글이 그렇게 흘러가고 있다.

그런데 그게 정확히 내 지난 두 글의 엔딩이었다. 그리고 그건 균형에서 지는 조언이다. 방금 한 말(학습이 재량이고 무보상이면 의욕 있는 소수도 진다)을 진지하게 받아들이면, "개인이 의식적으로 마찰을 만들어라"는 처방은 집단행동 문제를 개인의 의지로 떠넘기는 것에 불과하다. 구조가 만든 문제에 개인 도덕을 처방하는 건, 듣기엔 좋지만 균형을 못 이긴다. 옆자리가 두 배 빠른 한, 혼자 마찰을 껴안는 사람은 옳고 또 진다.

게다가 처방을 쓰고 싶은 이 불편함 자체가 이 글이 가리키는 자리다. 처방을 내릴 수 있다는 건 내 판단이 이미 길러졌다는 뜻이다. 비용은 이미 다 치렀고, 지금 와서 마찰의 가치를 설교하는 것이다.

그러니 처방은 없다. 대신 이 논증이 어디서 휘는지부터 적어 둔다.

가장 강한 반례는 결과를 소유하는 구조, 목적조직이다. 속도가 아니라 결과로 평가받고 자기가 만든 걸 자기가 운영하는 곳("you build it, you run it", [2탄에서 인용한 Vogels](https://yceffort.kr/2026/06/when-job-titles-blur))에서는 4절의 능동적 칼날이 무뎌진다. 속도 잣대가 약해지니까. 게다가 결과를 소유하면 하류 마찰이 일부 돌아온다. 자기 온콜을 자기가 받고 새벽에 자기 프로덕션 불을 자기가 끄는 것. 그건 3절에서 내가 "프로덕션에서 터지는 걸 겪으면서 배웠다"고 한 바로 그 마찰이고, 진짜 학습이다. 그러니 이 구조는 명제를 _부분적으로_ 약화시킨다. 진짜로.

그런데 끝까지 따라가면 결국 제자리로 돌아온다. 결과를 책임진다는 건 "판단을 잘 써라"는 요구이지 "판단을 길러라"는 강제가 아니다. 결과만 좋으면 코드는 AI가 다 써도 되고, 마감이 급하면 오히려 더 기댄다. 그러니 코드를 직접 짜며 부딪히는 마찰, 판단을 길러 주던 그 마찰은 돌아오지 않는다. 돌아온 건 사고를 수습하는 마찰뿐인데, 이건 늦고 뭉툭하다. 사고가 터지면 "이 선택이 틀렸구나"는 배워도, 코드 한 줄 한 줄이 왜 위험했는지까지 가르쳐 주지는 않는다. 게다가 그 수습마저 AI한테 시키면 그 학습도 사라진다.

정리하면 이렇다. 결과로 평가하면 판단을 더 많이 요구하게 되는데, 정작 판단을 길러 줄 마찰은 돌아오지 않는다. 요구는 늘고 길러지는 양은 그대로. 그게 정확히 그 양날이다. 게다가 "결과로 평가한다"는 간판조차 실제로는 배포 수 같은 속도 지표로 대체되기 일쑤다. 특히 이제 막 들어온 사람에게 가혹하다. 아직 갖지도 못한 판단을 결과로 내놓으라고 요구받는데, 그걸 기를 기회는 여전히 없으니까. 이미 판단을 갖춘 시니어는 그걸 꺼내 쓰며 잘 버티고, 주니어만 그대로 노출된다. 이건 내 주장을 뒤집기는커녕 오히려 그대로 보여 주는 장면이다.

방금 것은 논증을 정밀하게 만들 뿐이다. 내가 통째로 틀렸다고 인정해야 하는 경우는 따로 있다. 지금 막 들어오는 사람들이 AI와 부딪히는 과정에서(에이전트가 틀렸을 때 알아채고, 어디까지 맡길지 정하는 그 새로운 종류의 씨름에서) 예전의 디버깅과는 다른 경로로 판단을 길러낸다면, 나는 틀렸다. 혹은 필요가 사라졌다고 본 게 착시이고, 마찰은 형태만 바뀌어 그대로 있다면, 그래도 나는 틀렸다. 둘 중 하나라도 참이면 이 글은 꼰대의 엄살이 될 것이다. 그리고 2절에서 인정했듯, 이런 불평은 대체로 틀려 왔다. 확률은 내 편이 아니다.

다만 지금 내 자리에서 보이는 건 그렇지 않다. 오히려 그 반대가 보인다. 정작 비용을 치러야 하는 건 지금 막 들어오는 사람들이고, 그들에겐 마찰을 견딜 필요도 보상도 없다. 가장 잘 보이는 사람이 정작 당사자가 아니다. 그래서 안 고쳐진다. 나를 포함해서, 이 문제를 가장 또렷이 보는 자리에 앉은 사람이 "내 알바는 아니"라고 말할 수 있는 자리에 앉아 있다. 그 비대칭이 키스톤이다.

나는 여전히 코드를 읽는다(가끔 희미해지긴 해도). 그런데 그건 읽어야 할 필요가 남아서가 아니라, 그 판단이 이미 길러져 있어서다. 마지막으로 코드를 진지하게 읽은 게 언제냐는 질문은, 지금 들어오는 사람들에게는 점점 "왜 읽어야 하죠"가 된다. 그리고 그 *필요*는, 내일도 오지 않는다.

## 참고

- [Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity (METR, 2025)](https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/) (2025년 초의 AI가 숙련 오픈소스 개발자의 생산성에 미친 영향)
- [How AI Impacts Skill Formation (Shen & Tamkin, 2026)](https://arxiv.org/abs/2601.20245) (AI는 숙련 형성에 어떤 영향을 주는가)
- [AI Copilot Code Quality: 2025 Research (GitClear)](https://www.gitclear.com/ai_assistant_code_quality_2025_research) (AI 코파일럿이 만든 코드의 품질: 2025 연구)
- [2025 Stack Overflow Developer Survey: AI](https://survey.stackoverflow.co/2025/ai/) (2025 스택 오버플로우 개발자 설문: AI 부문)
- [Satya Nadella: up to 30% of Microsoft code is written by AI (CNBC, 2025)](https://www.cnbc.com/2025/04/29/satya-nadella-says-as-much-as-30percent-of-microsoft-code-is-written-by-ai.html) (사티아 나델라: Microsoft 코드의 최대 30%는 AI가 쓴다)
- [The Impact of Generative AI on Critical Thinking (Lee et al., Microsoft Research & CMU, CHI 2025)](https://dl.acm.org/doi/full/10.1145/3706598.3713778) (생성형 AI가 비판적 사고에 미치는 영향)
- Harry Braverman, [Labor and Monopoly Capital: The Degradation of Work in the Twentieth Century](https://monthlyreview.org/9780853459408/) (1974) (노동과 독점자본: 20세기 노동의 퇴화)
- Elizabeth L. Bjork & Robert A. Bjork, ["Making Things Hard on Yourself, but in a Good Way: Creating Desirable Difficulties to Enhance Learning"](https://bjorklab.psych.ucla.edu/wp-content/uploads/sites/13/2016/04/EBjork_RBjork_2011.pdf) (Psychology and the Real World, 2011) (스스로를 힘들게, 그러나 좋은 방향으로: 학습을 강화하는 바람직한 어려움 만들기)
