AI가 쓴 코드, 사람이 꼭 이해해야 할까
AI 코딩 도구가 일상화되면서 풀 리퀘스트에 대한 회의론이 커지고 있다. PR 리뷰가 더 이상 이해와 책임을 넘기는 장치로 작동하지 않는다는 지적이다. 하지만 이 논의에 빠진 한 가지 가정이 있다. 코드를 쓰는 것과 리뷰하는 것이 같은 주체여야 한다는 전제 말이다.
PR 제도의 원래 취지는 명확했다. 작성자가 왜 이렇게 만들었는지 설명할 수 있음을 암묵적으로 약속하고, 리뷰어가 코드와 그 뒤의 판단을 함께 검토하는 구조였다. 머지 버튼은 단순 승인이 아니라 팀이 그 변경의 책임을 함께 지겠다는 사회적 합의였다.
하지만 AI가 코드를 생산하는 시대에 이 구조는 균열이 생긴다. AI는 초당 수십 줄을 쓸 수 있다. 사람은 한 시간에 백 줄 검토하기도 벅차다. 생산성 비대칭이 너무 심하다. AI가 쓴 코드를 사람이 꼭 한 줄씩 이해해야 하는가. 지금은 그래야 한다고들 하지만 이건 과도기적 현상일 뿐이다.
실제로 AI가 작성한 코드의 품질은 빠르게 오르고 있다. 테스트 통과율, 버그 발생률, 유지보수성 지표들이 점점 사람 수준을 넘어서고 있다. 코드 품질이 충분히 높아진다면 사람이 굳이 중간 검증에 개입할 필요가 있는가. 검증 자체를 AI에게 맡기면 된다. AI가 쓰고 AI가 리뷰하는 구조가 성립될 수 있다는 얘기다.
물론 지금 당장 운영 환경에서 이런 접근을 하기는 쉽지 않다. 장애가 나면 책임 소재가 불분명해지고, 규제 환경에서 설명 가능성을 요구받는 경우도 많다. AI가 쓴 코드가 틀렸을 때 누구에게 물을 것인가 하는 문제는 여전히 남아있다.
하지만 이건 기술 문제가 아니라 조직적·법적 문제다. 기술적으로는 이미 AI가 AI를 검증하는 구조는 가능하다. 코드 리뷰용 AI 에이전트는 사람보다 더 철저하게 패턴을 검출하고, 더 많은 맥락을 동시에 고려할 수 있다. 사람이 병목이 되는 지점에서 AI를 빼는 것이 합리적이다.
PR 붕괴 현상을 바라보는 관점도 바꿔야 한다. PR이 실패한 것이 아니라 PR을 둘러싼 환경이 변한 것이다. 코드 생산 주체가 사람에서 AI로 옮겨가면서 리뷰 주체를 바꾸지 않아서 발생하는 불일치다. AI 시대의 리뷰 게이트는 AI가 담당하는 게 자연스러운 수순이다.
결국 핵심 질문은 이것이다. 코드를 설명할 수 있어야 한다는 요건이 사람에게만 적용되어야 하는가. AI가 자신의 코드를 설명할 수 있다면, 그 설명을 사람이 검증하는 것만으로 충분하지 않은가. 코드 품질이 충분히 높아지고 AI 간 검증이 성숙하면 사람의 역할은 최종 승인자가 아니라 감독자로 좁혀질 것이다.
이건 생산성의 문제가 아니라 구조의 문제다. AI가 쓴 코드를 사람이 일일이 읽어보는 건 기계에 맡길 수 있는 일을 사람이 하고 있는 것이다. 과도기적 혼란 속에서 PR이 애물단지로 느껴지는 이유는 우리가 아직 새로운 게이트를 정의하지 못했기 때문이다. 코드 품질이 올라갈수록 사람 자체가 병목이 되는 시점이 온다. 그때가 되면 PR 제도는 지금의 형태로 유지되지 않을 것이다.
AI가 쓴 코드, 사람이 꼭 이해해야 할까
https://futurecreator.github.io/2026/02/24/ai-code-review-future/