Anthropic Economic Index 리포트: 경제적 프리미티브

Executive Summary

핵심 발견 요약

복잡한 과업일수록 AI 속도 향상이 크지만, 성공률은 낮아진다. 대졸 수준 과업은 12배 빨라지나 성공률은 66%로, 고졸 미만(70%)보다 낮다. 그럼에도 순생산성 이득은 복잡한 과업에서 더 크다.

5가지 '경제적 프리미티브'를 도입. 과업 복잡도·숙련 수준·사용 목적·AI 자율성·성공률로 구성된 기초 측정 체계로, AI의 경제적 영향을 체계적으로 추적하기 위한 프레임워크다.

Claude.ai에서 증강(52%)이 자동화(45%)를 다시 앞섰다. 8월에 자동화가 일시적으로 앞섰으나 11월에 반전. 파일 생성, 메모리, 스킬 등 제품 변화가 협업적 사용을 촉진한 것으로 보인다.

AI가 직업 내 고숙련 과업을 우선 커버한다. Claude 사용 과업의 평균 교육 수준(14.4년)은 경제 전체 평균(13.2년)보다 높으며, 이를 제거하면 대부분 직업이 '탈숙련화'된다.

생산성 영향을 성공률로 보정하면 절반 수준으로 하락. 연간 1.8%p → 1.0~1.2%p. 과업 간 보완성까지 고려하면 0.6~0.9%p로 더 낮아진다. 그러나 이마저도 1990년대 후반 수준의 생산성 성장 회복을 의미한다.

12×

대졸 수준 과업
속도 향상

52%

Claude.ai 증강
사용 비율

0.92+

프롬프트-응답
교육수준 상관계수

1.0%p

보정 후 연간
생산성 증가 추정

Researchers

핵심 연구진

그 외: Miles McCain, Ryan Heller, Tyler Neylon. 자문: Dario Amodei, Jack Clark, Jared Kaplan, Deep Ganguli, Kunal Handa 외 다수.

01 이전 보고서 이후 무엇이 달라졌는가

사용 집중도: 과업과 직업군

프론티어 LLM의 능력 범위가 넓어졌음에도, Claude 사용은 여전히 소수의 과업에 높게 집중되어 있다. Claude.ai에서 상위 10개 과업이 전체의 24%를 차지하며 이는 2025년 1월의 21%에서 꾸준히 증가했다. API 고객의 경우 더 뚜렷해서, 상위 10개가 28%에서 32%로 상승했다.

가장 많이 사용되는 단일 과업은 '소프트웨어 오류 수정(modifying software to correct errors)'으로, Claude.ai 전체의 6%, API의 10%를 차지한다. 컴퓨터·수학 과업이 Claude.ai 대화의 1/3, API 트래픽의 거의 절반을 차지하며 여전히 지배적이다.

주목할 변화

교육·도서관 관련 과업이 Claude.ai에서 꾸준히 증가해 2025년 1월 9%에서 11월 15%로 상승했다. 예술·디자인·미디어 과업도 반등했으며, API에서는 사무·행정 지원 과업이 3%p 증가해 13%를 기록했다. 기업들이 이메일 관리, 문서 처리, CRM, 일정 관리 등 백오피스 자동화에 Claude를 점차 활용하고 있음을 시사한다.

증강이 다시 자동화를 앞섬

Claude.ai에서 증강(Augmentation)이 52%, 자동화(Automation)가 45%로, 증강이 다시 우위를 점했다. 이는 2025년 8월 자동화가 49% 대 47%로 앞섰던 것의 반전이다.

주목할 점은 '지시적 사용(Directive)' — 사용자가 과업을 통째로 위임하는 패턴 — 의 비율이 8월 39%에서 11월 32%로 7%p 감소한 것이다. 같은 기간 파일 생성, 지속적 메모리, 워크플로 맞춤 스킬 등 제품 업데이트가 있었으며, 이러한 변화가 보다 협업적인 사용 패턴을 촉진한 것으로 보인다.

다만 장기 추세로 보면 자동화 비중은 여전히 1년 전보다 높다. 2025년 1월 증강 56% 대 자동화 41%이었으므로, 8월의 급등이 과장된 것일 뿐 자동화 확대의 기조적 흐름은 유지되고 있다.

분류 체계

자동화에는 지시적(Directive) 사용과 피드백 루프가, 증강에는 학습(Learning), 과업 반복(Task Iteration), 검증(Validation)이 포함된다. 이 보고서의 분류에는 Sonnet 4.5가 사용되었으며, 이전 보고서의 Sonnet 4와는 약간의 분류 차이가 있을 수 있다.

지리적 분포: 미국 내 수렴, 글로벌 격차 지속

글로벌 차원에서 Claude 사용의 지리적 집중은 거의 변하지 않았다. Anthropic AI Usage Index(AUI)의 국가 간 집중도는 8월과 11월 사이 본질적으로 동일했다.

반면 미국 내에서는 상당한 수렴이 관찰되었다. 지니 계수가 0.37에서 0.32로 하락했으며, 이는 완전 균등(0)을 향한 상당한 이동이다. 상위 5개 주가 전체 사용량의 50%를 차지하지만 생산가능 인구는 38%에 불과하다.

확산 속도 추정

비례적 수렴 모델을 적용하면, OLS 추정치(β̂ ≈ 0.77)는 약 2년, 표본 노이즈를 보정한 2SLS 추정치(β̂ ≈ 0.86~0.89)는 4~5년 내 주별 AUI가 대부분 균등화됨을 시사한다. 이는 20세기 경제적으로 중요한 기술들의 확산 속도(약 50년)보다 대략 10배 빠른 수준이다. 다만 3개월 관찰에 기반한 추정이므로 불확실성이 크다.

미국 내 사용 격차를 가장 잘 설명하는 변수는 소득이 아니라 노동력 구성이다. 컴퓨터·수학 직업 종사자 비율이 1% 높은 주는 1인당 사용량이 0.36% 높으며, 이것만으로 주간 변이의 약 2/3를 설명한다. 워싱턴 D.C., 버지니아, 워싱턴 주가 대표적인 고사용 지역이다.

02 경제적 프리미티브 도입

5가지 프리미티브의 정의와 검증

이 보고서의 핵심 기여는 기존의 자동화/증강 구분을 넘어, AI 사용의 5가지 경제적 차원을 측정하는 '프리미티브'를 도입한 것이다. 프라이버시 보존 분석 도구를 통해 Claude에게 익명화된 대화에 대한 특정 질문에 답하게 하는 방식으로 도출된다.

5가지 경제적 프리미티브

① 과업 복잡도(Task Complexity) — AI 없이 사람이 수행하는 데 걸리는 시간, AI와 함께 걸리는 시간, 한 대화에서 복수 과업 처리 여부를 측정. 같은 '디버깅'이라도 간단한 함수 오류와 코드베이스 전체 리팩토링은 다른 경제적 함의를 가진다.

② 숙련 수준(Human & AI Skills) — 사용자 프롬프트와 AI 응답을 이해하는 데 필요한 교육 연수, 그리고 사용자가 Claude 없이도 과업을 완수할 수 있는지를 측정. AI가 저숙련 과업을 대체하고 고숙련 과업을 보완한다면, 이는 숙련 편향적 기술 변화(Skill-Biased Technical Change)의 또 다른 형태가 된다.

③ 사용 목적(Use Case) — 업무(Work), 교육 과제(Coursework), 개인 용도(Personal) 구분. 노동시장 영향은 업무 사용에서 직접적으로, 교육 사용은 미래 노동력의 AI 보완 역량 구축 신호로 작용.

④ AI 자율성(AI Autonomy) — 사용자가 Claude에게 위임하는 의사결정 수준(1~5점 척도). 기존 자동화/증강과는 다른 차원: "이 단락을 불어로 번역해줘"는 높은 자동화이지만 낮은 AI 자율성이다(의사결정이 거의 불필요).

⑤ 성공률(Task Success) — Claude가 과업을 성공적으로 완수했는지에 대한 자체 평가. 자동화의 실현 가능성(해당 과업을 자동화할 수 있는가?)과 효율성(몇 번 시도해야 하는가?) 모두를 판단하는 핵심 지표.

검증 과정은 다음과 같았다. 사용자 피드백이 있는 소수의 대화에 대해 인간 연구자와 비교하고, 내부 및 합성 데이터로 API 분류기를 테스트했다. 흥미롭게도, 일부 지표(예: 성공률)에서는 복잡한 분류기보다 간단한 분류기가 인간 평가에 더 가까웠다. 연쇄 사고(Chain of Thought) 프롬프팅은 시간 추정과 자율성 측정 세 가지에서만 유의미한 성능 향상을 보여 선택적으로 적용되었다.

한계

개별 프리미티브는 약간의 노이즈가 있을 수 있으며 정확한 값으로 받아들이면 안 된다. 핵심 가치는 방향적 정확성(directional accuracy)에 있으며, 여러 프리미티브를 조합했을 때 의미 있는 경제적 신호를 제공한다는 것이다.

Claude.ai vs API: 두 세계의 차이

소비자(Claude.ai)와 기업(API)의 사용 패턴은 극적으로 다르다.

API는 압도적으로 업무 중심(74% vs 46%)이며, 지시적 사용이 64%(vs 32%), 자동화가 3/4 이상을 차지한다. Claude.ai 사용자는 훨씬 더 많은 상호작용을 하며, AI와 함께하는 시간(15분 vs 5분)과 사람만으로 완수하는 데 걸리는 시간(3.1시간 vs 1.7시간) 모두 길다.

Claude.ai의 성공률(67%)이 API(49%)보다 높은데, 이는 다중 턴 대화에서 사용자가 수정·반복할 수 있는 이점을 반영한다. 직업군 분포도 다르다. API는 컴퓨터·수학 과업이 52%(vs 36%)로 집중되어 있고, Claude.ai는 교육 16%(vs 4%), 예술·디자인 11%(vs 6%) 등 더 넓은 분포를 보인다.

03 지리적 변이와 경제적 프리미티브

소득·교육과 AI 채택의 관계

국가 수준에서 1인당 GDP가 1% 증가하면 1인당 Claude 사용량이 0.7% 증가한다. 고소득 국가에서는 업무와 개인 용도 비중이 높고, 저소득 국가에서는 교육 과제 비중이 높다.

발칸 반도와 브라질이 업무 사용 비율이 가장 높고, 인도네시아는 교육 과제 비율이 가장 높다. 미국 내에서는 뉴욕 주가 업무 목적 Claude 사용이 가장 두드러진다.

국가별·주별로 프리미티브와 AUI의 관계는 다르게 나타난다. 국가 수준에서는 높은 사용량이 짧은 과업, 낮은 AI 자율성과 상관되지만, 미국 주 수준에서는 이 관계가 통계적으로 유의하지 않다. 이는 미국 내 소득 변이와 사용 사례 다양성이 글로벌 수준보다 제한적이기 때문일 수 있다.

Simpson의 역설

과업 성공률과 교육 수준 사이의 관계가 분석 수준에 따라 정반대로 나타난다. 국가 수준에서는 교육이 높을수록 성공률이 낮고(더 어려운 과업을 시도하므로), 미국 주 수준에서는 교육이 높을수록 성공률이 높다(단, 다른 변수를 통제하면 사라진다). 경제적·제도적 맥락이 AI 사용의 결과를 어떻게 매개하는지 보여주는 흥미로운 사례다.

프롬프트 수준 = 응답 수준: 거울 효과

가장 인상적인 발견 중 하나: 사용자 프롬프트의 교육 수준과 Claude 응답의 교육 수준 간 상관관계가 국가 수준 r = 0.925, 미국 주 수준 r = 0.928로 거의 완벽하다.

Claude는 거울처럼 작동한다. 정교한 프롬프트에 정교한 응답을 생성하고, 단순한 프롬프트에 단순한 응답을 생성한다. 이는 모델 설계와 훈련의 결과이기도 하다. Claude는 매우 정교한 방식으로 응답할 수 있지만, 사용자가 정교한 프롬프트를 입력할 때만 그렇게 하는 경향이 있다.

또한 1인당 사용량이 높은(=고소득) 국가일수록 자동화보다 증강적 방식으로 Claude를 사용하는 비율이 높다. 즉 부유한 국가일수록 AI를 독립적으로 작동시키기보다 보조자이자 협력자로 활용한다.

04 과업과 생산성

복잡한 과업일수록 더 큰 속도 향상, 그러나 신뢰성과의 트레이드오프

O*NET 과업 수준에서 분석한 결과, Claude.ai에서 고등학교 교육(12년) 수준 프롬프트의 과업은 9배, 대학 학위(16년) 수준은 12배 빨라졌다. API에서는 전 범위에 걸쳐 속도 향상이 더 컸다.

그러나 반대 방향의 트레이드오프도 존재한다. 더 복잡한 과업의 성공률은 더 낮다. Claude.ai에서 고졸 미만 과업(예: 기본 제품 질문 응답)은 70% 성공률, 대졸 수준(예: 분석 계획 수립)은 66%다. 그럼에도 성공률 차이를 보정한 후에도 교육 수준 기울기는 유지된다. 즉, 복잡한 과업은 여전히 더 큰 순생산성 이득을 보인다.

자동화 비율은 프롬프트 교육 수준과 사실상 무관하다. 모든 교육 수준에서 자동화 패턴이 대략 동일한 비율로 나타난다. Claude.ai 사용자는 더 복잡한 과업에서 Claude에게 약간 더 높은 자율성을 부여하는 반면, API 사용은 모든 복잡도 수준에서 균일하게 낮은 자율성을 보인다.

실사용 기반 과업 지평(Task Horizon)

METR의 벤치마크에서 Claude Sonnet 4.5는 약 2시간짜리 과업에서 50% 성공률을 달성한다. Anthropic의 자체 API 데이터에서는 약 3.5시간, Claude.ai에서는 약 19시간짜리 과업에서 같은 성공률을 보인다.

방법론적 차이

METR은 고정된 과업 세트를 모델에 부여하는 통제된 벤치마크다. Anthropic의 데이터는 사용자가 어떤 과업을 가져올지 선택하는 실사용 환경이다. 사용자의 '작업 분해' 전략, 피드백 루프, 그리고 성공할 것으로 기대하는 과업을 선별적으로 가져오는 선택 편향이 실효적 과업 지평을 확장시킨다. 더 성능 좋은 모델이 이 그래프에서 개선을 보일 보장도 없다 — 사용자가 새 모델에 대해 더 도전적인 과업을 제시할 수 있기 때문이다.

실효적 AI 커버리지: 직업 노출 재평가

기존 '과업 커버리지'(해당 직업 과업 중 Claude 데이터에 등장하는 비율)를 넘어, 이 보고서는 실효적 AI 커버리지(Effective AI Coverage)라는 새 지표를 도입한다. 이는 근무 시간 가중치, 과업 수행 빈도, Claude의 평균 성공률을 반영한다.

두 지표의 차이가 드러내는 직업별 양상:

실효 커버리지가 과업 커버리지보다 높은 직업

데이터 입력 담당자 — 9개 과업 중 2개만 커버되지만, 가장 시간을 많이 쓰는 '원천 문서에서 데이터 읽고 입력하기'의 성공률이 높다. 방사선 전문의 — 진단 이미지 해석과 판독 보고서 작성이라는 핵심 업무에서 높은 성공률. 의료 기록사도 유사한 패턴.

실효 커버리지가 과업 커버리지보다 낮은 직업

미생물학자 — 과업의 절반이 커버되지만, 가장 시간 집약적인 '특수 실험실 장비를 사용한 실습 연구'는 커버하지 못한다. 교사 — 채점, 학생 상담, 연구는 커버하지만, 강의 전달과 교실 관리라는 핵심 대면 과업은 불가.

탈숙련화 시나리오: AI가 직업의 과업 구성을 어떻게 바꾸는가

Claude가 커버하는 과업의 평균 필요 교육 수준은 14.4년(준학사 학위)으로, 경제 전체 평균 13.2년보다 높다. 이 과업들을 제거하면 대부분의 직업이 탈숙련화(deskilling)된다.

구체적 사례: 탈숙련화되는 직업

기술 작가(Technical Writer) — '특정 분야 동향 분석하여 수정 필요성 판단'(18.7년), '출판물 검토 후 범위·형식 변경 권고'(16.4년) 같은 고숙련 과업이 사라지고, '지정 자료의 스케치 그리기'(13.6년), '생산·개발·실험 활동 관찰'(13.5년) 등이 남는다.

여행 대리인 — '일정 기획·묘사·판매'(13.5년), '여행비 계산'(13.4년)이 사라지고, '교통 티켓 발행'(12.0년), '대금 수금'(11.5년)이 남는다.

교수직 — 채점, 학생 상담, 연구비 신청, 연구 수행 과업이 대체되고, 대면 강의와 교실 관리가 남는다.

반대 사례: 오히려 숙련화되는 직업

부동산 관리자 — AI가 매출 기록 유지(12.8년), 시장 대비 임대료 검토(12.6년) 같은 행정 과업을 커버하고, 대출 확보, 건축 회사 협상, 이사회 회의 같은 고수준 전문 판단 과업이 남아 숙련화가 발생한다.

Autor & Thompson(2025)의 프레임워크를 적용하면, 탈숙련화되는 직업(기술 작가, 여행 대리인)은 임금 하락·고용 증가, 숙련화되는 직업(부동산 관리자)은 임금 상승·고용 감소로 이어질 수 있다. 다만 이는 현재 Claude 사용 패턴에 기반한 것이며, 모델 발전에 따라 커버되는 과업이 달라질 것이다.

생산성 영향 재추정: 세 가지 보정

이전 연구의 연간 1.8%p 노동생산성 증가 추정치를 새로운 프리미티브로 재검증했다.

보정 ①: 과업 속도 향상만 반영 (기존과 동일)

Claude.ai와 API 모두에서 동일한 1.8%p 추정치가 재현되었다. API 사용이 좁은 과업에 집중되지만 과업당 속도 향상이 더 높아, 두 효과가 상쇄된다.

보정 ②: 과업 신뢰성(성공률) 반영

과업별 시간 절약에 성공 확률을 곱하면, 추정치가 Claude.ai에서 1.2%p, API에서 1.0%p로 하락한다. 약 1/3에서 절반 정도의 감소다.

보정 ③: 과업 간 보완성(CES 집계) 반영

직업 내 과업들이 대체재인지 보완재인지에 따라 생산성 효과가 크게 달라진다. 대체 탄력성(σ) = 1이면 기존 1.8%p, σ = 0.5(과업이 보완재)이면 0.7~0.9%p로 감소한다. 성공률까지 보정하면 0.6~0.8%p. 반대로 σ = 1.5(과업이 대체재)이면 2.2~2.6%p로 증가한다.

핵심 결론

가장 보수적 시나리오(성공률 + 보완성 보정)에서도 연간 0.6%p, 가장 낙관적 시나리오에서는 2.6%p의 노동생산성 증가가 예상된다. 중간값인 1.0~1.2%p는 1990년대 후반~2000년대 초 수준의 생산성 성장 복원을 의미한다. 이는 현재 모델 능력에 기반한 것이며, 모델 발전에 따라 상향될 여지가 크다.

Glossary

주요 용어 정리

용어	설명
경제적 프리미티브Economic Primitives	AI 사용의 경제적 영향을 추적하기 위한 5가지 기초 측정 지표 세트. 과업 복잡도, 숙련 수준, 사용 목적, AI 자율성, 성공률로 구성.
Anthropic AI 사용 지수AUI	해당 지역의 Claude 사용 비율을 생산가능 인구 비율로 나눈 값. 1 이상이면 인구 대비 과잉 사용, 1 미만이면 과소 사용.
증강Augmentation	사용자가 AI와 반복적으로 상호작용하며 학습·반복·검증하는 협업적 패턴. 과업 반복(Task Iteration), 학습(Learning), 검증(Validation) 포함.
자동화Automation	사용자가 최소 상호작용으로 AI에 작업을 위임하는 패턴. 지시적(Directive) 사용과 피드백 루프 포함.
실효적 AI 커버리지Effective AI Coverage	근무 시간 가중치, 과업 빈도, 성공률을 반영한 직업별 AI 침투도 지표. 단순 과업 커버리지보다 현실적.
과업 지평Task Horizon	AI가 50% 이상 성공률을 달성하는 최대 과업 시간. METR이 개발한 AI 진보의 핵심 지표.
탈숙련화Deskilling	AI가 직업 내 고숙련 과업을 우선 대체해 남은 과업의 평균 숙련 요구 수준이 낮아지는 현상.
CES 집계CES Aggregation	일정 대체 탄력성(Constant Elasticity of Substitution) 생산 함수. 직업 내 과업 간 대체/보완 관계를 모델링하여 생산성 효과를 집계.
지시적 사용Directive Use	사용자가 전체 과업을 AI에 위임하고 최소한의 상호작용만 하는 사용 패턴. 자동화의 하위 유형.
숙련 편향적 기술 변화SBTC	기술 혁신이 고숙련 노동에 대한 수요를 높이고 저숙련 노동을 대체하는 현상. AI가 이 패턴을 따르는지가 핵심 질문.
O*NET	미국 약 800개 직업의 과업·기술·교육 요건을 정리한 노동부 직업 정보 데이터베이스.
Clio	Anthropic의 프라이버시 보존 분석 기법. 개별 사용자를 식별하지 않고 대화 패턴 분석.
Hulten의 정리Hulten's Theorem	과업 수준 생산성 충격을 총요소생산성 변화로 집계하는 경제학 정리. 보고서의 생산성 추정 기반.

Fact Check

팩트체크

주장Claude.ai에서 실효적 과업 지평이 약 19시간으로, METR 벤치마크의 2시간과 크게 차이난다.

검증보고서가 이 차이의 원인(작업 분해, 피드백 루프, 선택 편향)을 투명하게 밝히고 있으며, METR과 자사 데이터를 '통제된 벤치마크 vs 실사용 측정'으로 명확히 구분한다. 방법론적으로 정직한 보고.

주장미국 주별 AI 사용 수렴이 2~5년 내 달성될 것으로 예측.

검증3개월 관찰에 기반한 추정이며, 보고서도 불확실성을 인정한다. 2SLS로 표본 노이즈를 보정한 것은 방법론적 강점이나, 기술 확산의 S-커브 특성(초기 빠른 채택 후 정체)을 고려하면 선형 외삽은 낙관적일 수 있다. 20세기 기술의 50년 확산과 비교한 것은 기준점으로서 적절.

주장AI의 노동생산성 효과가 성공률 보정 후 1.0~1.2%p로 하락.

검증이전 추정치(1.8%p)를 하향 조정한 것은 학술적으로 정직한 접근이다. 다만 '광범위한 채택'이라는 전제는 여전히 대단히 큰 가정. 현재 Claude 사용이 컴퓨터·수학 과업에 편중된 상황에서, 모든 직업으로 확산되기까지는 상당 시간이 필요. CES 보완성까지 반영한 0.6~0.9%p가 가장 현실적 범위일 수 있다.

주장Claude가 고숙련 과업을 우선 커버해 직업의 탈숙련화를 유발.

검증교육 수준 예측에 O*NET 직업별 데이터를 과업별로 분해하기 위해 임베딩 기반 Ridge 회귀를 사용한 것은 창의적이지만 간접적 추정이다. 보고서 스스로 이 교육 기반 측정이 Autor & Thompson의 '전문성' 개념과 다를 수 있음을 인정한다. 전기기사의 '회로 차단기에 전선 연결'은 높은 전문성이지만 낮은 교육 수준으로 분류되는 등 한계가 있다.

Claude's Analysis

Claude 인사이트

프리미티브 접근법의 인식론적 혁신과 한계

이 보고서의 가장 야심찬 기여는 '경제적 프리미티브'라는 개념 자체다. AI에게 AI 사용에 대해 질문하여 경제 지표를 생성한다는 것은 — Claude가 Claude의 대화를 분류하는 — 일종의 자기참조적(self-referential) 측정 체계다. 이는 전통적 경제 통계(설문조사, 고용 데이터, GDP)와 근본적으로 다른 패러다임이며, 동시에 고유한 편향의 원천이기도 하다. Claude가 자신의 성공률을 스스로 평가할 때 체계적으로 과대 또는 과소 평가할 가능성이 있다. 보고서가 외부 벤치마크와의 교차 검증을 시도한 것은 이 한계를 인식한 것이지만, 궁극적으로 독립적인 제3자 검증이 필요하다.

증강↔자동화 진동은 기술 채택의 보편적 패턴일 수 있다

증강이 다시 자동화를 앞선 것을 단순히 '반전'으로 읽으면 안 된다. 새로운 기능(파일 생성, 메모리, 스킬)이 출시될 때마다 사용자가 다시 탐색적·협업적 모드로 돌아가고, 숙달되면 다시 위임적 사용으로 이동하는 순환이 반복될 가능성이 크다. 이는 PC, 스마트폰, 클라우드 등 과거 기술 채택에서도 관찰된 패턴이다. 매 모델 업데이트와 제품 변화가 이 순환을 리셋하므로, 장기 추세보다 모델 세대별 추이를 분리 추적하는 것이 더 의미 있을 것이다.

병목 과업(Bottleneck Tasks)이 AI 시대의 새로운 희소 자원

CES 분석에서 σ < 1(과업이 보완재)일 때 생산성 효과가 급감하는 것은, AI가 아무리 빨라져도 AI가 못하는 과업이 전체 직업 생산성의 병목이 된다는 의미다. 교사의 대면 강의, 전기기사의 실제 배선, 미생물학자의 실험실 작업 — 이런 물리적·대인적·판단 집약적 과업이 AI 시대의 새로운 희소 자원이 된다. Gans & Goldfarb(2026)의 논문이 시사하듯, 이러한 병목 과업의 보유자는 오히려 임금 상승을 경험할 수 있다. 한국의 교육·직업 훈련 정책에도 함의가 크다: AI가 대체하기 어려운 병목 과업 역량을 강화하는 것이 핵심 전략이 될 수 있다.

교육의 거울 효과가 시사하는 '프롬프트 자본' 개념

프롬프트-응답 교육 수준 상관관계 0.92+는 단순한 기술적 발견이 아니다. 이는 AI 시대에 '프롬프트 자본(Prompt Capital)'이라는 새로운 형태의 인적 자본이 형성되고 있음을 시사한다. 전통적 인적 자본(교육, 경험)이 프롬프트 품질을 결정하고, 프롬프트 품질이 AI 지원의 질을 결정하며, 이것이 다시 생산성 이득의 크기를 결정하는 연쇄 구조다. 이는 AI의 혜택이 이미 교육받은 사람에게 불균형적으로 돌아가는 메커니즘이며, 전통적 SBTC(숙련 편향적 기술 변화)를 AI가 가속화할 수 있는 경로를 보여준다.

한국에 대한 함의: 상위 5개국에 포함된 의미

한국이 Claude.ai 사용 상위 5개국에 포함된다는 사실은 두 가지를 의미한다. 첫째, 한국 노동시장이 이 보고서의 발견들 — 과업 집중, 탈숙련화 가능성, 생산성 효과 — 에 직접적으로 노출되어 있다는 것이다. 둘째, 고소득·고교육 국가로서 증강적 AI 사용 비율이 높고 프롬프트 품질도 높을 가능성이 크지만, 이는 동시에 고숙련 과업이 먼저 대체될 위험도 의미한다. 한국의 IT 인력 비중, 교육 수준, GDP를 고려하면 미국 내 분석 패턴이 상당 부분 적용될 수 있으며, 한국형 AI 경제 지수 개발과 직업별 영향 시뮬레이션이 시급하다.

보고서가 말하지 않는 것: 질적 작업 경험의 변화

이 보고서는 과업의 시간, 복잡도, 성공률 같은 정량적 차원에 집중하지만, AI가 근무 경험의 질(quality of work experience)을 어떻게 바꾸는지는 다루지 않는다. 기술 작가가 분석·검토라는 '창조적' 과업을 잃고 스케치·관찰이라는 '수동적' 과업만 남을 때, 직업 만족도와 의미감은 어떻게 변하는가? 교수가 연구와 채점이라는 지적 과업을 잃고 강의 전달과 교실 관리만 남을 때, 학문적 정체성은 유지되는가? 이러한 질적 차원은 정량적 생산성 분석으로 포착되지 않지만, 노동자 복지와 사회적 수용에 결정적 영향을 미칠 것이다.