연구 주요 참여자 프로필
이 연구는 Anthropic의 Societal Impacts 팀이 주도했다. 프로젝트를 이끈 핵심 인물들의 배경을 살펴본다.
어떻게 8만 명의 목소리를 들었나
2025년 12월, Claude.ai 계정을 보유한 모든 사용자에게 Anthropic Interviewer — 대화형 인터뷰를 진행하도록 프롬프팅된 Claude 버전 — 와의 인터뷰 참여를 초대했다. 인터뷰어는 AI에 대한 희망과 우려를 묻는 고정 질문 세트를 제시한 뒤, 답변에 따라 후속 질문을 적응적으로 조정했다.
이 접근법은 질적 연구의 고질적 트레이드오프인 '깊이 vs. 규모'를 돌파한다. 개방형 인터뷰의 풍부한 맥락을 유지하면서도 80,508명이라는 전례 없는 규모를 달성했다. 이는 기존 최대 질적 연구였던 USC 쇼아 재단 시각 역사 아카이브(약 6만 명)와 세계은행 '빈곤의 목소리' 프로젝트(약 6만 명)를 넘어서는 수치다.
대량의 데이터를 분석하기 위해 Claude 기반 분류기(classifier)를 구축하여 각 대화를 다차원적으로 분류했다. AI에 대한 기대는 응답자당 하나의 주된 범주(primary category)로, 우려 사항은 다중 레이블(multi-label)로 분류했다. 응답자들은 평균 2.3개의 서로 다른 우려를 표현했기 때문이다.
참여 전 응답 데이터가 연구에 활용될 수 있음을 고지받았으며, 모든 응답은 비식별화(de-identified) 처리 후 소규모 연구팀이 분석했다. 발표용으로 선정된 인용문에 대해서는 추가적인 수동 검토를 통해 잠재적 식별 정보를 제거했다.
"마법 지팡이를 흔들 수 있다면, AI가 무엇을 해주길 바라나요?"
Claude가 각 응답자의 개방형 답변에서 가장 핵심적인 비전을 식별하고 분류한 결과, 아홉 가지 주요 범주가 도출되었다.
아홉 가지 범주는 겉보기에 다양하지만, 그 아래에는 놀랍도록 인간적인 욕구가 흐르고 있다. 약 3분의 1은 AI가 현재의 부담을 덜어줘서 삶의 여유(시간·돈·인지 자원)를 만들어주길 원한다. 4분의 1가량은 더 의미 있는 일을 하기 위한 업무 향상을, 5분의 1은 배우고·치유하고·성장하는 자기 발전을 꿈꾼다.
흥미로운 점은 많은 응답자가 처음에는 '생산성 향상'을 언급하다가, 인터뷰어가 "그 비전이 실현되면 무엇이 가능해지나요?"라고 더 깊이 물었을 때 다른 본질적 욕구가 수면 위로 올라왔다는 것이다. 이메일 자동화 → 가족과 더 많은 시간 보내기, 업무 효율화 → 책 더 읽기 — 생산성은 그 자체가 아니라 삶의 질을 위한 수단이었다.
AI가 이미 실현하고 있는 것
자신이 바라는 비전을 향해 AI가 이미 한 걸음이라도 내디뎠는지 물었을 때, 81%가 그렇다고 답했다.
인지적 파트너십(17.2%), 학습(9.9%), 정서적 지지(6.1%) 응답에서 공통적으로 언급된 AI의 핵심 속성은 세 가지였다: 인내심, 항시 가용성, 판단 부재.
기술 접근성(8.7%)에서는 특히 장벽 돌파에 관한 이야기가 인상적이었다. 비개발자가 3주 만에 청각 장애인을 위한 영상 편집 프로그램을 만든 한국인 응답자, 20년간 정육점을 운영하다 AI로 사업을 시작한 칠레인 등 — AI가 단순한 속도 향상이 아닌 가능성 자체의 확장으로 기능하고 있었다.
전쟁 속에서의 AI
가장 극단적인 사례 중 하나는 우크라이나 사용자들의 이야기였다. 전통적 지지 체계가 붕괴되거나 접근 불가능한 상황에서 AI가 그 빈자리를 채우는 모습이 반복적으로 관찰되었다.
희망과 두려움의 다섯 가지 긴장
사람들이 AI에서 원하는 것과 두려워하는 것은 별개가 아니라 밀접하게 얽혀 있다. 연구진은 직접 경쟁하는 이익과 피해가 반복적으로 논의되는 다섯 가지 긴장을 발견했다. 같은 역량이 혜택도 만들고 해악도 만든다. 그리고 놀랍게도 이 긴장은 서로 다른 사람들 사이가 아니라, 동일한 사람 안에서 공존한다.
AI 학습 혜택을 언급한 응답자의 91%는 실제 경험에 기반했지만, 인지력 퇴화 우려를 표현한 응답자 중 46%만이 직접 경험한 것이었다. 교육자들은 학생들의 인지력 퇴화를 평균의 2.5~3배 더 자주 목격했다. 반면 자발적 학습자(기술자, 자영업자)에게서는 퇴화 신호가 거의 나타나지 않았다 — 자발적 학습 vs. 제도적 학습에서 AI의 효과가 갈린다.
다섯 긴장 중 유일하게 부정적 측면이 긍정적 측면을 압도하는 항목이다. 양쪽 모두 직접 경험에 깊이 뿌리박혀 있다. 변호사의 거의 절반이 AI 불신뢰성을 직접 경험했지만, 동시에 의사결정 혜택 경험률도 가장 높았다. AI에 가장 많이 의존하는 사람이 가장 많이 배신당하기도 한다.
전체 응답의 22%만이 언급했지만, 빛과 그림자의 동시 출현 빈도가 가장 높은(기저율 대비 3배) 긴장이다. 정서적 지지에서 가치를 발견한 사람들은 자신의 비전이 실현되는 것을 두려워했다 — 원하는 것을 얻으면 너무 의존적이 될 수 있다는 걱정이었다.
시간 절약은 가장 많이 언급된 혜택(전체 50%)이지만, 19%는 검증 부담이나 업무 기대치 상승으로 오히려 시간을 잃고 있다고 우려했다. 프리랜서와 자영업자가 양쪽 모두를 가장 많이 동시에 언급했다.
가장 추측적이고, 빛과 그림자의 동시 출현이 가장 약한 긴장이다. 경제적 혜택은 독립적 근로자(기업가, 소상공인)에게 극도로 편중되어 있다 — 이들의 47%가 실질적 경제적 역량 강화를 보고한 반면, 기관 소속 직원은 14%에 불과했다. 프리랜서 크리에이터는 혜택(23%)과 위태로움(17%)이 거의 상쇄되는 유일한 집단이다.
세계 각지에서 바라보는 AI
전 세계적으로 응답자의 67%가 AI에 대해 순긍정적(net positive) 감정을 표현했다. 그러나 지역별로 뚜렷한 차이가 존재한다.
AI 긍정 감정: 소득 수준과의 상관관계
남미, 아프리카, 아시아 대부분 지역이 유럽이나 미국보다 AI를 더 긍정적으로 바라본다. 사하라 이남 아프리카(18%), 중앙아시아(17%), 남아시아(17%)에서 "우려 없음" 응답 비율이 가장 높았는데, 이는 북미(8%), 오세아니아(8%), 서유럽(9%)의 약 2배에 달한다.
일자리와 경제에 대한 우려가 AI 감정의 가장 강력한 예측 변수였다. 부유한 지역일수록 경제적 우려가 높고 AI 감정이 덜 긍정적인 반면, 저·중소득 지역은 그 반대 패턴을 보였다.
지역별 비전의 차이
부유하고 AI에 더 많이 노출된 지역은 AI가 삶의 복잡성을 관리해주길 원하는 반면, 개발도상국은 AI가 더 많은 기회를 창출해주길 원했다. 구체적으로 살펴보면:
창업 비전은 아프리카, 남·중앙아시아, 중동, 중남미에서 가장 강하게 공명했다. 이 지역에서 AI는 자본 우회 장치(capital bypass mechanism)로 인식된다.
학습 비전은 중앙아시아(14%)와 남아시아(13%)에서 글로벌 평균(8%)을 크게 상회했다. 교사 부족, 지식 독점, 전통 교육의 비용 장벽이 주된 이유로 꼽혔다.
삶 관리 비전은 북미와 오세아니아 등 서구 선진국에서 가장 높았는데, 이들은 "시간 빈곤이 아닌 인지적 희소성"을 겪고 있다고 묘사했다.
동아시아는 개인적 변화(19%, 전 지역 최고)와 재정적 독립(15%, 전 지역 최고)에서 두드러졌다. 한국 응답자들은 재정적 독립을 개인 소비가 아닌 부모 노후 돌봄과 사랑하는 사람의 행복 보장에 명시적으로 연결하는 경향이 있었다.
AI에 대한 13가지 우려
약 11%가 우려를 표현하지 않았지만, 평균적으로 응답자들은 2.3개의 서로 다른 우려를 제기했다. 희망이 '더 나은 삶'이라는 단일 방향으로 수렴했다면, 우려는 더 다양하고 구체적이었다.
핵심 용어 정리
| 용어 | 설명 |
|---|---|
| Anthropic Interviewer 앤트로픽 인터뷰어 |
대화형 인터뷰를 수행하도록 프롬프팅된 Claude 버전. 고정 질문 + 적응형 후속 질문으로 깊이와 규모를 동시에 달성. |
| 질적 연구 Qualitative Study |
통계 수치가 아닌 개방형 응답·인터뷰·서사를 통해 '왜'를 탐구하는 연구 방법론. 이 연구는 AI를 도구로 활용하여 질적 연구를 전례 없는 규모로 확장. |
| 다중 레이블 분류기 Multi-label Classifier |
하나의 응답에 여러 범주를 동시에 부여할 수 있는 분류 시스템. 응답자들이 여러 우려를 동시에 표현하기 때문에 우려 분류에 사용. |
| 인지적 스캐폴딩 Cognitive Scaffolding |
계획, 기억, 과제 수행 등에서 외부적 구조적 지원을 제공하는 것. 특히 실행 기능(executive function) 어려움이 있는 사람들이 AI를 이 목적으로 활용. |
| 빛과 그림자 Light and Shade |
연구진이 명명한 개념으로, AI의 동일한 역량이 혜택과 해악을 동시에 만들어내는 얽힘 현상. 낙관론자 vs. 비관론자가 아닌, 한 개인 안에서의 양면성. |
| 리커트 척도 Likert Scale |
태도를 정량적으로 측정하기 위한 척도. 이 연구에서는 AI에 대한 전반적 감정을 1~7점으로 평가하여 순긍정(5점 이상) 비율을 산출. |
| 아첨 Sycophancy |
AI가 사용자에게 지나치게 동조하고 비판 없이 동의하는 경향. 응답자의 10.8%가 이를 우려로 꼽았으며, Claude가 자신의 왜곡된 인식을 강화했다는 고백도 있었다. |
| 환상적 생산성 Illusory Productivity |
AI로 시간을 절약했으나, 검증 부담 증가나 업무 기대치 상승으로 실질적 시간은 줄지 않는 현상. |
주요 주장 검증
검증: 연구진이 참고한 기존 최대 질적 연구는 USC 쇼아 재단 시각 역사 아카이브와 세계은행 '빈곤의 목소리' 프로젝트로, 각각 약 6만 명 규모다. 80,508명은 이를 상당히 초과하며, 70개 언어라는 다언어적 범위도 전례가 없는 것으로 보인다. 다만 '질적 연구'의 정의 범위에 따라 논란의 여지가 있을 수 있다 — AI 인터뷰어를 활용한 대화가 전통적 질적 연구 방법론의 기준을 충족하는지에 대한 학계 논의는 아직 초기 단계다.
맥락: 이 수치는 전체 인구가 아닌 기존 Claude 사용자 중 자발적으로 인터뷰에 참여한 이들의 응답이라는 점에서 선택 편향이 존재한다. Claude를 이미 유용하게 사용하고 있어 계정을 유지하는 사람들이 대상이므로, 일반 대중 조사보다 AI에 대해 더 긍정적일 가능성이 높다. 연구진도 이 한계를 부록에서 인정하고 있다. 참고로 Pew Research의 2024년 미국 일반인 대상 조사에서는 AI에 대한 우려가 흥분보다 더 높게 나타났다.
맥락: 연구진이 스스로 인정하는 한계점이다. 긍정 비전을 먼저 묻는 구조가 응답자들의 '빛과 그림자' 공존 패턴을 부추겼을 수 있다. 다만 연구진은 이 효과가 존재한다면 모든 긴장과 집단에 걸쳐 균일하게 나타나야 하는데, 실제로는 동시 출현율이 1.6~3.0배로 상당한 변동성을 보였다고 반론한다.
검증: 이는 Anthropic 연구에 국한된 발견이 아니라, 글로벌 기술 채택 연구에서 반복 관찰되는 패턴과 일치한다. 예컨대 Edelman Trust Barometer에서도 개발도상국이 혁신 기술에 더 높은 신뢰를 보이는 경향이 확인된다.
이 연구가 진짜 말해주는 것, 그리고 말하지 않는 것
이 연구의 가장 강력한 기여는 데이터 자체가 아니라, '어떻게 물었는가'라는 방법론의 혁신이다. 기존 설문조사는 연구자가 미리 설정한 선택지 안에서 답을 고르게 하여, 사람들이 실제로 무엇을 생각하는지보다 연구자가 무엇을 물었는지에 의해 결과가 결정되는 한계가 있었다. AI 인터뷰어는 이 틀을 깨고, 각 개인의 답변에 맞춰 후속 질문을 적응시킴으로써 '생산성 향상' 뒤에 숨어 있던 '가족과의 시간'이라는 진짜 욕구를 끌어냈다. 이것은 사회과학 연구 방법론의 패러다임 전환이 될 수 있다.
그러나 이 연구가 갖는 구조적 한계도 직시해야 한다. 80,508명은 인상적인 숫자지만, 이들은 모두 이미 Claude를 사용하고 있는 사람들이다. AI를 사용하지 않는 사람, 사용해봤지만 별 가치를 느끼지 못하고 떠난 사람, 접근 자체가 불가능한 사람의 목소리는 여기에 없다. 이는 "AI를 사용하는 사람들이 AI에 대해 어떻게 느끼는가"에 대한 연구이지, "인류가 AI에 대해 어떻게 느끼는가"에 대한 연구가 아니다. 이 구분은 결정적으로 중요하다.
또 하나 주목할 점은 '빛과 그림자' 프레임워크의 정치적 함의다. 이 프레임은 AI의 혜택과 해악을 하나의 연속체 위에 놓음으로써, "혜택이 해악을 정당화할 수 있다"는 논리의 씨앗을 뿌린다. 물론 연구진은 이런 주장을 하지 않지만, 이 프레임이 AI 기업의 자기 서사에 얼마나 편리한지는 생각해볼 필요가 있다. "사용자들이 두려움과 희망을 동시에 가지고 있다"는 결론은, "그러니까 개발을 멈출 이유는 없다"로 전용될 수 있다.
가장 인상적인 발견은 자발적 학습과 제도적 학습에서의 AI 효과 차이다. 직업 훈련이나 독학으로 AI를 사용하는 사람들(기술자, 트럭 운전사, 자영업자)에게서는 학습 혜택이 압도적이고 인지력 퇴화 신호가 거의 없었지만, 교육 현장에서는 교사들이 학생들의 인지력 퇴화를 평균의 2.5~3배 더 자주 목격했다. 이것은 AI가 본질적으로 인지력을 퇴화시킨다는 것이 아니라, 동기 구조(motivation structure)가 AI의 효과를 결정한다는 것을 시사한다. AI 교육 정책의 핵심은 AI 접근을 제한하는 것이 아니라, 내재적 동기를 촉진하는 환경을 만드는 것이어야 한다.
마지막으로, 이 연구는 Anthropic이라는 AI 기업이 자사 제품의 사용자를 대상으로, 자사의 AI를 도구로 활용하여 수행한 연구라는 점을 기억해야 한다. 이것이 연구의 가치를 부정하지는 않지만, 관점의 한계를 설정한다. 진정한 다음 단계는 AI를 사용하지 않거나 못하는 사람들의 목소리를 같은 깊이로 듣는 것이다.