문제: 컨텍스트 윈도우는 기억이 아니다
현재 LLM은 지시문, 정체성, 대화 이력, 검색 문서를 하나의 미분화된 컨텍스트 윈도우에 뒤섞는다. Liu et al.(2024)은 LLM이 컨텍스트의 시작과 끝은 잘 활용하지만 중간부를 잃어버리는 U자형 성능 곡선을 보여주었다. Du et al.(2025)은 더 결정적인 증거를 제시했다: 완벽한 검색 조건에서도 컨텍스트 길이 자체가 성능을 최대 85%까지 저하시킨다.
경제적으로도 문제가 크다. 2026년 1분기 기준 100만 입력 토큰 처리 비용은 Gemini 2.5 Flash의 $0.30에서 Claude Opus 4.6의 $5.00까지 다양하다. 단순히 윈도우를 넓히는 것은 기억을 생산하지 못한다.
세 가지 핵심 원칙
원칙 1: 기억은 내용뿐 아니라 가치(Valence)를 가진다
배우자를 보면 20년치 에피소드 기억이 아니라 즉각적인 방향감—따뜻함, 개방성—과 우선순위 연상이 활성화된다. 이것이 감정적 가치 벡터(Valence Vector)의 역할이다. 수천 번의 상호작용을 이력 재생 없이 처리 방향을 잡아주는 압축 신호로 변환한다. 각 지식 그래프 노드는 감정 성분, 연상 포인터, 맥락 기록, 밀도 스칼라, 정밀도 스칼라(확신 스냅샷)의 5개 성분으로 구성된 벡터를 갖는다.
원칙 2: 검색은 System 1이 기본, System 2가 에스컬레이션
개념이 언급되면 감정적 가치 벡터가 O(1) 직접 조회로 즉시 가용하고, 확산 활성화(Spreading Activation)가 연관 에지를 통해 전파된다. "스위스 레스토랑"이 제네바 여행을 의도적 검색 없이 활성화하는 것과 같다. System 2는 그래프 밀도가 낮거나 신규성이 높거나 이해관계가 큰 경우에만 발동된다. 또한 검색 확신도를 정밀 일치→근사 일치→무기록의 연속적 스펙트럼으로 표현하여 환각(Hallucination)을 구조적으로 해결한다.
원칙 3: 인코딩은 능동적이고 현재 중심이며 피드백 의존적
시상 게이트웨이(Thalamic Gateway)가 모든 들어오는 정보에 6개 채널(주제 관련성, 감정 충전, 긴급성, 신규성, 출처 신뢰, 목표 친화성)의 현저성 점수를 즉시 태깅한다. 요지(Gist)는 수동적 노출이 아니라 호기심 주도 능동 조사를 통해 형성된다. 충분한 현저성이 없는 자극은 조사되지 않고 요지도 형성되지 않는다.
아키텍처 개요
고가중치 요지가 정체성으로 지속
전체 그래프 → 고비용 순회
정체성: Beck의 신념 위계에서 발현하는 것
심장내과 전문의는 매일 아침 전문지식을 다시 유도하지 않는다. 논문은 정체성을 별도의 분류 체계가 아닌 지식 그래프 내 요지의 가중치 분포에서 자연 발현하는 패턴으로 제안한다.
Beck(1976)의 인지행동치료 모델에서 관찰되는 세 수준—핵심신념 (Core Beliefs), 중간신념 (Intermediate Beliefs), 자동적 사고 (Automatic Thoughts)—은 별개의 저장 카테고리가 아니라 가중치 분포에서 나타나는 관찰 패턴이다.
극도로 높은 가중치를 가진 신념은 거의 모든 맥락에서 게이트웨이에 의해 선택되어 핵심신념처럼 기능한다. 이 요지들이 '자기'라는 개념을 참조하기 때문에—거의 모든 상호작용에서 활성화되는 개념—게이트웨이가 지속적으로 선택하게 되고, 명시적 영속성 규칙 없이도 작업 기억에 계속 남는다. 중간신념은 도메인별 가중치를 가져 관련 맥락에서만 활성화된다. 심장내과 전문의의 심방세동 프로토콜은 심장 진료 시 활성화되고 점심시간에는 빠진다.
기억 수정: 격변적 갱신(Cathartic Update)
요지는 한 번 형성되면 기본적으로 안정적이다. 이후의 일관된 경험은 에피소드로 축적되지만 요지 자체를 수정하지 않는다. 수정은 단일 메커니즘으로만 일어난다: 격변적 갱신 (Cathartic Update).
모순 증거가 기존 요지와 함께 충분한 강도로 작업 기억에 공존할 때, 시스템은 해당 모순이 수정을 정당화하는지 평가한다. 이것은 CBT에서의 치료적 변화와 병행한다—치료사는 신념을 직접 편집하지 않고, 환자의 System 2가 작업 기억 내에서 모순 증거와 대면하여 수정을 촉발하는 격변적 사건을 경험하도록 조건을 만든다.
7가지 기능 속성과 검증 가능한 예측
논문은 어떤 구현이든 충족해야 하는 7가지 기능 속성을 명시한다: 맥락 유동성(FP1), 실시간 태깅(FP2), System 1으로의 단조 수렴(FP3), 등급별 인식론적 자기인식(FP4), 발현적 가중치 위계로서의 정체성(FP5), 기본 안정·격변에 의한 갱신(FP6), 능동적 조사에 의한 형성(FP7). 또한 감정적 가치 프라이밍, 적응적 강직성, 다채널 현저성, 등급별 인식론적 상태, 실행 오버라이드, 능동 형성 우위, 경험 의존 효율 등 7가지 검증 가능한 예측을 제시한다.