Track 2. AI Infrastructure/Financial AI Arch

[The Blueprint - AI 금융 아키텍처 설계 (4/7)] "기억" 설계: 통합 데이터 뷰와 RAG

Context Lab 2025. 11. 14. 12:45

"The Blueprint"의 네 번째 설계 여정에 오신 것을 환영합니다.

 

지난 [3/7]에서는 AI Agent가 실시간 신호를 인지하는 '신경망(P3, EDA)'을 설계했습니다 . 하지만 Agent가 "고객의 잔액 부족"이라는 이벤트(신호)를 받았을 때, 이 고객이 "지난달에도 이런 일이 있었는지", "주거래 상품이 무엇인지"와 같은 **'맥락(Context)'**이나 **'기억(Memory)'**이 없다면 올바른 다음 행동(예: '대출 권유' vs '저축 해지')을 추론할 수 없습니다 .

 

이번 장에서는 **[원칙 4: 분산 데이터를 하나의 통합 뷰로 제공하라]**는 원칙을 기반으로 , AI Agent의 '장기 기억장치' 역할을 할 **'통합 데이터 뷰(Unified Data View)'**를 설계합니다 .

원칙 4: 왜 "기억"이 필요한가?

AI Agent는 결국 데이터에 기반하여 '추론'합니다 . '원칙 4'는 AI가 현명한 판단을 내리는 데 필요한 모든 데이터를, 데이터가 어디에 저장되어 있든 상관없이, '단일화된 논리적 뷰(Unified Logical View)'로 제공해야 함을 의미합니다 .

AI에게 '기억'을 제공하는 것은, AI가 앵무새가 아닌 진정한 '전문가'로 행동하게 만드는 핵심입니다.

 

현실의 챌린지: 흩어진 "기억"

 

금융사의 데이터, 즉 AI의 '기억'은 한곳에 모여있지 않고 복잡하게 흩어져 있습니다.

  1. 계정계 (OLTP): '지금 이 순간'의 거래 데이터 (예: 실시간 잔액, 이체 내역)
  2. 정보계 (OLAP): '과거'의 분석 데이터 (예: 6개월간의 입출금 패턴, 신용 등급)
  3. 비정형 (Unstructured): '지식' 데이터 (예: 신규 대출 상품 매뉴얼, 약관, 컴플라이언스 규정집)

[설계 이슈 4] AI Agent가 이 3가지 유형의 흩어진 데이터를 어떻게 '하나의 단일 뷰'로 실시간 접근할 수 있을까요?

특히, AI가 규정집 같은 '비정형 문서'의 내용을 어떻게 이해하고 답변에 활용하게 할 수 있을까요?

 

해결 전략: "가상화"와 "RAG"

 

이 '흩어진 기억' 문제를 해결하기 위해, 우리는 데이터의 성격에 따라 두 가지 다른 전략을 조합해야 합니다.

 

1. 솔루션 1: 데이터 가상화 (Data Virtualization) - 정형 데이터 통합

 

첫 번째는 정형화된 '계정계(OLTP)'와 '정보계(OLAP)' 데이터를 통합하는 전략입니다 .

  • What: Denodo, Trino(Presto)와 같은 '데이터 가상화(Data Virtualization)' 솔루션입니다 .
  • How: 이는 두 시스템의 데이터를 물리적으로 복제(ETL)하여 또 다른 DB를 만드는 것이 아닙니다 . 대신, AI Agent에게는 '논리적인 단일 뷰' API(GET /unified-view/customer-A)만 제공합니다 .
  • Result: AI Agent가 이 API를 호출하면, 가상화 엔진이 실시간으로 계정계와 정보계에서 데이터를 조회하여 '즉시 조합된' 결과를 반환합니다 . Agent는 데이터가 원래 어디 있었는지 알 필요가 없습니다.

 

2. 솔루션 2: RAG (Retrieval-Augmented Generation) - 비정형 데이터 활용

 

두 번째는 AI가 '상품 매뉴얼'이나 '규정집' 같은 비정형 텍스트를 이해하게 만드는 전략입니다 .

  • What: 'RAG(Retrieval-Augmented Generation)' 아키텍처입니다 .
  • How:
  • Result: AI가 상상력으로 답하는 '환각(Hallucination)'을 방지하고 , 오직 '사실(Fact)'에 기반한 정확한 금융 정보를 제공하도록 강제할 수 있습니다 .

 

"기억"과 "통제"의 연결

 

물론 이 '통합 데이터 뷰' 역시 **[원칙 1: 통제]**의 대상입니다 . 'A 고객'을 담당하는 AI Agent는 오직 'A 고객'의 '기억'만 접근해야 합니다. '데이터 가상화'와 'RAG' 설계에는, AI Agent의 신원(Identity)에 따라 접근 가능한 데이터 범위를 제한하는 엄격한 '데이터 접근 제어(Data Access Control)'가 반드시 적용되어야 합니다 .


다음 이야기: "두뇌"를 설계합니다

지금까지 우리는 AI Agent가 살아갈 '대지(P5, 플랫폼)', 명령을 내릴 '정문(P2, API)', 실시간 신호를 받을 '신경망(P3, EDA)', 그리고 판단의 근거가 될 '기억(P4, 데이터)'을 모두 설계했습니다 .

 

모든 기반이 갖춰졌습니다. 하지만 이 모든 것을 지휘하고 통제하며, "어떤 상황에, 어떤 기억을 바탕으로, 어떤 정문을 통해, 어떤 명령을 내릴지"를 결정하는 핵심, 즉 **'두뇌(The Brain)'**가 빠져있습니다 .

 

다음 [The Blueprint 5/7]에서는 이 시리즈의 핵심인 **[원칙 1: 통제]**를 기반으로 , 이 모든 컴포넌트를 총괄하는 '중앙 통제 센터(The Brain)', 즉 **'AI Agent Orchestrator'**를 설계합니다 .