학습 데이터 구조

이 페이지는 2024년 11월부터 실계좌, 실시간 암호화폐 거래 운영에서 수집된 데이터를 기반으로 하며, AI 의사결정의 추적, 감사, 재현 가능성을 확보하기 위해 설계된 데이터 구조를 설명합니다.

왜 필요한가

암호화폐 거래 AI는 단순한 결과 예측을 넘어서, 실제 운영 중인 의사결정의 추적·감사·재현이 가능해야 합니다. NoahAI는 실거래 환경에 맞춰 모든 판단을 데이터로 남겨 투명성과 신뢰성을 확보합니다.

누가 읽어야 하나

본 구조는 실계좌 기반 운영을 전제로 설계되었으며, 기술 검증·확장·감사에 공통으로 활용 가능한 기준 구조입니다.

실제 운영 기반 데이터 흐름

  • 실시간 시장 정보 수집 (가격, 변동성, 오더북)
  • AI 의사결정 생성 (신호, 신뢰도, 가드레일 적용)
  • 주문 실행 피드백 (체결, 슬리피지, 거부 여부)
  • 거래 후 검토 및 학습 루프

핵심은 "기록의 표준화"입니다.

판단/맥락/결과를 동일한 스키마로 남겨야 복기 가능, 학습 가능, 감사/추적 가능, 사용자 신뢰 확보가 가능합니다. 아래는 CareLog-like Schema로 설계된 주요 데이터 구조입니다.

DecisionLog

의사결정 로그

필드명타입설명
decision_idUUID고유 결정 ID
timestampTIMESTAMP결정 시점
strategySTRING선택된 전략
actionENUM액션 타입 (BUY/SELL/HOLD)
reasoningJSON판단 근거 (패턴, 신호, 가중치)
confidenceFLOAT신뢰도 점수 (0-1)
model_versionSTRING사용된 AI 모델 버전

MarketSnapshot

시장 데이터 스냅샷

필드명타입설명
snapshot_idUUID고유 스냅샷 ID
timestampTIMESTAMP스냅샷 시점
symbolSTRING거래 심볼
priceDECIMAL현재 가격
volumeDECIMAL거래량
volatilityDECIMAL변동성 지표
orderbook_depthJSON오더북 깊이 데이터
market_signalsJSON감지된 시장 신호

AccountSnapshot

계정 상태 스냅샷

필드명타입설명
snapshot_idUUID고유 스냅샷 ID
timestampTIMESTAMP스냅샷 시점
balanceDECIMAL잔고
positionsJSON현재 포지션 목록
leverageDECIMAL레버리지 비율
margin_usedDECIMAL사용 중인 마진
unrealized_pnlDECIMAL미실현 손익

RiskEvent

리스크 이벤트

필드명타입설명
event_idUUID고유 이벤트 ID
timestampTIMESTAMP이벤트 시점
risk_typeENUM리스크 유형 (LOSS_LIMIT/VOLATILITY/LEVERAGE/ANOMALY)
severityENUM심각도 (LOW/MEDIUM/HIGH/CRITICAL)
trigger_valueDECIMAL트리거 값
action_takenSTRING취해진 조치
guardrail_appliedBOOLEAN가드레일 적용 여부

ExecutionResult

실행 결과

필드명타입설명
execution_idUUID고유 실행 ID
decision_idUUID연결된 결정 ID
timestampTIMESTAMP실행 시점
order_typeENUM주문 유형 (MARKET/LIMIT/STOP)
quantityDECIMAL수량
executed_priceDECIMAL실행 가격
slippageDECIMAL슬리피지
feeDECIMAL수수료
statusENUM상태 (PENDING/FILLED/PARTIAL/CANCELLED/FAILED)

XAITrace

XAI 추적 로그

필드명타입설명
trace_idUUID고유 추적 ID
decision_idUUID연결된 결정 ID
timestampTIMESTAMP추적 시점
explanationTEXT의사결정 설명 (사람이 읽을 수 있는 형태)
evidenceJSON근거 데이터 (패턴, 신호, 통계)
confidence_breakdownJSON신뢰도 세부 분석
alternative_optionsJSON고려되었지만 선택되지 않은 옵션들

학습 데이터 구조 예시

아래 예시는 실제 운영 중인 구조를 이해하기 쉽게 단순화한 예시입니다.

실제 사용되는 학습 데이터 구조는 다음과 같습니다:

{
  "ai_learning_data": {
    "decision_history": [
      {
        "timestamp": "2025-01-26T10:30:00Z",
        "asset_type": "crypto",
        "decision": "long_entry",
        "reasoning": {
          "signal_strength": 0.85,
          "pattern": "bull_flag",
          "market_conditions": "high_volatility"
        },
        "confidence": 0.9,
        "tp": 50000,
        "sl": 48000,
        "exchange": "Binance",
        "execution_status": "filled",
        "result": "profit_target_hit"
      }
    ],
    "conversation_patterns": {
      "common_questions": [
        "거래소 입금 방법",
        "암호화폐 출금 절차",
        "API 키 설정",
        "거래 수수료 안내"
      ],
      "response_effectiveness": {
        "step_by_step_guide": 0.95,
        "simple_language": 0.92
      }
    },
    "user_satisfaction_metrics": {
      "comprehension_rate": 0.88,
      "task_completion_rate": 0.85
    }
  }
}

이 구조는 실시간 암호화폐 거래 의사결정, 실행 상태 추적, 시장 상황 반영 학습을 지원합니다.

스키마 설계 원칙

  • 표준화: 모든 판단/맥락/결과가 동일한 형식으로 기록되어 복기 가능
  • 추적 가능성: 각 레코드가 고유 ID와 타임스탬프를 가져 시간순 추적 가능
  • 연결성: DecisionLog, ExecutionResult, XAITrace 등이 서로 연결되어 전체 흐름 추적
  • 익명화: 개인 식별 정보 없이 패턴 단위로 학습하여 집단 학습 가능
  • 확장성: 새로운 필드 추가가 기존 구조를 깨뜨리지 않도록 JSON 필드 활용

데이터 사용 예시

거래 패턴 유사성 검증

과거 암호화폐 거래 패턴과 현재 시장 상황을 비교하여 유사한 패턴에서의 성과를 분석하고, 진입 전 패턴 검증을 통한 리스크 관리에 활용됩니다.

시장 국면별 임계값 조정

변동성 급증, 횡보장, 추세장 등 시장 국면에 따라 신뢰도 및 리스크 임계값을 동적으로 조정하여 최적의 의사결정을 지원합니다.

가드레일 효과 및 손실 방지

가드레일 적용 결과와 최대 낙폭을 분석하여 정책 개선과 리스크 관리 전략 최적화에 반영합니다.