Back to Portfolio
Audit-Tech RAG Personal Project

K-IFRS 1115 회계감사 AI 어시스턴트

환각(Hallucination)을 방지하는 도메인 특화 RAG 파이프라인

K-IFRS 1115 수익인식 기준서 분석 도구 메인 화면

K-IFRS 1115 서비스 메인 화면

Project Overview

기준서 원문과 회계 지식을 통해 생성한 Decision Tree를 기반으로
자유 추론을 허용하지 않는 답변을 생성하는 도메인 특화 RAG 시스템입니다.

핵심 포인트

Decision Tree

정해진 Case 분기 내에서만 결론 도출, AI 자의적 추론 차단

PydanticAI 구조화 출력

AI 답변의 변동성 억제를 코드수준에서 강제함

근거 문서 하이브리드 검색 시스템

사전 배정 문서 직접 조회 + 약칭 자동 인식 + 가중치 적용

  • • (본문 1.3 / 감리지적 1.2 / BC 0.8) 등 상세 가중치 적용
  • • (예: "묶음 판매" → 복수의 수행의무, 거래가격 배분, 상대적 독립 판매 가격)

도메인 DATA 적재 + 요약 제공

1,575건의 데이터(1115호본문·적용사례·질의회신·감리사례) DB 적재
AI 호출 전에 SUMMARY와 함께 확인 가능

Split View 근거 추적

AI 답변과 인용 근거를 한 화면에서 동시 확인

왜 만들었나

AI 과대신뢰 문제 (2종 오류) <- 범용 LLM의 환각에 의해 발생
AI에게 자유 추론을 허락하지 않는 확정적 아키텍처가 필요

항목 일반 ChatGPT 이 시스템
답변 근거 학습 데이터에서 자유 추론 DB에 저장된 기준서 원문만 사용
근거 추적 어려움 (출처 불명) 문단 번호 단위로 추적
환각 방지 없음 5-Layer 파이프라인
결론 구조 자유형 텍스트 Decision Tree + Case 분기
정보 부족 시 근거 없이 단정 위험 조건부 결론으로 분기 제시
모델 단일 모델 듀얼 LLM 라우팅 (자동 선택)
품질 검증 없음 620회 체계적 테스트

환각 방지 5-Layer Pipeline

전 과정(데이터 적재 -> 최종 답변)을 통제하는 확정적(Deterministic) 아키텍처

5-Layer Data Pipeline

  1. 1 도메인 데이터 적재
    1115호 본문 및 관련 사례와 지적사례 1,575건을 DB에 저장
    (본문·적용사례·질의회신·감리사례·KAI교육·토픽큐레이션)
  2. 2
    핀포인트 + Reranker 검색
    • Tier 1 핀포인트 —사전 배정문서 ID로 DB 직접 조회. 검색 엔진 경유X → 핵심 근거 누락 0%
    • Tier 2 하이브리드 보충 — 약칭 자동 인식 + 가중치 적용(본문 1.3 / 감리지적 1.2 / BC 0.8)
    • Cohere Cross-encoder 재평가 — LLM을 통한 관련성 재평가
  3. 3
    듀얼 LLM 라우팅
    • Gemini Flash — 회계 추론 1위 (81%). 일반·상황 질문 전담
    • gpt-4.1-mini — 산술 정확도 1위 (100%). 계산 질문 전담
  4. 4 Decision Tree 강제
    의사결정 트리로 AI 자의적 추론 차단
    정보 부족 시 임의 판단 대신 조건부 결론(Case 분기) 도출
  5. 5 PydanticAI 구조화 출력
    '근거'와 '결론' 분리를 코드 수준에서 강제

설계 한계 & 향후 발전 방향

대응 가능

  • 체크리스트 Q&A 응답
  • 추가 조건 제시 및 결론 확정
  • 개념 설명 · 계산 질문

대응 불가능

  • 최신 뉴스 검색
  • 지식 범위 밖의 신규 거래유형
  • 비교 회사 처리 방식 안내

왜 한계를 유지하는가?

유연성은 범용 LLM에 맡기고, 무결성에 집중.
자유도를 잃더라도 엄격한 제약을 유지하는 것이 프로젝트의 최우선 가치라고 판단.

향후 발전 방향

  • 타 기준서 확장: K-IFRS 1116호(리스), 1109호(금융상품) 등 별도 Decision Trees 구축
  • BIG4 가이드 임베딩: 삼일·삼정·안진·한영의 K-IFRS 1115 실무 가이드를 데이터에 추가
  • RAGAS 자동 평가: Faithfulness·Context Precision 등 자동 정량 평가 프레임워크 구축

System Architecture

Frontend Streamlit (스플릿 뷰 인터페이스)
Backend FastAPI + uvicorn + PydanticAI
Vector DB MongoDB Atlas (벡터 검색 + 메타데이터 필터링 + PDR)
Embedding Upstage Solar (한국어 특화)
LLM Gemini Flash (추론) + GPT-4.1-mini (계산)
Reranker Cohere 다국어 Cross-encoder
Infra Docker + docker-compose / Oracle Cloud