데이터 주권과 AI Runtime을 위한 핵심 기반 아키텍처
데이터 주권, 보안, 감사 추적, 조직 거버넌스를 보장하는
폐쇄망 · 온프레미스 친화 아키텍처
지식 · 추론 · 실행 · 운영을 하나의 체계로 연결하는
Enterprise AI Runtime의 참조 아키텍처
/ Design Principles
아키텍처 설계 원칙
엔터프라이즈 환경에서 AI를 신뢰하고 운영하기 위해 모든 계층이 공유하는 네 가지 설계 기준입니다
근거 기반 응답
기업이 보유한 문서·규정·지식 모델에 근거해 답변하고, 근거가 없으면 판단 불가를 선언해 환각을 최소화합니다
데이터 주권
클라우드 종속 없이 고객 인프라에서 운영하며, 금융·공공·제조의 망분리 환경까지 지원합니다
조합 가능성
Agent · Workflow · Knowledge · Tool을 모듈화해 업무 목적에 따라 자유롭게 재조합합니다
모델 중립 · 거버넌스
목적·비용·정확도에 따라 LLM을 선택하고, 정책·승인·감사 추적으로 운영을 통제합니다
/ Reference Architecture
Enterprise AI 아키텍처
접근 채널부터 모델·인프라까지, 신뢰할 수 있는 Enterprise AI를 구성하는 전체 계층 구조
워크플로우 오케스트레이션 Workflow Orchestration
공유 오케스트레이션 Shared Orchestration
Public / General LLM
Private / Enterprise LLM
Cloud
On-premise / Private Cloud 폐쇄망 / 온프레미스 친화
/ XGEN Platform
XGEN 2.0 플랫폼 아키텍처
웹 · 확장 · SDK 클라이언트부터 API Gateway, 마이크로서비스, 데이터 계층까지 — GitOps로 운영되는 컨테이너 기반 Enterprise AI 플랫폼
인증 · 세션 · 설정 · 데이터 허브
LangGraph DAG · 멀티에이전트 · SSE 실행
추출 · 청킹 · 하이브리드 임베딩 · 벡터 검색 · 온톨로지
MCP 서버 관리 · JSON-RPC 도구 실행
vLLM GPU 추론 · 멀티 HW 자동 감지
12-Stage 선언형 에이전트 SDK
모든 요청은 API Gateway에서 인증 · 라우팅되어 각 마이크로서비스로 전달되며, 워크플로우 · 지식검색 · 도구실행 · 모델추론이 하나의 클러스터에서 협력합니다. 온프레미스 · 폐쇄망 배포를 기본 지원합니다.
/ Code Assistant
코드 어시스턴트 아키텍처
자연어 질문 · 코드 검색 요청을 인덱싱과 하이브리드 검색, AI 재정렬로 처리해 근거 있는 코드 답변을 제공합니다
- 소스 코드 수집 · 전처리
- 인덱싱 · 임베딩
- 키워드 검색 (BM25)
- 벡터 유사도 검색
- AI 재정렬 (Re-rank)
- LLM 답변 생성
/ CI/CD
GitOps 배포 파이프라인
소스 변경부터 운영 반영까지 — 컨테이너 이미지 빌드와 선언형 GitOps 동기화로 통제된 배포를 수행합니다
GitOps · 선언형
Git이 단일 진실 공급원 — 매니페스트로 클러스터 상태를 정의하고 동기화
통제된 릴리스
브랜치 + MR 필수(main 직접 push 금지) · 수동 sync로 배포 시점 통제
온프레미스 · 폐쇄망
이미지 export/import로 에어갭 이전 · 사이트별 환경 분리(dev/stg/prd)
관측성
Prometheus · Grafana로 배포 후 상태 · 로그 · 트레이스 모니터링
