Plateer LabsBetaLABS

Architecture

Enterprise AI Architecture

신뢰할 수 있는 AI를 위한 엔터프라이즈 아키텍처

데이터 주권 · 보안 · 거버넌스를 지키는 폐쇄망 · 온프레미스 설계, 지식 · 추론 · 실행 · 운영을 하나로 잇는 Enterprise AI

데이터 주권과 AI Runtime을 위한 핵심 기반 아키텍처

데이터 주권, 보안, 감사 추적, 조직 거버넌스를 보장하는
폐쇄망 · 온프레미스 친화 아키텍처

지식 · 추론 · 실행 · 운영을 하나의 체계로 연결하는
Enterprise AI Runtime의 참조 아키텍처

/ Design Principles

아키텍처 설계 원칙

엔터프라이즈 환경에서 AI를 신뢰하고 운영하기 위해 모든 계층이 공유하는 네 가지 설계 기준입니다

근거 기반 응답

기업이 보유한 문서·규정·지식 모델에 근거해 답변하고, 근거가 없으면 판단 불가를 선언해 환각을 최소화합니다

데이터 주권

클라우드 종속 없이 고객 인프라에서 운영하며, 금융·공공·제조의 망분리 환경까지 지원합니다

조합 가능성

Agent · Workflow · Knowledge · Tool을 모듈화해 업무 목적에 따라 자유롭게 재조합합니다

모델 중립 · 거버넌스

목적·비용·정확도에 따라 LLM을 선택하고, 정책·승인·감사 추적으로 운영을 통제합니다

/ Reference Architecture

Enterprise AI 아키텍처

접근 채널부터 모델·인프라까지, 신뢰할 수 있는 Enterprise AI를 구성하는 전체 계층 구조

접근 채널
Unified Access
산업별 활용사례
E-Commerce
대고객 Chatbot
Public Sector
고객 상담
Finance
사고 예방
IT Services
법령/규정 검색
사용자 모드Console
사용자 모드
User Mode
개발자 모드
Developer Mode
관리자 모드
Admin Mode
데이터 소스
Structured Data
구조화 데이터
Unstructured Data
비정형 데이터
Enterprise Systems
ERP · CRM · HRM
External Sources
Web · API · 3rd Party
Enterprise AI Runtime지식 · 추론 · 실행 · 운영 통합 계층
지식Knowledge
Knowledge Base
지식 저장소
Vector DB
벡터 DB
Ontology
온톨로지
Document Store
문서 저장소
추론Reasoning
Model Orchestration
모델 오케스트레이션
RAG Engine
RAG 엔진
Guardrails
가드레일
실행Action
Tool & API
도구 / API 연동
Workflow Engine
워크플로우 엔진
Task Automation
작업 자동화
운영Operations
Monitoring
모니터링
Logging
로깅
Audit Trail
감사 추적

워크플로우 오케스트레이션 Workflow Orchestration

AI Deployment
배포 / 배치
Model Routing
모델 라우팅
Policy Enforcement
정책 적용
Response
응답 반환

공유 오케스트레이션 Shared Orchestration

Model Registry
모델 레지스트리
Prompt Hub
프롬프트 허브
Dataset Management
데이터셋 관리
Evaluation & Benchmarking
평가 & 벤치마킹
플랫폼 서비스Platform Services
LLM / ML Settings
설정 관리
On-demand GPU
온디맨드 GPU
Vector DB Connection
벡터 DB 연동
Data Pipeline
데이터 파이프라인
Observability
관측성
Security & Compliance
보안 & 규제 준수
Governance
거버넌스
모델 레이어Model Layer

Public / General LLM

ChatGPTClaudeGemini

Private / Enterprise LLM

XGEN LLMQwendeepseekPolarGemma
인프라Infrastructure

Cloud

AWSMicrosoft AzureGoogle Cloud

On-premise / Private Cloud 폐쇄망 / 온프레미스 친화

GPU
Container
Database
Storage

/ XGEN Platform

XGEN 2.0 플랫폼 아키텍처

웹 · 확장 · SDK 클라이언트부터 API Gateway, 마이크로서비스, 데이터 계층까지 — GitOps로 운영되는 컨테이너 기반 Enterprise AI 플랫폼

접근 채널Clients
웹 UI
Next.js · Agentflow Canvas
Chrome 확장
자연어 브라우저 제어
CLI · SDK
OAuth · 자동화
API Gateway단일 진입점
JWT 인증 · 모듈 기반 라우팅 · OpenAPI 집계 · WebSocket 프록시
코어 서비스Microservices
Core

인증 · 세션 · 설정 · 데이터 허브

Agent · Workflow

LangGraph DAG · 멀티에이전트 · SSE 실행

Knowledge · RAG

추출 · 청킹 · 하이브리드 임베딩 · 벡터 검색 · 온톨로지

MCP Tool Runtime

MCP 서버 관리 · JSON-RPC 도구 실행

Model Serving

vLLM GPU 추론 · 멀티 HW 자동 감지

Harness Runtime

12-Stage 선언형 에이전트 SDK

데이터 계층Data Layer
관계형 DB
PostgreSQL (HA)
캐시 · 세션
Redis 호환
벡터 DB
Qdrant
객체 스토리지
S3 호환
플랫폼 기반Platform
컨테이너 오케스트레이션 (k3s)
GitOps 배포 (ArgoCD)
온프레미스 · 폐쇄망 지원
관측성 (Prometheus · Grafana)

모든 요청은 API Gateway에서 인증 · 라우팅되어 각 마이크로서비스로 전달되며, 워크플로우 · 지식검색 · 도구실행 · 모델추론이 하나의 클러스터에서 협력합니다. 온프레미스 · 폐쇄망 배포를 기본 지원합니다.

/ Code Assistant

코드 어시스턴트 아키텍처

자연어 질문 · 코드 검색 요청을 인덱싱과 하이브리드 검색, AI 재정렬로 처리해 근거 있는 코드 답변을 제공합니다

사용자 (개발자)
자연어 질문 / 코드 검색 요청
API 서버
Async 처리
1
인덱싱 파이프라인
배치
  • 소스 코드 수집 · 전처리
  • 인덱싱 · 임베딩
Vector DB
Qdrant
2
하이브리드 검색
키워드 + 벡터
  • 키워드 검색 (BM25)
  • 벡터 유사도 검색
키워드 인덱스
BM25
3
AI 재정렬 · 답변
Re-rank + LLM
  • AI 재정렬 (Re-rank)
  • LLM 답변 생성
코드 그래프 DB
PostgreSQL
호출 / 의존 관계
통합 결과 제공
관련 코드 + 호출 / 의존 흐름 + AI 답변

/ CI/CD

GitOps 배포 파이프라인

소스 변경부터 운영 반영까지 — 컨테이너 이미지 빌드와 선언형 GitOps 동기화로 통제된 배포를 수행합니다

Source
브랜치 · MR
CI Build
BuildKit 멀티스테이지 이미지
Registry
컨테이너 이미지 저장
GitOps Sync
ArgoCD 수동 sync
Cluster
k3s · 앱/인프라 네임스페이스

GitOps · 선언형

Git이 단일 진실 공급원 — 매니페스트로 클러스터 상태를 정의하고 동기화

통제된 릴리스

브랜치 + MR 필수(main 직접 push 금지) · 수동 sync로 배포 시점 통제

온프레미스 · 폐쇄망

이미지 export/import로 에어갭 이전 · 사이트별 환경 분리(dev/stg/prd)

관측성

Prometheus · Grafana로 배포 후 상태 · 로그 · 트레이스 모니터링

Architecture · Plateer Labs