Security & Governance · Plateer Labs

Layered Control

3가지 축으로 통제하는 다층 가드레일

XGEN의 통제 기능은 외부 가드 모델 기반 유해성 검토, 개인정보 탐지·마스킹, 금칙어 탐지·마스킹의 3가지 축으로 구성됩니다. 각 축은 독립적으로 켜고 끌 수 있으며, 탐지 이벤트는 항상 로그로 남습니다.

Guard Model

가드레일 모델

외부 가드 모델이 사용자 입력을 LLM에 전달하기 전에 유해성을 검토하고, 안전하지 않은 요청은 호출 전에 차단합니다.

PII Masking

개인정보 탐지·마스킹

휴대폰번호·주민등록번호·이메일·계좌번호 등 개인정보를 정규식 정책으로 탐지해 LLM 전달·문서 임베딩 전에 마스킹합니다.

Forbidden Words

금칙어 탐지·마스킹

조직이 정의한 금칙어를 정규식 정책으로 탐지·마스킹합니다. PII 마스킹 이후에 적용되어 중복 처리를 방지합니다.

Guard Model

유해한 요청은 LLM에 닿기 전에 차단

가드 모델은 워크플로우 Agent 노드에서 활성화되며, 사용자 입력을 LLM에 전달하기 전에 검사합니다. 안전하지 않은 요청으로 판단되면 LLM을 호출하지 않고 차단 메시지를 반환합니다.

탐지 카테고리

폭력성적 콘텐츠불법 행위개인정보자해/자살비윤리 행위정치적 민감 주제저작권 위반Jailbreak

정밀 필터링 모드

켜면 판단이 모호한(Controversial) 결과까지 차단 대상으로 봅니다. 끄면 명백히 위험한(Unsafe) 요청만 차단합니다.

보안 우선 운영 (fail-open)

가드 모델 호출이 실패했을 때의 정책을 선택합니다. 보안 우선 환경에서는 통과 옵션을 꺼서, 장애 시에도 차단 정책으로 운영할 수 있습니다.

Data Protection

개인정보와 금칙어를 원문에서 지운다

PII·금칙어 정책은 정규식 기반으로 동작하며, 정책명·정규식 패턴·활성 여부·마스킹 문자열·정책 버전으로 관리됩니다. 워크플로우 실행 시에는 개인정보 마스킹 후 금칙어 마스킹을 적용해, 먼저 가려진 영역이 다시 처리되지 않도록 합니다.

워크플로우 Agent 실행 시

LLM에 전달하기 전 사용자 입력 텍스트에 마스킹을 적용합니다. 내부 프레임(시스템 라벨·JSON 키)이 있는 경우, 사용자 입력 값 부분에만 적용해 구조를 보존합니다.

문서 업로드 시

업로드 전 사전검사로 정책과 매칭되는 항목을 보여주고, 선택한 정책만 실제 업로드·임베딩 전에 마스킹합니다.

OCR 사용 시

OCR로 추가 추출된 텍스트에도 개인정보 보충 마스킹을 수행합니다.

사전 탐지 (detect-only)

사용자가 텍스트를 전송하기 전에, 서버가 정규식 패턴을 노출하지 않고 개인정보·금칙어 포함 여부만 판별해 경고를 보여줍니다. 실제 마스킹이나 로그 적재 없이 입력 단계에서 위험을 미리 알립니다.

Audit & Compliance

모든 통제 이벤트를 감사 가능하게

PII·금칙어·가드 모델에 의해 탐지·차단된 이벤트는 통합 정책 이벤트 로그에 기록됩니다. 출처·정책 유형·사용자· 워크플로우·컬렉션·기간으로 필터링해 조회할 수 있고, 정책의 생성·수정·삭제도 변경 이력과 버전으로 남습니다.

탐지 출처

워크플로우 Agent · 실행 메타 · Guarder · 문서 업로드 · 문서 OCR 보충

정책 유형

PII · 금칙어 · Guarder

매칭 정보

매칭된 정책 ID·정책명·탐지 건수·샘플 원문 및 마스킹 결과

실행 컨텍스트

워크플로우 ID · 실행 ID · 상호작용 ID · 노드 ID

대상 정보

컬렉션명 · 문서명

사용자/세션

사용자 정보 · 세션 ID · 생성 시각

AI Risk Governance

워크플로우의 위험을 등급으로 관리

AI 위험도 등급 정책은 실시간 마스킹이 아니라, 워크플로우와 AI 서비스의 위험을 평가하기 위한 기준 정책입니다. 네 가지 원칙을 토대로 위험을 4단계로 구분해 통제 수준을 정합니다.

기본 원칙

합법성 원칙 — 관련 법규 및 규제 준수
신뢰성 원칙 — 결과의 정확성 및 일관성 확보
신의성실 원칙 — 공정하고 책임 있는 운영
보안성 원칙 — 데이터 보호 및 보안 통제

위험도 4등급

초고위험 — 최상위 위험 수준 — 별도 통제 및 승인 절차 필요
고위험 — 높은 위험 수준 — 강화된 모니터링 대상
중위험 — 중간 위험 수준 — 일반 통제 적용
저위험 — 낮은 위험 수준 — 기본 통제 적용

FAQ

자주 묻는 질문

XGEN의 가드레일은 어떤 계층으로 구성되나요?

외부 가드 모델 기반 유해성 검토, 정규식 기반 PII(개인정보) 탐지·마스킹, 금칙어 탐지·마스킹의 3가지 축으로 구성됩니다. 여기에 전송 전 사전 탐지(detect-only), 통합 감사 로그, AI 위험도 등급 정책이 거버넌스 계층으로 더해집니다.

개인정보 마스킹은 어느 시점에 적용되나요?

워크플로우 Agent가 LLM을 호출하기 전, 문서를 업로드·임베딩하기 전, 그리고 OCR로 추출한 텍스트에 각각 적용됩니다. 정규식 정책으로 탐지하며, 전체 기능 토글이 켜져 있을 때 실제 마스킹이 수행됩니다.

가드 모델에 장애가 생기면 어떻게 되나요?

'장애 시 안전 통과(fail-open)' 옵션으로 운영 정책을 선택할 수 있습니다. 보안 우선 환경에서는 이 옵션을 꺼서, 가드 모델 장애 시에도 요청을 차단하는 정책으로 운영할 수 있습니다.

통제 이벤트는 감사에 활용할 수 있나요?

PII·금칙어·가드 모델에 의해 탐지·차단된 이벤트는 통합 정책 이벤트 로그에 기록되며, 출처·정책 유형·사용자·워크플로우·컬렉션·기간으로 필터링해 조회할 수 있습니다. 정책의 생성·수정·삭제도 변경 이력과 버전으로 남습니다.

Trusted Enterprise AI

검증 가능한 통제 위에서 AI를 운영합니다

데이터 주권과 규제 준수가 필요한 금융·공공 환경을 전제로, 온프레미스에서도 동일한 통제 정책을 적용합니다. 도입 검토나 보안 요건 협의가 필요하시면 언제든 문의해 주세요.

보안 요건 · 도입 문의

선언한 대로 통제되는 Enterprise AI

3가지 축으로 통제하는 다층 가드레일

Guard Model

PII Masking

Forbidden Words

유해한 요청은 LLM에 닿기 전에 차단

탐지 카테고리

정밀 필터링 모드

보안 우선 운영 (fail-open)

개인정보와 금칙어를 원문에서 지운다

워크플로우 Agent 실행 시

문서 업로드 시

OCR 사용 시

사전 탐지 (detect-only)

모든 통제 이벤트를 감사 가능하게

워크플로우의 위험을 등급으로 관리

기본 원칙

위험도 4등급

자주 묻는 질문

XGEN의 가드레일은 어떤 계층으로 구성되나요?

개인정보 마스킹은 어느 시점에 적용되나요?

가드 모델에 장애가 생기면 어떻게 되나요?

통제 이벤트는 감사에 활용할 수 있나요?

검증 가능한 통제 위에서 AI를 운영합니다