Skip to main content

이 문서에서 하는 것

  • Knowledge Base에서 문서를 어디에 어떻게 올리고, 인덱싱 상태와 프리뷰를 어디서 확인하는지 흐름을 정리해.

업로드 전 선택 (모드 카드)

  • 간편 업로드: 자동 청킹·검색 파라미터로 빠르게 인덱싱. 테스트용 파일은 이 모드로 시작.
  • 고급 설정: URL 크롤링, chunk_size/overlap, embedding 모델, top_k/threshold까지 직접 입력. 운영 값 확정 시 사용.

업로드 단계

  1. 파일 추가: 드래그 앤 드롭 또는 파일 선택 버튼. 여러 파일도 일괄 업로드 가능.
  2. (고급) URL 크롤링 옵션: 도메인 제한, 심층 크롤링, 중복 방지 스위치를 설정.
  3. (고급) 청킹/임베딩/검색 기본값: chunk_size, overlap, embedding 모델·dimension, top_k/threshold 초기값을 입력.
  4. 생성 시작: “지식베이스 생성”을 누르면 상태가 인덱싱 중으로 표시된다.

상태/로그 확인

  • 목록 패널: 파일 유형/상태 필터, 검색창으로 대상 문서를 바로 찾는다.
  • 진행 상태: 인덱싱 중/완료/실패 배지를 통해 큐 상태를 모니터링한다.
  • 재시도/취소: 실패 항목은 재시도, 불필요한 항목은 취소 또는 삭제 후 다시 올린다.

프리뷰와 검증

  • 문서 클릭 → 우측 패널에서 제목·섹션 트리·본문 하이라이트·출처 URL을 확인한다.
  • 업데이트된 파일은 최신/과거 버전 토글로 변화를 비교한다.
  • 프리뷰에서 깨지거나 중복된 섹션이 보이면 다시 업로드하거나 청킹 값을 조정한다.

빠른 점검 체크리스트

  • PDF 보호/암호 여부로 파싱이 막히지 않았는가?
  • 분량이 많은 파일은 max_chunks로 컨텍스트 폭주를 제한했는가?
  • 수업/조직별로 불필요한 자료가 섞이지 않도록 폴더·필터를 사용했는가?

다음 문서

  • /rag/chunking (청킹 전략과 테스트)
  • /rag/embeddings (임베딩 모델 선택)