Skip to main content

용도

  • GrowFit 문서 전반에 등장하는 핵심 개념을 빠르게 확인할 수 있는 참고용 용어집입니다.
  • UI 메뉴와 API 요청에서 동일하게 쓰는 이름을 기준으로 정리했습니다.

핵심 개념

  • Practice Session: 하나의 질문 세트를 여러 모델·파라미터 조합으로 실행해 결과, 비용, 지연시간을 비교하는 실험 단위. 세션별 실행 로그와 토큰/latency/비용 메트릭을 함께 기록한다.
  • Knowledge Base (RAG): 업로드한 문서를 청킹→임베딩→검색→재랭킹해 응답 근거를 제공하는 공간. RAG ON/OFF, top-k/threshold/rerank 조합을 좌·우 비교 카드로 테스트한다.
  • Agent: 시스템 프롬프트와 few-shot 예시로 정의한 역할/스타일 템플릿. 클래스 단위로 공유하거나 포크(fork)하여 개인화할 수 있으며, Practice나 API 호출에서 바로 선택해 적용한다.
  • Style Preset: 톤·길이 등 응답 스타일을 미리 정의한 프리셋. temperature/top_p와 함께 사용해 답변 일관성을 높인다.
  • Evaluation(평가): 동일 질문 세트의 응답을 정확도/가독성/근거성 기준으로 비교하는 단계. 강사용 평가 루브릭(partner/evaluation-rubric)과 함께 사용한다.

RAG 파라미터

  • Chunk Size / Overlap: 업로드한 문서를 잘게 나누는 크기와 겹침 범위. 너무 작으면 근거가 쪼개지고, 너무 크면 컨텍스트 비용과 노이즈가 증가한다.
  • Embedding 모델: 청킹된 텍스트를 벡터로 변환하는 모델. dimension을 설정하며, 모델에 따라 검색 품질과 비용이 달라진다.
  • top-k: 검색 시 상위 몇 개의 문서를 응답 컨텍스트로 넣을지 결정하는 값. 높일수록 근거가 늘지만 비용과 latency가 증가한다.
  • Threshold: 검색 점수가 특정 값 이하인 결과를 걸러내는 컷오프. 노이즈를 줄이는 대신 과도하게 높이면 관련 근거가 사라질 수 있다.
  • Rerank: 1차 검색 결과를 재정렬해 상위 품질 근거를 우선시하는 단계. 정확도 상승 효과가 있으나 추가 토큰/지연 비용이 발생한다.

모델·비용 용어

  • Provider / Model Name: OpenAI, Anthropic, Google 등 공급사와 모델명을 조합해 선택한다. Practice와 Agents에서 동일하게 사용한다.
  • TTFT (Time to First Token): 첫 토큰이 나올 때까지 걸린 시간. 응답 지연의 체감도에 직접 영향을 주는 지표로, 모델/프롬프트 길이에 따라 달라진다.
  • Latency: 요청 시작부터 응답 완료까지의 총 소요 시간. TTFT와 생성 구간을 모두 포함한다.
  • Token (Prompt / Completion): 입력(prompt)과 출력(completion)에서 사용한 토큰 수. 총 토큰이 비용과 직결되며, 긴 프롬프트나 few-shot 예시가 있을수록 증가한다.
  • Estimated Cost: 모델별 토큰 단가와 세션의 토큰 사용량으로 계산한 추정 비용. 실제 청구는 공급사 요율 변동이나 할인 정책에 따라 달라질 수 있다.

운영

  • Roles & Permissions: 운영자, 강사, 학습자 등 역할에 따라 접근 가능한 메뉴와 API 범위를 구분하는 정책. Ops 탭의 roles-permissions 문서에서 상세 정의한다.
  • Class LLM Profile: 강사가 수업 단위로 묶어 두는 모델/파라미터/프롬프트 설정 세트. 동일 수업의 실습이 일관된 결과를 내도록 재사용한다.
  • Budgets / Guardrails: 세션·사용자·클래스 단위로 토큰 한도와 금액 상한을 설정해 초과 사용을 방지하는 운영 도구.
  • Monitoring & Logs: 요청별 토큰/latency/cost 기록을 집계해 이상치를 탐지하고, 실습 품질을 추적하는 대시보드.

UI & 워크플로우

  • Practice 비교 카드: 좌/우로 다른 모델·파라미터를 설정해 실시간으로 결과를 비교하는 UI. RAG/Agent/Style Preset을 조합할 수 있다.
  • Knowledge Base 업로드 모드: 간편 업로드(기본)와 고급 설정 두 가지 모드. 파일·URL 추가 후 인덱싱 상태를 확인한다.
  • API Reference: FastAPI 기반 OpenAPI 스펙을 노출한 문서 섹션. 인증, 사용자/파트너/운영자 엔드포인트를 포함한다.
  • Model Cost 탭: 공급사별 주요 모델의 입력·출력 토큰 단가를 정리한 페이지. 실습·배포 전에 예산을 가늠하는 용도로 활용한다.