표의 금액 단위는 $USD/1M tokens이며, 공급사 공지 기준입니다.
OpenAI
| 모델 | 입력 단가 | 출력 단가 | 메모 |
|---|---|---|---|
| GPT-5 mini | $1.00 | $4.00 | 차세대 경량 모델, 저지연 멀티턴 대화용 |
| GPT-4o | $5.00 | $15.00 | 균형 잡힌 품질·속도, 일반 업무 기본값 |
| GPT-4o mini | $0.15 | $0.60 | 경량 요금제로 실험·대량 호출에 적합 |
| GPT-3.5 Turbo | $0.50 | $1.50 | 레거시 호환성 유지, 단순 채팅·요약용 |
| o1 mini | $3.00 | $12.00 | 추론형 작업, 강사용 평가·채점 시 권장 |
Anthropic
| 모델 | 입력 단가 | 출력 단가 | 메모 |
|---|---|---|---|
| Claude 3.5 Sonnet | $3.00 | $15.00 | 코드 생성·분석에 강점, 평가용으로 적합 |
| Claude 3 Haiku | $0.25 | $1.25 | 빠른 응답과 저비용, 대화형 실습 기본값 |
| 모델 | 입력 단가 | 출력 단가 | 메모 |
|---|---|---|---|
| Gemini 2.5 Flash | $0.50 | $1.50 | 최신 멀티모달 플래시, 짧은 지연과 경제성 |
| Gemini 1.5 Pro | $3.50 | $10.50 | 멀티모달 컨텍스트 길이 지원 |
| Gemini 1.5 Flash | $0.35 | $1.05 | 대량 배치·모니터링 이벤트 처리용 |
Cohere
| 모델 | 입력 단가 | 출력 단가 | 메모 |
|---|---|---|---|
| Command R+ | $3.00 | $15.00 | RAG 지향, 인출된 컨텍스트 해석에 강점 |
| Command R | $0.50 | $1.50 | 빠른 RAG 호출 및 채팅 위주 실습 |
활용 팁
- 실습/과제 시나리오: 학습자 실습은
GPT-4o mini또는Claude 3 Haiku로 비용을 최소화하고, 채점·피드백 단계에서GPT-4o나Claude 3.5 Sonnet으로 전환합니다. - 프로젝트/프로덕션: 처리량이 큰 파이프라인(배치 평가, 로그 분석)은
Gemini 1.5 Flash나Command R로 시작한 뒤, 품질이 필요한 구간에만 상위 모델을 섞어 사용합니다. - 예산 가드레일: 토큰 한도(입력/출력)와 세션별 총액 기준을 함께 설정해 예기치 않은 초과 사용을 방지하세요.
