추론 모델 평가
개요
추론 모델 지원을 사용하면 최종 응답을 생성하기 전에 명시적인 내부 추론을 수행하는 추론 가능 Nova 모델을 사용하여 평가할 수 있습니다. 이 기능은 reasoning_effort 파라미터를 통한 API 수준 제어를 사용하여 추론 기능을 동적으로 활성화하거나 비활성화함으로써 복잡한 분석 태스크에 대한 응답 품질을 개선할 수 있습니다.
지원되는 모델
-
amazon.nova-2-lite-v1:0:256k
레시피 구성
레시피의 inference 섹션에 reasoning_effort 파라미터를 추가하여 추론을 활성화합니다.
run: name: reasoning-eval-job-name # [MODIFIABLE] Unique identifier for your evaluation job model_type: amazon.nova-2-lite-v1:0:256k # [FIXED] Must be a reasoning-supported model model_name_or_path: nova-lite-2/prod # [FIXED] Path to model checkpoint or identifier replicas: 1 # [MODIFIABLE] Number of replicas for SageMaker Training job data_s3_path: "" # [MODIFIABLE] Leave empty for SageMaker Training job; optional for SageMaker HyperPod job output_s3_path: "" # [MODIFIABLE] Output path for SageMaker HyperPod job (not compatible with SageMaker Training jobs) evaluation: task: mmlu # [MODIFIABLE] Evaluation task strategy: zs_cot # [MODIFIABLE] Evaluation strategy metric: accuracy # [MODIFIABLE] Metric calculation method inference: reasoning_effort: high # [MODIFIABLE] Enables reasoning mode; options: low/high or null to disable max_new_tokens: 32768 # [MODIFIABLE] Maximum tokens to generate, recommended value when reasoning_effort set to high top_k: -1 # [MODIFIABLE] Top-k sampling parameter top_p: 1.0 # [MODIFIABLE] Nucleus sampling parameter temperature: 0 # [MODIFIABLE] Sampling temperature (0 = deterministic)
reasoning_effort 파라미터 사용
reasoning_effort 파라미터는 추론 가능 모델의 추론 동작을 제어합니다.
사전 조건
-
모델 호환성 -
model_type이 추론 가능 모델(현재amazon.nova-2-lite-v1:0:256k)을 지정하는 경우에만reasoning_effort를 설정함 -
오류 처리 - 지원되지 않는 모델과 함께
reasoning_effort를 사용하면ConfigValidationError: "Reasoning mode is enabled but model '{model_type}' does not support reasoning. Please use a reasoning-capable model or disable reasoning mode."에서 실패함
사용 가능한 옵션
| 옵션 | 동작 | 토큰 제한 | 사용 사례: |
|---|---|---|---|
| null(기본값) | 추론 모드 비활성화 | 해당 사항 없음 | 추론 오버헤드가 없는 표준 평가 |
| low | 제약 조건과의 추론 활성화 | 내부 추론을 위한 4,000개의 토큰 | 간결한 추론이 필요한 시나리오, 속도와 비용에 맞게 최적화 |
| 높음 | 제약 조건 없이 추론 활성화 | 내부 추론에 대한 토큰 제한 없음 | 광범위한 분석 및 단계별 추론이 필요한 복잡한 문제 |
| 훈련 방법 | 사용 가능한 옵션 | 구성 방법 |
|---|---|---|
| 지도 미세 조정(SFT) | 높음 또는 꺼짐만 | reasoning_enabled: true(high) 또는 reasoning_enabled: false(off) 사용 |
| 강화 미세 조정(RFT) | 낮음, 높음 또는 꺼짐 | reasoning_effort: low 또는 reasoning_effort: high를 사용합니다. 비활성화하려면 필드를 생략합니다. |
| 평가 | 낮음, 높음 또는 꺼짐 | reasoning_effort: low 또는 reasoning_effort: high를 사용합니다. 비활성화하려면 null을 사용합니다. |
추론을 활성화하는 경우
추론 모드(low 또는 high)를 사용하는 경우
-
복잡한 문제 해결 태스크(수학, 논리적 퍼즐, 코딩)
-
중간 추론이 필요한 다단계 분석 질문
-
자세한 설명 또는 단계별 사고로 정확도가 향상되는 태스크
-
응답 품질이 속도보다 우선되는 시나리오
비추론 모드(null 또는 파라미터 생략)를 사용하는 경우
-
간단한 Q&A 또는 실제 쿼리
-
창의적 쓰기 태스크
-
더 빠른 응답 시간이 중요한 경우
-
추론 오버헤드를 제외해야 하는 성능 벤치마킹
-
추론으로 태스크 성능이 개선되지 않는 경우 비용 최적화
문제 해결
오류: 'Reasoning mode is enabled but model does not support reasoning'
원인: reasoning_effort 파라미터가 null이 아닌 값으로 설정되었지만 지정된 model_type에서 추론을 지원하지 않습니다.
해결 방법:
-
모델 유형이
amazon.nova-2-lite-v1:0:256k인지 확인 -
다른 모델을 사용하는 경우 추론 가능 모델로 전환하거나 레시피에서
reasoning_effort파라미터를 제거합니다.