개방형 가중치 모델에 대한 보상 함수 설정

보상 함수는 응답 품질을 평가하고 모델 훈련을 위한 피드백 신호를 제공합니다. 사용자 지정 Lambda 함수를 사용하여 보상 함수를 설정할 수 있습니다. 작업 요구 사항에 맞는 접근 방식을 선택합니다.

보상 평가를 위한 사용자 지정 Lambda 함수

사용자 지정 Lambda 함수를 사용하여 보상 함수를 설정할 수 있습니다. Lambda 함수 내에서 평가 로직을 구현하는 방법에 유연성이 있습니다.

목표 작업 - 코드 생성 또는 수학 추론과 같은 목표 작업의 경우 알려진 표준 또는 테스트 사례에 대한 정확성을 확인하는 검증 가능한 규칙 기반 그레이더를 사용합니다.
주관적 작업 - 지침 준수 또는 챗봇 상호 작용과 같은 주관적 작업의 경우 Amazon Bedrock 파운데이션 모델을 Lambda 함수 내의 판사로 호출하여 기준에 따라 응답 품질을 평가합니다.

Lambda 함수는 작업 요구 사항에 따라 복잡한 로직을 구현하거나, 외부 APIs 통합하거나, 다단계 계산을 수행하거나, 여러 평가 기준을 결합할 수 있습니다.

사용자 지정 Lambda 함수를 사용하는 경우:

사용자 지정 Lambda 보상 함수를 구현할 때 함수는 다음 형식으로 데이터를 수락하고 반환해야 합니다.

설계 지침

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

데이터 준비

미세 조정 작업 생성