작업 5.1: GenAI용 평가 시스템 구현 작업 5.2: GenAI 애플리케이션 문제 해결

콘텐츠 도메인 5: 테스트, 검증 및 문제 해결

작업 5.1: GenAI용 평가 시스템 구현

기술 5.1.1: 포괄적인 평가 프레임워크를 개발하여 기존 ML 평가 접근 방식을 넘어서는 FM 출력의 품질 및 효과 평가(예: 관련성, 사실적 정확성, 일관성 및 유창성에 대한 지표 사용)
기술 5.1.2: 체계적인 모델 평가 시스템을 구축하여 최적의 구성 파악(예: Amazon Bedrock Model Evaluations, FM의 A/B 테스트 및 카나리 테스트, 다중 모델 평가, 토큰 효율성, 지연 시간 대비 품질 비율, 비즈니스 성과 측정을 위한 비용 성능 분석 사용)
기술 5.1.3: 사용자 경험을 기반으로 FM 성능을 지속적으로 개선하기 위한 사용자 중심 평가 메커니즘 개발(예: 피드백 인터페이스, 모델 출력용 등급 시스템, 응답 품질 평가를 위한 주석 워크플로 사용)
기술 5.1.4: FM에 대한 일관된 성능 표준을 유지하는 체계적인 품질 보증 프로세스 만들기(예: 지속적 평가 워크플로, 모델 출력에 대한 회귀 테스트, 배포를 위한 자동화된 품질 게이트 사용)
기술 5.1.5: FM 출력에 대해 다양한 관점에서 철저한 평가를 보장하는 포괄적인 평가 시스템 개발(예: RAG 평가, 평가형 LLM 기술을 사용한 자동 품질 평가, 사람의 피드백 수집 인터페이스 사용)
기술 5.1.6: 검색 품질 테스트를 구현하여 FM 증강을 위한 정보 검색 구성 요소 평가 및 최적화(예: 관련성 점수 매칭, 컨텍스트 매칭 검증, 검색 지연 시간 측정 사용)
기술 5.1.7: 에이전트가 정확하고 효율적으로 작업을 수행할 수 있도록 에이전트 성능 프레임워크 개발(예: 작업 완료율 측정, 도구 사용 효율성 평가, Amazon Bedrock Agent 평가, 다단계 워크플로의 추론 품질 평가 사용)
기술 5.1.8: 포괄적인 보고 시스템을 만들어 FM 구현을 위해 이해 관계자에게 성과 지표와 인사이트를 효과적으로 전달(예: 시각화 도구, 자동화된 보고 메커니즘, 모델 비교 시각화 사용)
기술 5.1.9: FM 업데이트 중에 신뢰성을 유지하기 위한 배포 검증 시스템 만들기(예: 합성 사용자 워크플로, 할루시네이션 비율 및 시맨틱 드리프트에 대한 AI 관련 출력 검증, 응답 일관성 보장을 위한 자동화된 품질 검사 사용)

작업 5.2: GenAI 애플리케이션 문제 해결

기술 5.2.1: 콘텐츠 처리 문제를 해결하여 필요한 정보가 FM 상호 작용에서 완전히 처리되도록 설정(예: 컨텍스트 창 오버플로 진단, 동적 청킹 전략, 프롬프트 설계 최적화, 잘림 관련 오류 분석 사용)
기술 5.2.2: FM 통합 문제를 진단하고 해결하여 GenAI 서비스와 관련된 API 통합 문제 식별 및 해결(예: 오류 로깅, 요청 검증, 응답 분석 사용)
기술 5.2.3: 프롬프트 엔지니어링 문제를 해결하여 기본적인 프롬프트 조정 이상의 FM 응답 품질 및 일관성 개선(예: 프롬프트 테스트 프레임워크, 버전 비교, 체계적 개선 사용)
기술 5.2.4: 검색 시스템 문제를 해결하여 FM 증강을 위한 정보 검색 효과에 영향을 미치는 문제 식별 및 해결(예: 모델 응답 관련성 분석, 임베딩 품질 진단, 드리프트 모니터링, 벡터화 문제 해결, 청킹 및 전처리 개선, 벡터 검색 성능 최적화 사용)
기술 5.2.5: 즉각적인 유지 관리 문제를 해결하여 FM 상호 작용의 성능 지속적으로 개선(예: 템플릿 테스트 및 CloudWatch Logs를 사용하여 프롬프트 혼동 문제 진단, X-Ray를 사용하여 즉각적인 관찰성 파이프라인 구현, 형식 불일치를 탐지하기 위한 스키마 검증, 체계적인 프롬프트 개선 워크플로 사용)

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

콘텐츠 도메인 4: GenAI 애플리케이션을 위한 운영 효율성 및 최적화

시험에 출제될 수 있는 기술 및 개념