View a markdown version of this page

콘텐츠 도메인 5: 테스트, 검증 및 문제 해결 - AWS Certified Generative AI Developer - Professional

콘텐츠 도메인 5: 테스트, 검증 및 문제 해결

작업 5.1: GenAI용 평가 시스템 구현

  • 기술 5.1.1: 포괄적인 평가 프레임워크를 개발하여 기존 ML 평가 접근 방식을 넘어서는 FM 출력의 품질 및 효과 평가(예: 관련성, 사실적 정확성, 일관성 및 유창성에 대한 지표 사용)

  • 기술 5.1.2: 체계적인 모델 평가 시스템을 구축하여 최적의 구성 파악(예: Amazon Bedrock Model Evaluations, FM의 A/B 테스트 및 카나리 테스트, 다중 모델 평가, 토큰 효율성, 지연 시간 대비 품질 비율, 비즈니스 성과 측정을 위한 비용 성능 분석 사용)

  • 기술 5.1.3: 사용자 경험을 기반으로 FM 성능을 지속적으로 개선하기 위한 사용자 중심 평가 메커니즘 개발(예: 피드백 인터페이스, 모델 출력용 등급 시스템, 응답 품질 평가를 위한 주석 워크플로 사용)

  • 기술 5.1.4: FM에 대한 일관된 성능 표준을 유지하는 체계적인 품질 보증 프로세스 만들기(예: 지속적 평가 워크플로, 모델 출력에 대한 회귀 테스트, 배포를 위한 자동화된 품질 게이트 사용)

  • 기술 5.1.5: FM 출력에 대해 다양한 관점에서 철저한 평가를 보장하는 포괄적인 평가 시스템 개발(예: RAG 평가, 평가형 LLM 기술을 사용한 자동 품질 평가, 사람의 피드백 수집 인터페이스 사용)

  • 기술 5.1.6: 검색 품질 테스트를 구현하여 FM 증강을 위한 정보 검색 구성 요소 평가 및 최적화(예: 관련성 점수 매칭, 컨텍스트 매칭 검증, 검색 지연 시간 측정 사용)

  • 기술 5.1.7: 에이전트가 정확하고 효율적으로 작업을 수행할 수 있도록 에이전트 성능 프레임워크 개발(예: 작업 완료율 측정, 도구 사용 효율성 평가, Amazon Bedrock Agent 평가, 다단계 워크플로의 추론 품질 평가 사용)

  • 기술 5.1.8: 포괄적인 보고 시스템을 만들어 FM 구현을 위해 이해 관계자에게 성과 지표와 인사이트를 효과적으로 전달(예: 시각화 도구, 자동화된 보고 메커니즘, 모델 비교 시각화 사용)

  • 기술 5.1.9: FM 업데이트 중에 신뢰성을 유지하기 위한 배포 검증 시스템 만들기(예: 합성 사용자 워크플로, 할루시네이션 비율 및 시맨틱 드리프트에 대한 AI 관련 출력 검증, 응답 일관성 보장을 위한 자동화된 품질 검사 사용)

작업 5.2: GenAI 애플리케이션 문제 해결

  • 기술 5.2.1: 콘텐츠 처리 문제를 해결하여 필요한 정보가 FM 상호 작용에서 완전히 처리되도록 설정(예: 컨텍스트 창 오버플로 진단, 동적 청킹 전략, 프롬프트 설계 최적화, 잘림 관련 오류 분석 사용)

  • 기술 5.2.2: FM 통합 문제를 진단하고 해결하여 GenAI 서비스와 관련된 API 통합 문제 식별 및 해결(예: 오류 로깅, 요청 검증, 응답 분석 사용)

  • 기술 5.2.3: 프롬프트 엔지니어링 문제를 해결하여 기본적인 프롬프트 조정 이상의 FM 응답 품질 및 일관성 개선(예: 프롬프트 테스트 프레임워크, 버전 비교, 체계적 개선 사용)

  • 기술 5.2.4: 검색 시스템 문제를 해결하여 FM 증강을 위한 정보 검색 효과에 영향을 미치는 문제 식별 및 해결(예: 모델 응답 관련성 분석, 임베딩 품질 진단, 드리프트 모니터링, 벡터화 문제 해결, 청킹 및 전처리 개선, 벡터 검색 성능 최적화 사용)

  • 기술 5.2.5: 즉각적인 유지 관리 문제를 해결하여 FM 상호 작용의 성능 지속적으로 개선(예: 템플릿 테스트 및 CloudWatch Logs를 사용하여 프롬프트 혼동 문제 진단, X-Ray를 사용하여 즉각적인 관찰성 파이프라인 구현, 형식 불일치를 탐지하기 위한 스키마 검증, 체계적인 프롬프트 개선 워크플로 사용)