AIP 사용 사례: AWS Log Analytics AI Agent

2025년 11월 3일

AWS Log Analytics AI Agent 시끄러운 클라우드 원격 측정 데이터를 명확하고 실행 가능한 인사이트로 변환합니다. 엔지니어는 콘솔을 오가며 복잡한 쿼리를 작성하는 대신, 자연어로 질문합니다—“지난 1시간 동안 API Gateway의 5xx 급증 표시”, “IAM 변경 사항과 S3 액세스 거부 상호 연관”, 또는 “마지막 배포 후 Lambda 오류율이 급증한 이유는?”—그러면 에이전트가 결과를 검색, 상호 연관 및 설명합니다.

Model Context Protocol (MCP) 통합과 함께 QueryPie AI의 AI Platform (AIP)에서 실행되는 이 에이전트는 CloudWatch Logs Insights, CloudTrail, VPC Flow Logs, ALB/NLB 로그, RDS, Lambda, API Gateway 및 OpenSearch의 애플리케이션 로그와 같은 AWS 관측 가능성 소스에 연결됩니다. 서비스와 타임라인 전반에 걸쳐 이벤트를 연결하고, 이상치와 아웃라이어를 강조하며, 다음 단계를 제안합니다. 적절한 경우 전체 감사 추적과 함께 승인 및 액세스 정책을 존중하여 인시던트를 열고, Slack/Teams에 요약을 게시하고, Jira 티켓을 생성하거나 자동화된 런북을 트리거할 수 있습니다.

주요 기능은 다음과 같습니다:

  • 자연어 로그 쿼리

    • 쿼리 구문을 작성하지 않고 CloudWatch, CloudTrail 및 OpenSearch에 걸쳐 질문하기

  • 교차 서비스 상관 관계

    • 배포 이벤트와 함께 Lambda, API Gateway, ALB 및 다운스트림 데이터베이스 전반의 급증 및 오류 연결

  • 이상 탐지 및 요약

    • 비정상적인 패턴을 표면화하고 타임라인 및 영향을 받는 리소스가 포함된 간결한 인시던트 요약 생성

  • 보안 및 규정 준수 조사

    • 사용자 속성과 함께 IAM 정책 변경, 실패한 인증 및 의심스러운 액세스 패턴 추적

  • 워크플로 오케스트레이션

    • 승인과 함께 인시던트 열기, 채널 알림, 증거 첨부 및 런북 또는 롤백 트리거

이 사용 사례는 파편화된 AWS 로그를 일관된 내러티브와 안내된 작업으로 변환하여 탐지 및 복구의 평균 시간을 단축합니다. SRE, DevOps 및 보안 팀은 관측 가능성을 위한 통합된 대화형 인터페이스를 얻는 반면, 플랫폼 거버넌스, 권한 및 감사는 QueryPie AIP 내에서 엔드투엔드로 시행됩니다.