본문 바로가기

Infrastructure/Certificate

[SAA] Machine Learning

Machine Learning

이번 장에서는 SAA를 준비하며 AWS의 머신러닝 서비스에 대해서 알아보도록 한다.


Amazon Rekognition

  • ML을 사용하여 이미지 및 비디오에서 객체, 사람, 텍스트, 장면을 찾을 수 있다.
  • 사용자 확인을 위해 얼굴 분석 및 얼굴 검색, 사람 수 파악을 할 수 있다.
  • "친숙한 얼굴" 데이터베이스를 만들거나 유명인과 비교할 수 있다.
  • 라벨링, 내용 조절, 텍스트 감지, 얼굴 감지 및 분석(성별, 연령대, 감정 등), 얼굴 검색 및 확인, 유명인사 인지도, 경로 지정(예: 스포츠 경기 분석) 등에 사용된다.

Content Moderation

  • 부적절하거나 원치 않거나 불쾌감을 주는 컨텐츠를 탐지할 수 있다.(이미지 및 비디오)
  • 소셜 미디어, 방송 미디어, 광고 및 전자 상거래 상황에서 사용하여 보다 안전한 사용자 환경을 구축할 수 있다.
  • 플래그가 지정될 항목에 대한 최소 신뢰 임계값을 설정할 수 있다.
  • "Amazon Augmented AI(2AI)"를 통해 수동 검토를 위한 민감한 컨텐츠 플래그를 지정할 수 있다.
  • 규정을 준수하도록 지원할 수 있다.


Amazon Transcribe

  • 자동으로 음성을 텍스트로 변환한다.
  • "Automatic Speech Recognition(ASR)"이라는 딥 러닝 프로세스를 사용하여 빠르고 정확하게 음성을 텍스트로 변환할 수 있다.
  • Redaction을 사용하여 PII(Personal Identifiable Information)를 자동으로 제거한다.
  • 다국적 오디오 자동 언어 식별을 지원한다.
  • 고객 서비스 호출을 녹음, 폐쇄 자막 및 자막 자동화, 미디어 자산의 메다데이터 생성 및 검색 가능한 아카이브 생성 등에 사용된다.

Amazon Polly

  • 딥 러닝을 사용하여 텍스트를 실물과 같은 말로 변형한다.
  • 대화할 수 있는 응용프로그램을 생성할 수 있다.

Lexicon & SSML(Speech Synthesis Markup Language)

  • 발음 어휘를 사용하여 단어의 발음을 사용자 지정한다.
    • Stylized words: St3ph4ne => Stephane
    • Acronyms: AWS => "Amazon Web Service"
  • 어휘를 업로드하고 SynthesizeSpeech 작업을 한다.
  • 일반 텍스트 또는 SSML(Speech Synthesis Markup Language)로 표시된 문서에서 음성을 생성한다. 보다 많은 사용자 정의를 지원한다.
    • 특정 단어나 구를 강조할 수 있다.
    • 음성 발음을 사용할 수 있다.
    • 숨소리를 포함하거나, 속삭임을 포함할 수 있다.
    • 뉴스캐스터 화법으로 생성할 수 있다.

Amazon Translate

  • 자연스럽고 정확한 언어 변역을 지원한다.
  • "Amazon Translate"를 사용하면 해외 사용자를 위해 웹 사이트 및 응용 프로그램 등의 콘텐츠를 현지화할 수 있으며, 대량의 텍스트를 효율적으로 쉽게 변역할 수 있다.

Amazon Lex & Connect

  • Amazon Lex: (Alexa에게 힘을 주는 기술과 동일)
    • 음성을 텍스트로 변환하는 자동 음성 인식(ASR)
    • 문자, 발신자의 의도를 인식할 수 있는 자연어 이해
    • 챗봇, 콜센터 봇 구축에 도움을 준다.
  • Amazon Connect:
    • 전화 수신, 연락처 흐름 생성, 클라우드 기반 가상 연락처 센터
    • 다른 CRM 시스템이나 AWS와 통합할 수 있다.
    • 선불금이 없으며 기존 Contact Center보다 80% 저렴하다.


Amazon Comprehend

  • 자연어 처리용(NLP, Natural Language Processing)
  • 완전 관리형 서버리스 서비스다.
  • 기계 학습을 사용하여 텍스트에서 통찰력과 관계를 찾을 수 있다.
    • 텍스트 언어
    • 주요 문구, 장소, 사용자, 브랜드 또는 이벤트를 추출한다.
    • 텍스트가 얼마나 긍정적인지 또는 부정적인지 이해한다.
    • 토큰화 및 품사를 사용하여 텍스트를 분석한다.
    • 주제별로 텍스트 파일 모음을 자동으로 구성한다.
  • 사용 예시:
    • 고객 상호 작용(email)을 분석하여 긍정적 또는 부정적 경험을 유도하는 것을 찾는다.
    • 이해할 수 있는 주제별로 기사를 작성하고 그룹화한다.

Amazon Comprehend Medical

  • 비구조화된 임상 테스트 결과에서 유용한 정보를 감지하고 반환한다.
    • 의사 소견서
    • 배출 요약
    • 시험 결과
    • 사례 노트
  • NLP를 사용하여 PHI(Protected Health Information)을 탐지한다.
  • 문서를 "Amazon S3"에 저장하고, "Kinesis Data Firehose"로 실시간 데이터를 분석하거나, "Amazon Transcribe"를 사용하여 환자 설명을 "Amazon Comprehend Medical"에서 분석할 수 있는 텍스트로 전부 복사할 수 있다.

Amazon SageMaker

  • 개발자/데이터 사이언티스트가 ML 모델을 구축할 수 있도록 지원하는 완전 관리형 서비스다.
  • 일반적으로 모든 프로세스를 한 곳에서 수행하거나 프로비저닝 하는 것은 쉽지 않다.
  • 머신러닝 프로세스를 간소화하여 아래와 같이 시험 점수 예측과 같은 기능을 구현할 수 있다.


Amazon Forecast

  • ML을 사용하여 매우 정확한 예측을 제공하는 완전 관리형 서비스다.
  • 데이터 자체를 보는 것보다 50% 정도 정확도를 향상 시킬 수 있다.
  • 예측 시간을 몇 달에서 몇 시간으로 단축할 수 있다.
  • 제품 수요 계획, 재무 계획, 리소스 계획 등에 사용된다.
  • 아래의 이미지와 같이 "우비의 향후 판매"를 예측할 수 있다.


Amazon Kendra

  • 머신 러닝을 기반으로 한 완전 관리형 문서 검색 서비스다.
  • 문서 내에서 답변을 추출(텍스트, pdf, HTML, PowerPoint, MS Word, FAQ 등)할 수 있다.
  • 자연어 검색기능을 지원한다.
  • 사용자 상호 작용/피드백을 통해 학습하여 선호하는 결과를 촉진(Incremental Learning)할 수 있다.
  • 검색 결과를 수동으로 미세 조정하는 기능을 지원한다. (데이터의 중요성, 새로 고침, 사용자 지정 등)


Amazon Personalize

  • 실시간으로 맞춤형 추천을 제공하는 앱을 구축하기 위한 완전관리형 ML 서비스다.
  • 개인별 맞춤형 제품 추천/순위를 조정하거나, 맞춤형 마케팅을 할 수 있다.
    예를 들어, 정원 도구를 구매한 사용자에게 다음 구매 물건을 추천할 수 있다.
  • Amazon.com에서 사용하는 것과 동일한 기술이다.
  • 기존 웹 사이트, 애플리케이션, SMS, 이메일 마케팅 시스템 등과 통합된다.
  • 몇 달이 아닌 며칠 만에 구현할 수 있으며 ML 솔루션을 구축, 교육 및 배포할 필요가 없다.
  • 소매점, 미디어 및 엔터테인먼트 등에 사용된다.


Amazon Textract

  • AI 및 ML을 사용하여 스캔한 문서에서 텍스트, 필기 및 데이터를 자동으로 추출한다.

  • 양식 및 테이블에서 데이터를 추출한다.
  • 모든 유형의 문서(PDF, 이미지 등)를 읽고 처리한다.
  • 재무 서비스(송장, 재무 보고서 등), 의료(진료기록, 보험금 청구), 공공 부문(세금 양식, 신분증 문서, 여권) 등에 사용된다.

AWS 머신러닝 - 요약

  • Rekognition: 얼굴인식, 라벨링, 연예인 인식
  • Transcribe: 음성을 문자로 변환
  • Polly: 문자를 음성으로 변환
  • Translate: 번역
  • Lex: 대화형 봇 구축 - 챗봇
  • Connect: 클라우드 컨택 센터
  • Comprehend: 자연어 처리 프로세싱
  • SageMaker: 모든 개발자 및 데이터 과학자를 위한 기계 학습
  • Forecast: 매우 정확한 예측 구축
  • Kendra: ML 기반의 검색 엔진
  • Personalize: 실시간 개인화 추천
  • Textract: 문서에서 텍스트 및 데이터 탐지

참고한 자료

'Infrastructure > Certificate' 카테고리의 다른 글

[SAA] Advanced Identity  (0) 2023.10.04
[SAA] Monitoring & Audit & Performance  (0) 2023.10.04
[SAA] Data Analytics  (0) 2023.10.03
[SAA] Databases  (0) 2023.10.02
[SAA] Serverless Architectures  (0) 2023.10.02