본문 바로가기

Infrastructure/Cloud Computing

[AWS] S3

관련 용어

  • 스토리지(storage): 컴퓨터에 데이터를 저장하는 저장소의 역할을 수행하는 부품이다. 컴퓨터의 하드디스크와 동일한 역할을 수행하는 부품이다. 이때 서버에 스토리지를 직접 연결하는 방식을 DAS(Direct Attached Storage)라고 한다. 대표적으로 NAS(Network Attached Storage)와 SAN(Storage Area Network)가 있다. NAS는 스토리지를 LAN(Local Area Network)으로 연결하여 사용하는 방식으로 비용이 저렴하다. SAN은 대구모 엔터프라이즈 환경을 구성하기 적합한 스토리지로 확장성이 높다.
  • 데이터 백업(Data Backup): 데이터가 손상되거나 유실되는 것을 대비하여 데이터를 다른 곳에 저장하는 것을 말한다. AWS에서 대표적으로 사용하는 백업은 EBS의 특정 상태를 저장하는 Snapshot과 AMI(Amazon Machine Image)를 생성하여 EC2 인스턴스의 상태를 저장하는 방식이 있다.
  • 스냅샷(Snapshot): 특정 시간에 스토리지의 상태를 별도의 파일이나 이미지로 저장하는 기술을 뜻한다. 이러한 기술을 사용하여 데이터를 원하는 시점의 상태로 되돌릴 수 있다. 일반적으로 데이터 보호 및 데이터 복제와 같은 작업을 위해서 수행된다. AWS에서는 EBS(Elastic Block Storage)에 대한 스냅샷을 이용하여 인스턴스의 상태를 백업/복원하거나 손쉽게 다른 인스턴스로 Migration할 수 있게 지원하고 있다.

S3란?

S3(Simple Storage Services)는 어디서나 원하는 양의 데이터를 검색할 수 있도록 구축된 객체 스토리지로 확장성이 뛰어나며 데이터를 무한대로 저장가능한 인터넷 기반 서비스다. 버킷(Bucket)이라는 리전(Region)내에서 고유한 영역을 생성하고 파일을 key-value 형식의 객체(Object)로 저장한다.

그림1

데이터를 저장한다는 점에서 EBS(Elastic Block Storage)와 유사해보이지만 서로가 서로를 대체할 수 없다. S3는 파일 단위의 접근만 지원하기 때문에 일반적인 하드디스크와 SSD처럼 사용할 수 없다. 또한 S3는 사용자가 파일에 접근하기 위해서 파일의 경로로 접근하는데 EBS로 이와같은 기능을 만들기 위해서는 개발자가 직접 인스턴스에 구현해주어야 한다.

S3의 주요 특징

  • 스토리지에 대한 선불 투자없이 사용 가능.(EC2와 같은 특징이다. 가장 중요한 특징이라고 생각된다.)
  • 2006년 출시된 "최초"의 AWS 서비스.
  • 객체(Object) 기반으로 무제한 용량의 파일을 저장 가능.
  • 객체가 저장되어 있는 경로를 URL로 제공하여 손쉽게 공유 가능.
  • 99.99999999999%(9가 11개)의 내구성.
  • 직접 웹 서버를 구축하지 않고 S3에 업로드하여 정적 웹 사이트 호스팅 가능.

S3 스토리지 클래스 종류
저장 여러 사용 사례에 맞게 설계된 4개의 스토리지 클래스를 제공하고 있다.

그림2

S3 객체의 수명주기에서 다른 스토리지 클래스로 전이(Transition)되는 주기는 사용자가 직접 설정 가능하다.

  • Amazon S3 Standard (무제한 저장 가능한 스토리지): 기본으로 선택되는 스토리지 클래스로 자주 액세스 하는 데이터를 관리하는데 적합하다.
  • Amazon S3 Standard IA (Infrequent Access): 데이터의 수명이 길고 액세스 빈도가 낮지만 빠른 액세스가 요구될 때 적합하다. 가격은 S3 Standard 대비하여 58%로 저렴하다.
  • Amazon S3 One Zone IA (Infrequent Access): Standard IA와 동일하지만 데이터가 중요하지 않을 때 적합하다. 단일 AZ에만 저장되기 때문에 데이터가 유실될 가능성이 있기 때문이다. Standard IA 대비하여 20%로 저렴하다.
  • Amazon Glacier (데이터 백업용 스토리지): 데이터의 수명이 길고 액세스의 빈도가 거의 없으며 느린 엑세스가 허용될 때 적합하다. 일반적으로 법적으로 저장해야하는 데이터나 로그 데이터를 저장하는 용도로 사용된다.

Glacier는 다른 스토리지 클래스와는 많은 부분 성격이 다르다.
특히 데이터의 조회는 느리지만 상당히 높은 내구성을 가지고 있다는 점이다. 또한 가장 엄격한 데이터 보관에 대한 규제 요구사항(SEC Rule I7a-4, PCI-DSS, HIPAA/HITECH, FedRAMP, EU GDPR, FISMA)도 충족할 수 있는 종합적인 보안 및 규정 준수 기능을 제공한다.


이 글은 아마존 웹 서비스 AWS Discovery Book 도서와 AWS 공식문서를 참고하여 작성하였다.

이미지 출처:

'Infrastructure > Cloud Computing' 카테고리의 다른 글

[AWS] Route53  (0) 2022.02.16
[AWS] RDS  (0) 2022.02.16
[AWS] Network  (0) 2022.02.14
[AWS] EC2  (0) 2022.02.13
[AWS] 클라우드 컴퓨팅이란?  (0) 2022.02.10