AWS Storage Gateway: 온프레미스와 클라우드를 연결하는 하이브리드 스토리지
File Gateway vs Volume Gateway vs Tape Gateway 차이점, DataSync와 비교, SAA-C03 시험 출제 포인트 총정리.
관련 시험 도메인
- Domain 2: Design Resilient Architectures
- Domain 3: Design High-Performing Architectures
핵심 요약
AWS Storage Gateway는 온프레미스 환경과 AWS 클라우드 스토리지를 연결하는 하이브리드 스토리지 서비스입니다. File Gateway는 NFS/SMB로 S3 접근, Volume Gateway는 iSCSI 블록 스토리지, Tape Gateway는 가상 테이프 라이브러리를 제공합니다.
시험 팁
시험 핵심: "온프레미스 NFS/SMB → S3" → File Gateway, "온프레미스 블록 스토리지 백업" → Volume Gateway, "기존 테이프 백업 대체" → Tape Gateway
Storage Gateway는 언제 사용해야 할까?
적합한 경우
Storage Gateway 추천 시나리오:
├── 온프레미스 스토리지 용량 확장
│ └── 로컬 캐시 + 무제한 클라우드 스토리지
├── 하이브리드 클라우드 아키텍처
│ └── 온프레미스 앱이 AWS 스토리지 접근
├── 클라우드로 점진적 마이그레이션
│ └── 애플리케이션 변경 최소화
├── 백업 및 재해 복구
│ └── 온프레미스 데이터를 AWS에 백업
└── 테이프 백업 현대화
└── 물리 테이프 → 가상 테이프 (S3/Glacier)
부적합한 경우
Storage Gateway가 적합하지 않은 경우:
├── 대규모 일회성 마이그레이션
│ → AWS DataSync 또는 Snow Family 사용
├── 순수 클라우드 워크로드
│ → S3, EFS, EBS 직접 사용
├── B2B 파일 전송 (SFTP/FTP)
│ → AWS Transfer Family 사용
└── 실시간 데이터 동기화
→ AWS DataSync 사용
Storage Gateway 유형
3가지 게이트웨이 비교
┌─────────────────────────────────────────────────────────────┐
│ AWS Storage Gateway │
├──────────────────┬──────────────────────────────────────────┤
│ │ │
│ S3 File Gateway │ NFS/SMB → Amazon S3 │
│ ─────────────── │ • 파일을 S3 객체로 저장 │
│ │ • 로컬 캐시로 저지연 접근 │
│ │ • S3 Lifecycle 정책 적용 가능 │
│ │ │
├──────────────────┼──────────────────────────────────────────┤
│ │ │
│ FSx File Gateway│ SMB → Amazon FSx for Windows │
│ ────────────────│ • Windows 파일 서버 확장 │
│ │ • Active Directory 통합 │
│ │ │
├──────────────────┼──────────────────────────────────────────┤
│ │ │
│ Volume Gateway │ iSCSI → Amazon S3 + EBS 스냅샷 │
│ ────────────── │ • Cached: S3 저장 + 로컬 캐시 │
│ │ • Stored: 로컬 저장 + S3 백업 │
│ │ │
├──────────────────┼──────────────────────────────────────────┤
│ │ │
│ Tape Gateway │ iSCSI VTL → S3 + Glacier │
│ ──────────── │ • 가상 테이프 라이브러리 │
│ │ • 기존 백업 소프트웨어 호환 │
│ │ │
└──────────────────┴──────────────────────────────────────────┘
S3 File Gateway
아키텍처
┌─────────────────────────────────────────────────────────────┐
│ S3 File Gateway │
├─────────────────────────────────────────────────────────────┤
│ │
│ [온프레미스 서버] │
│ (NFS/SMB 클라이언트) │
│ │ │
│ ▼ │
│ ┌──────────────────────┐ │
│ │ Storage Gateway │ ← 온프레미스 또는 EC2 │
│ │ (File Gateway) │ │
│ │ ┌────────────────┐ │ │
│ │ │ Local Cache │ │ ← 자주 접근하는 데이터 캐시 │
│ │ └────────────────┘ │ │
│ └──────────┬───────────┘ │
│ │ HTTPS │
│ ▼ │
│ ┌──────────────────────┐ │
│ │ Amazon S3 │ ← 파일이 S3 객체로 저장 │
│ │ (원본 데이터 저장) │ │
│ └──────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘
특징
| 항목 | 내용 |
|---|---|
| 프로토콜 | NFS v3/v4.1, SMB v2/v3 |
| 저장소 | Amazon S3 (모든 스토리지 클래스) |
| 최대 파일 크기 | 5TB |
| 로컬 캐시 | 자주 접근하는 데이터 캐싱 |
| 통합 | S3 Lifecycle, S3 Object Lock, IAM |
사용 사례
S3 File Gateway 사용 사례:
├── 파일 서버 용량 확장
│ └── 온프레미스 스토리지 부족 시
├── 데이터 레이크 구축
│ └── 온프레미스 데이터를 S3로 수집 → Athena/EMR 분석
├── 클라우드 마이그레이션 준비
│ └── 애플리케이션 변경 없이 데이터 이동
└── 백업 및 아카이빙
└── S3 Lifecycle으로 Glacier로 자동 전환
시험 팁
시험 키워드: "온프레미스 NFS 파일 서버를 S3로 확장", "파일을 S3 객체로 저장", "Lifecycle 정책 적용" → S3 File Gateway
Volume Gateway
Cached vs Stored 모드
┌─────────────────────────────────────────────────────────────┐
│ Volume Gateway │
├────────────────────────────┬────────────────────────────────┤
│ Cached Volume │ Stored Volume │
├────────────────────────────┼────────────────────────────────┤
│ │ │
│ [온프레미스] │ [온프레미스] │
│ │ │ │ │
│ ▼ │ ▼ │
│ ┌────────────┐ │ ┌────────────┐ │
│ │Local Cache │ (자주 │ │Full Dataset│ (전체 데이터) │
│ │ (Hot Data) │ 접근) │ │ (Primary) │ │
│ └────────────┘ │ └────────────┘ │
│ │ │ │ │
│ ▼ │ ▼ │
│ ┌────────────┐ │ ┌────────────┐ │
│ │ Amazon S3 │ (전체 │ │ Amazon S3 │ (EBS 스냅샷 │
│ │ (Primary) │ 데이터) │ │ (Backup) │ 백업) │
│ └────────────┘ │ └────────────┘ │
│ │ │
│ 용량: 볼륨당 32TB │ 용량: 볼륨당 16TB │
│ 게이트웨이당 1PB │ 게이트웨이당 512TB │
│ │ │
└────────────────────────────┴────────────────────────────────┘
비교 표
| 항목 | Cached Volume | Stored Volume |
|---|---|---|
| 데이터 위치 | S3 (원본), 로컬 (캐시) | 로컬 (원본), S3 (백업) |
| 지연 시간 | 캐시 히트 시 낮음 | 항상 낮음 |
| 용량 | 볼륨당 최대 32TB | 볼륨당 최대 16TB |
| 사용 사례 | 대용량 데이터, 일부만 자주 접근 | 전체 데이터 로컬 접근 필요 |
| DR | S3에서 EBS로 복원 | 스냅샷에서 EBS로 복원 |
시험 팁
Cached vs Stored 선택 기준:
- "전체 데이터셋의 일부만 자주 접근" → Cached Volume
- "모든 데이터에 저지연 접근 필요" → Stored Volume
- "스토리지 비용 절감" → Cached Volume (로컬 스토리지 최소화)
Tape Gateway
아키텍처
┌─────────────────────────────────────────────────────────────┐
│ Tape Gateway │
├─────────────────────────────────────────────────────────────┤
│ │
│ [백업 애플리케이션] │
│ (Veeam, Veritas, Commvault 등) │
│ │ │
│ ▼ iSCSI │
│ ┌──────────────────────┐ │
│ │ Storage Gateway │ │
│ │ (Tape Gateway) │ │
│ │ ┌────────────────┐ │ │
│ │ │ Virtual Tape │ │ ← 가상 테이프 라이브러리 │
│ │ │ Library (VTL) │ │ │
│ │ └────────────────┘ │ │
│ └──────────┬───────────┘ │
│ │ │
│ ┌──────┴──────┐ │
│ ▼ ▼ │
│ ┌────────┐ ┌────────────┐ │
│ │ S3 │ │ Glacier/ │ │
│ │(Virtual│ │Deep Archive│ │
│ │ Tapes) │ │ (Archived) │ │
│ └────────┘ └────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘
특징
| 항목 | 내용 |
|---|---|
| 프로토콜 | iSCSI (Virtual Tape Library) |
| 가상 테이프 용량 | 테이프당 100GB ~ 15TB |
| 최대 테이프 수 | 1,500개 (총 1PB) |
| 아카이브 저장소 | S3 Glacier, S3 Glacier Deep Archive |
| 호환성 | Veeam, Veritas, Commvault 등 |
시험 팁
Tape Gateway 시험 포인트: "기존 테이프 백업 인프라 유지", "백업 소프트웨어 변경 없이", "물리 테이프 비용 절감" → Tape Gateway
Storage Gateway vs DataSync vs Transfer Family
비교 표
| 비교 항목 | Storage Gateway | DataSync | Transfer Family |
|---|---|---|---|
| 목적 | 하이브리드 스토리지 접근 | 데이터 이동/마이그레이션 | B2B 파일 전송 |
| 프로토콜 | NFS, SMB, iSCSI | NFS, SMB, S3, EFS | SFTP, FTPS, FTP |
| 데이터 흐름 | 지속적 접근 (양방향) | 일회성/정기 전송 | 파일 업로드/다운로드 |
| 캐싱 | 로컬 캐시 지원 | 없음 | 없음 |
| 사용 사례 | 하이브리드 앱, DR | 마이그레이션, 동기화 | 파트너 파일 교환 |
| 목적지 | S3, FSx, EBS | S3, EFS, FSx | S3, EFS |
선택 기준 흐름도
온프레미스 ↔ AWS 데이터 이동이 필요하다
│
▼
지속적인 하이브리드 접근이 필요한가?
│
Yes → 파일/블록/테이프 중 어떤 형태?
│ │
│ 파일(NFS/SMB) → [S3 File Gateway]
│ 블록(iSCSI) → [Volume Gateway]
│ 테이프(VTL) → [Tape Gateway]
│
No
│
▼
대규모 데이터 마이그레이션 또는 정기 동기화?
│
Yes → [AWS DataSync]
│
No
│
▼
외부 파트너와 SFTP/FTP 파일 교환?
│
Yes → [AWS Transfer Family]
│
No → [S3 직접 사용 또는 Snow Family]
시험 팁
핵심 구분:
- "지속적 접근 + 로컬 캐시" → Storage Gateway
- "일회성 마이그레이션 + 고속 전송" → DataSync
- "SFTP/FTP 서버 대체" → Transfer Family
배포 옵션
게이트웨이 호스팅 위치
Storage Gateway 배포 옵션:
├── 온프레미스 가상 머신
│ ├── VMware ESXi
│ ├── Microsoft Hyper-V
│ └── Linux KVM
├── 물리 하드웨어 어플라이언스
│ └── AWS에서 사전 구성된 서버 구매
└── Amazon EC2 인스턴스
└── AWS 내에서 게이트웨이 실행
비용 구조
주요 비용 항목
| 게이트웨이 유형 | 과금 항목 |
|---|---|
| S3 File Gateway | S3 요청 + S3 스토리지 |
| FSx File Gateway | FSx 스토리지 + 요청 |
| Volume Gateway | S3 스토리지 + 스냅샷 |
| Tape Gateway | 가상 테이프 스토리지 + Glacier |
비용 최적화 팁
비용 절감 전략:
├── S3 Lifecycle 정책 활용
│ └── 오래된 데이터 → Glacier로 자동 전환
├── Cached Volume 사용
│ └── 로컬 스토리지 비용 절감
├── 적절한 캐시 크기 설정
│ └── 너무 크면 비용 증가, 너무 작으면 성능 저하
└── 불필요한 스냅샷 정리
└── 오래된 EBS 스냅샷 삭제
SAA-C03 시험 출제 포인트
자주 출제되는 시나리오
- ✅ 파일 서버 확장: "온프레미스 SMB 파일 서버 용량 부족" → S3 File Gateway
- ✅ Cached vs Stored: "일부 데이터만 자주 접근" → Cached Volume
- ✅ 테이프 현대화: "기존 백업 소프트웨어 유지하며 테이프 대체" → Tape Gateway
- ✅ Gateway vs DataSync: "지속적 접근" → Gateway, "마이그레이션" → DataSync
- ✅ NFS vs iSCSI: NFS/SMB → File Gateway, iSCSI → Volume Gateway
시험 문제 예시
시험 팁
시험 문제 예시 1: "회사는 온프레미스에서 SMB 파일 서버를 운영 중입니다. 최근 생성된 파일은 자주 접근하지만, 오래된 파일은 거의 사용하지 않습니다. 스토리지 비용을 최적화하면서 저지연 접근을 유지하려면?"
→ 정답: S3 File Gateway + S3 Lifecycle 정책 (오래된 파일 → Glacier)
시험 팁
시험 문제 예시 2: "기존 백업 애플리케이션(Veeam)을 사용하여 물리 테이프 대신 AWS에 백업하려고 합니다. 백업 소프트웨어 변경 없이 구현하려면?"
→ 정답: Tape Gateway (VTL로 기존 백업 워크플로우 유지)
시험 팁
시험 문제 예시 3: "온프레미스 애플리케이션이 iSCSI 볼륨을 사용합니다. 전체 데이터셋에 저지연 접근이 필요하고, AWS에 비동기 백업이 필요합니다."
→ 정답: Volume Gateway (Stored Volume) (로컬 저장 + S3 백업)
자주 묻는 질문 (FAQ)
Q: Storage Gateway와 DataSync를 함께 사용할 수 있나요?
예. 초기 마이그레이션은 DataSync로 빠르게 전송하고, 이후 지속적인 접근은 Storage Gateway로 제공하는 패턴이 일반적입니다.
Q: File Gateway를 사용하면 S3 API로도 파일에 접근할 수 있나요?
예. File Gateway로 저장된 파일은 S3 객체로 저장되므로, S3 API, Athena, EMR 등에서 직접 접근할 수 있습니다. 단, 게이트웨이 외부에서 객체를 수정하면 RefreshCache API를 호출해야 합니다.
Q: Volume Gateway Cached 모드에서 캐시 미스가 발생하면?
S3에서 데이터를 가져오므로 지연 시간이 증가합니다. 자주 접근하는 데이터 크기보다 캐시를 충분히 크게 설정하는 것이 중요합니다.
Q: Tape Gateway에서 아카이브된 테이프를 복원하는 데 얼마나 걸리나요?
- S3 Glacier: 3-5시간 (Standard), 1-5분 (Expedited)
- S3 Glacier Deep Archive: 12-48시간
Q: Storage Gateway는 어떤 리전에서 사용할 수 있나요?
Storage Gateway는 대부분의 AWS 리전에서 사용 가능합니다. 게이트웨이와 연결되는 S3 버킷은 동일 리전 또는 다른 리전에 위치할 수 있습니다.