- 데이터 거버넌스
- 비즈니스 활동 및 운영을 지원하기 위해 기업 내 데이터를 적절한 상태로 유지하는 것
- 적절한 데이터의 발견, 액세스, 공유
- 데이터 보호 및 안전하게 유지
- 적절한 감사 및 통제
실습
- 도메인 생성
- Amazon Datazone- 도메인 생성 클릭
- 이름: Corporate
- 빠른 설정: 체크
- 나머지는 기본값으로 두고 도메인 생성 클릭
- 하이브리드 액세스 모드 활성화
- 위에서 만든 도메인 클릭- 청사진 탭- 기본 데이터 레이크 클릭
- 편집 클릭
- 데이터 위치 등록 체크
- Amazon Datazone- 도메인 생성 클릭
- 프로젝트 생성
- 도메인- 데이터 포털 열기 클릭
- 프로젝트 생성 클릭
- 이름: sales
- 도메인: Corparate 클릭
- 프로젝트 생성 클릭
- 프로젝트 환경 생성
- 환경 설정- 프로필 생성 클릭
- 이름: SalesDataLakeProfile
- 청사진: 기본 데이터 레이크 선택
- AWS 계정 파라미터: 본인 계정과 리전 선택
- 승인된 프로젝트: 모든 프로젝트 선택
- 게시: 모든 데이터베이스에서 게시 선택
- 환경 프로필 생성 클릭
- 프로필에서 환경 생성 클릭
- 이름: sales_environment
- 나머지는 기본값으로 두고 환경 생성 클릭
- 환경 생성 완료
- 환경 설정- 프로필 생성 클릭
- DataZone에서 게시할 데이터 생성
- Amazon S3에 데이터 업로드
- 환경 탭- sales_environment 클릭- S3 버킷 클릭
- S3 URI 확인 후 복사 해두기
- s3://amazon-datazone-928828582313-ap-northeast-2-902142858/dzd_58etgmm7p0xhy0/datazone/5t0zk5qkf41p5k
- S3 URI 확인 후 복사 해두기
- AWS 콘솔- S3로 이동
- 방금 URI의 버킷 클릭
- 폴더 만들기
- 이름: order
- 데이터 파일 업로드 하기
- 위에서 만든 폴더 안에 파일 업로드
- 환경 탭- sales_environment 클릭- S3 버킷 클릭
- Glue Crawler을 사용한 테이블 생성
- AWS 콘솔- AWS Glue- Crawler로 이동
- create crawler 클릭
- name: sales_crawler
- S3 path: 아까 만든 order 폴더 선택
- IAM role-create new IAM
- name: AWSGlueServiceRole-dz-sales
- 위에서 잠시 멈추고 Lake Formation 권한 설정
- Lake Formation 권한 설정
- AWS 콘솔- AWS Lake Formation- Administraion- Administrative roles and tasks로 이동
- Data lake administrators- Add 클릭
- 어렵+중간 놓침 이슈로 여기서부턴 나중에 해볼 예정..
-
- AWS 콘솔- AWS Glue- Crawler로 이동
- Amazon S3에 데이터 업로드
참고 https://catalog.us-east-1.prod.workshops.aws/workshops/a6d8f106-419c-4681-957b-5cf1fae973cc/ko-KR
728x90
'Conference & Lecture' 카테고리의 다른 글
[웨비나] AWS TechCamp / AWS Clean Rooms를 활용한 프라이빗한 데이터 공유 환경 구축 (0) | 2024.09.04 |
---|---|
[웨비나] AWS TechCamp / AWS 핵심 서비스로 웹 애플리케이션 구축 (1) | 2024.09.03 |
[웨비나] AWS TechCamp / 서버리스로 웹 애플리케이션 구축 (0) | 2024.09.03 |
[특강] 학교 특강 / 서비스의 전체 단계 (0) | 2024.05.25 |
[특강] 학교 특강 / 개발자의 업무 수행과 기술 (0) | 2024.05.25 |