Conference & Lecture

[웨비나] AWS TechCamp / Amazon DataZone을 통해 멀티 어카운트 환경에서 데이터 거버넌스 구현

Bay Im 2024. 9. 5. 01:01
  • 데이터 거버넌스
    • 비즈니스 활동 및 운영을 지원하기 위해 기업 내 데이터를 적절한 상태로 유지하는 것
    • 적절한 데이터의 발견, 액세스, 공유
    • 데이터 보호 및 안전하게 유지
    • 적절한 감사 및 통제

실습

  • 도메인 생성
    • Amazon Datazone- 도메인 생성 클릭
      • 이름: Corporate
      • 빠른 설정: 체크
      • 나머지는 기본값으로 두고 도메인 생성 클릭
    • 하이브리드 액세스 모드 활성화
      • 위에서 만든 도메인 클릭- 청사진 탭- 기본 데이터 레이크 클릭
      • 편집 클릭
      • 데이터 위치 등록 체크
  • 프로젝트 생성
    • 도메인- 데이터 포털 열기 클릭
    • 프로젝트 생성 클릭
      • 이름: sales
      • 도메인: Corparate 클릭
      • 프로젝트 생성 클릭
     
  • 프로젝트 환경 생성
    • 환경 설정- 프로필 생성 클릭
      • 이름: SalesDataLakeProfile
      • 청사진: 기본 데이터 레이크 선택
      • AWS 계정 파라미터: 본인 계정과 리전 선택
      • 승인된 프로젝트: 모든 프로젝트 선택
      • 게시: 모든 데이터베이스에서 게시 선택
      • 환경 프로필 생성 클릭
    • 프로필에서 환경 생성 클릭
      • 이름: sales_environment
      • 나머지는 기본값으로 두고 환경 생성 클릭
    • 환경 생성 완료
     
  • DataZone에서 게시할 데이터 생성
    • Amazon S3에 데이터 업로드
      • 환경 탭- sales_environment 클릭- S3 버킷 클릭
        • S3 URI 확인 후 복사 해두기
          • s3://amazon-datazone-928828582313-ap-northeast-2-902142858/dzd_58etgmm7p0xhy0/datazone/5t0zk5qkf41p5k
      • AWS 콘솔- S3로 이동
        • 방금 URI의 버킷 클릭
        • 폴더 만들기
          • 이름: order
        • 데이터 파일 업로드 하기
          • 위에서 만든 폴더 안에 파일 업로드
    • Glue Crawler을 사용한 테이블 생성
      • AWS 콘솔- AWS Glue- Crawler로 이동
        • create crawler 클릭
        • name: sales_crawler
        • S3 path: 아까 만든 order 폴더 선택
        • IAM role-create new IAM
          • name: AWSGlueServiceRole-dz-sales
           
        • 위에서 잠시 멈추고 Lake Formation 권한 설정
      • Lake Formation 권한 설정
        • AWS 콘솔- AWS Lake Formation- Administraion- Administrative roles and tasks로 이동
        • Data lake administrators- Add 클릭
        • 어렵+중간 놓침 이슈로 여기서부턴 나중에 해볼 예정..
                      •  

 

 

 

참고 https://catalog.us-east-1.prod.workshops.aws/workshops/a6d8f106-419c-4681-957b-5cf1fae973cc/ko-KR

728x90