Data Analysis/R

R / 3장 R 자료관리, 수집

Bay Im 2023. 10. 14. 13:56
  • 데이터 생성
    • edit()
      • 데이터 편집기 창 생성
      • data ← data.frame()
      • data ← edit(data)
  • 데이터 보기
    • View()
  • CSV 파일
    • write.csv()
      • write.csv(df, file=”df.csv”)
    • read.csv()
    • 변수명이 없는 csv 파일 불러올 때 header=F
    • 현재 작업폴더 확인시 getwd()
  • RDS 파일
    • R 전용 데이터 파일
    • saveRDS(), readRDS()
  • R 데이터 불러오기
    • 작업 영역 설정
      • setwd(”C:\\등등”)
      • data ← read.csv(”파일이름”, header=F, fileEncoding=”EUC-KR”)
      • View(data)
  • R 데이터 탐색
    • str()
      • 데이터 구조, 변수 개수, 변수명, 관찰치 개수, 관찰치의 미리보기
    • head()
      • 상위 6개 자료 출력, 반대는 tail()
    • dim()
      • 데이터 객체의 차원 보기
    • length()
      • 데이터 객체의 요소들의 개수 산출
    • names()
      • 데이터 객체 구성요소들의 이름 보기
    • class()
      • 데이터 객체의 클래스 속성보기
  • 데이터프레임 변수 생성 및 변환
    • 신규 생성
      • data&변수 ← “new”: 변수라는 항목에 모든 열의 값을 new로 등록
    • 변경 등록
    • 데이터의 행 선택
      • data1 ← subset(data, data$성별==”여자”)
    • 데이터의 열 추출
      • data2 ← subset(data, select=c(성별, 연령대, 직업, 쇼핑액)): 성별, 연령대, 직업, 쇼핑액으로만 구성된 데이터프레임
    • 데이터의 행과 열 추출
      • data3 <- subset(data, data$성별=="남자“ & data$직업=="회사원", select=c(성별, 연령대, 직업, 쇼핑액))
  • 데이터프레임 데이터 병합
    • 수직적 자료의 결합
      • rbind()
    • 수평적 자료의 결합
      • cbind()
  • 데이터 프레임 데이터 정렬
    • order()
      • sort()는 전체 데이터 정렬 불가능
  • apply()
    • 행렬이나 데이터프레임 자료구조에서 행과 열에 대하여 적용을 원하는 함수의 기능 수행
    • apply(data, dim, function)
      • dim=1 이면 각 행에 함수 적용
      • dim=2 이면 각 열에 함수 적용

'Data Analysis > R' 카테고리의 다른 글

R / 6장 데이터 기술통계  (1) 2023.12.15
R / 5장 데이터 전처리  (1) 2023.10.17
R / 4장 R 프로그래밍  (1) 2023.10.17
R / 2장 R 기초와 자료구조  (0) 2023.10.14
R / 1장 데이터분석과 R소개  (0) 2023.10.14