Data Analysis/R

R / 2장 R 기초와 자료구조

Bay Im 2023. 10. 14. 13:56
  • 산술연산자
    • +, -, *, /, ^
    • %%
      • 나눗셈의 나머지
  • 주석
    • #이후의 내용
  • 함수
    • log(), sqrt(), max(), min(), abs(), factorial(), sin(), cos(), tan()
    • 사용자가 직접 생성도 가능
  • 변수명
    • 영문자나 마침표로 시작
    • 두 번째 글자부터는 영문자, 숫자, 마침표, 밑줄 가능
    • 대소문자 구분
    • 중간에 빈칸은 불가능
  • 변수에 값 저장
    • < -
      • 할당 연산자로 alt키와 - 누르면 자동입력
    • =, << -
  • 변수의 자료형
    • 숫자형
    • 문자형
    • 논리형
    • 특수값
      • NULL
      • NA
      • NaN
      • Inf
  • R객체
    • 벡터
    • 행렬
    • 배열
    • 리스트
    • 데이터프레임
    • 요인(factor)
    • 스칼라는 미존재(길이가 1인 벡터)
  • 벡터
    • 같은 유형의 자료로 이루어진 1차원 배열
    • c() 함수 이용(combine)
      • 실수형(num): x < - c(1, 2.5, 3.2)
      • 정수형(int): y < - c(1L, 2L, 3L)
      • 원시형(raw): w < - raw(3)
        • 00 00 00
  • 강제 형변환
    • 논리형→ 숫자형→ 문자형
  • 자료형 확인
    • typeof()
    • is.interger()
    • is.등등..
  • 수동 형변환
    • as.character()
    • as.numeric()
    • as.등등..
  • seq()
    • 연속된 자료 값을 가지는 벡터 생성
    • 일정한 간격의 숫자로 이루어진 벡터 생성
    • seq(from=시작값, to=마지막값, by=증감값)
  • rep()
    • 반복된 숫자로 이루어진 벡터 생성
    • rep(객체 또는 수식, 반복횟수)
  • 벡터의 원소값에 이름 지정
    • score ← c(90, 85, 70)
    • names(score) ← c(”john”, “tom”, “jane”)
  • 벡터에서 원소값 추출
    • 인덱스 1번 부터
      • 는 제외하고 출력하라는 뜻
    • 이름으로 추출도 가능
      • GNP[”Korea”] ⇒ 2090
  • 벡터에 저장된 원소 값 변경
    • v1[2] ←3: 2번째 값을 3으로 변경
    • append() 이용
      • append(x, 100, after=3)
  • 벡터와 숫자 값 연산
    • 각 c()안에 들어있는 숫자 연산
    • 변수 안에 들어있는 두 c()의 대응되는 위치로 연산
  • 벡터 적용 가능 함수
    • sum(), mean(), median(), var(), sd() 등등..
    • sort(), sort(d, decreasing=TRUE)
  • 논리연산자
    • 논리연산자 적용시 TRUE, FALSE로 출력
    • d[d>5] 형태는 5보다 큰값들이 출력
  • 행렬
    • matrix()
    • 동일한 데이터 타입의 2차원 배열은 행렬로 표기 가능
    • 기본 열방향으로 데이터 출력, byrow=TRUE시 행방향으로 데이터 출력
    • matrix(x, nrow=2)
    • matrix(x, ncol=3)
  • 배열
    • array()
    • 동일한 데이터 타입의 모든 벡터는 배열로 표기 가능
  • 리스트
    • list()
    • 서로 다른 자료형의 값들을 1차원 배열에 저장하고 다룰 수 있는 자료구조
    • 리스트는 또 다른 리스트도 포함 가능
  • 데이터 프레임
    • 리스트의 2차원 표현으로 벡터들을 그룹화한다.
    • 각 벡터들은 하나의 열로 구성되며 같은 열에서는 같은 자료형을 가진다.
    • 모든 열의 길이가 같아야한다.
  • 팩터
    • factor()
    • 범주형 자료를 저장하는 자료구조
  • 문자열 출력 함수
    • print()
    • cat()
    • sprintf()
      • 서식을 지정하여 객체를 표시할 수 있다.
    • paste()
      • 임의의 기호를 이용하여 입력 문자들을 결합한다.
      • sep= 에 입력한 기호로 입력 문자들을 결합한다.
  • 문자 관련 함수
    • 문자열 부분출력 함수
      • substr(x, start, stop)
    • 문자 탐색 함수
      • grep()
      • 정규표현식을 사용한 입력 조건에 맞는 글자의 인덱스를 찾아낸다.
  • R객체의 일반적인 속성
    • 이름 속성
      • names()
    • 차원 속성
      • dim()

'Data Analysis > R' 카테고리의 다른 글

R / 6장 데이터 기술통계  (1) 2023.12.15
R / 5장 데이터 전처리  (1) 2023.10.17
R / 4장 R 프로그래밍  (1) 2023.10.17
R / 3장 R 자료관리, 수집  (0) 2023.10.14
R / 1장 데이터분석과 R소개  (0) 2023.10.14