본문 바로가기
Data Analysis/R

[R 프로그래밍 언어 활용 데이터 분석] 04 - R 언어 문법 익히기 2

by olli2 2021. 7. 7.

R 프로그래밍 언어 활용 데이터 분석 과정 - 3회차

04 - R 언어 문법 익히기 2

 

 

데이터 프레임

- 가장 흔히 쓰이는 표 형태의 데이터 구조를 가짐.

- 행렬과 달리 여러 데이터형을 혼합하여 저장할 수 있음.

- 리스트와 달리 행의 수를 일치시켜서 저장해야 함.

 

<데이터 프레임 생성 방법>

데이터 프레임 명 <- data.frame(열1=c(값1, 값2, ...), 열2=c(값1, 값2, ...), 열3=c(값1, 값2, ...))

 

<활용 예시>

 

 

cbine()

열 단위 추가 함수

 

 

rbind()

행 단위 추가 함수

 

 

요소 값 조회

변수명[행, 열]

인덱스 값에 - 기호를 붙이는 경우, 해당 번호의 행 또는 열을 제외하고 출력한다.

 

 

요소 값 수정

<df 데이터프레임의 1행 2열의 값을 24로 변경, 1행 1열의 값을 Tom으로 변경하는 예제>

2 obs. of 3 variables : 3개의 변수, 각 변수들은 2개의 값을 가짐을 의미

 

 

데이터 프레임 관련 함수 - subset()

데이터 프레임에서 일부 데이터만 추출하는 함수

 

 

데이터 프레임 관련 함수 - na.omit()

데이터 프레임의 결측값(NA) 제거 함수

airquality 데이터에는 NA값이 포함되어 있음

na.omit 함수를 적용한 출력 결과는 NA값을 포함하고 있는 데이터를 제외한 값들을 가지고 있다.

 

 

데이터 프레임 관련 함수 - merge()

여러 데이터 프레임 병합 함수

공통되는 속성을 기준으로 결합하며, 결합 기준 속성은 by 문으로 선언해준다.

 

 

데이터 프레임 관련 함수 - is.data.frame

데이터 프레임인지를 확인

 

 

데이터 프레임 관련 함수 - as.data.frame

데이터 프레임으로 변환