R 프로그래밍 언어 활용 데이터 분석 과정 - 4회차
09 - 결측값
결측값
: 데이터 중 고의 또는 실수로 누락된 값
우리가 수집한 데이터에는 결측값이 존재할 수 있다
결측값을 그대로 놔둔 채 데이터 가공을 하면 결과값에 오류가 뜨거나 잘못된 연 산이 수행될 수 있으므로 정제과정에서 적절한 처리가 필요
결측값 처리 방법

결측값 처리 함수 활용 예제
[is.na 함수 활용 1]


[결측값 처리 함수 활용 - airquality 데이터셋 다루기]




: NA값이 총 44개 존재함을 확인 가능


: Temp에는 NA값이 없으며, Ozone에는 NA값이 37개 존재함을 확인 가능


: NA가 없는 Temp는 평균 산출 가능, NA가 있는 Ozone은 평균 산출 불가능 (=NA로 나타남)


: 결측값이 제거된 데이터에서는 평균 산출 함수 mean이 정상적으로 동작하는 것 확인 가능


'Data Analysis > R' 카테고리의 다른 글
[R 프로그래밍 언어 활용 데이터 분석] 08 - 데이터 가공 - 파일 쓰기 (0) | 2021.07.08 |
---|---|
[R 프로그래밍 언어 활용 데이터 분석] 07 - 데이터 가공 - 파일 읽기 (0) | 2021.07.08 |
[R 프로그래밍 언어 활용 데이터 분석] 06 - 반복문 (0) | 2021.07.07 |
[R 프로그래밍 언어 활용 데이터 분석] 05 - 조건문 (0) | 2021.07.07 |
[R 프로그래밍 언어 활용 데이터 분석] 04 - R 언어 문법 익히기 2 (0) | 2021.07.07 |