본문 바로가기

Data Analysis9

[R 프로그래밍 언어 활용 데이터 분석] 09 - 결측값 R 프로그래밍 언어 활용 데이터 분석 과정 - 4회차 09 - 결측값 결측값 : 데이터 중 고의 또는 실수로 누락된 값 우리가 수집한 데이터에는 결측값이 존재할 수 있다 결측값을 그대로 놔둔 채 데이터 가공을 하면 결과값에 오류가 뜨거나 잘못된 연 산이 수행될 수 있으므로 정제과정에서 적절한 처리가 필요 결측값 처리 방법 결측값 처리 함수 활용 예제 [is.na 함수 활용 1] [결측값 처리 함수 활용 - airquality 데이터셋 다루기] : NA값이 총 44개 존재함을 확인 가능 : Temp에는 NA값이 없으며, Ozone에는 NA값이 37개 존재함을 확인 가능 : NA가 없는 Temp는 평균 산출 가능, NA가 있는 Ozone은 평균 산출 불가능 (=NA로 나타남) : 결측값이 제거된 데이터에서는.. 2021. 7. 8.
[R 프로그래밍 언어 활용 데이터 분석] 08 - 데이터 가공 - 파일 쓰기 R 프로그래밍 언어 활용 데이터 분석 과정 - 4회차 08 - 데이터 가공 - 파일 쓰기 파일 쓰기 [read.table로 읽어온 파일을 write.table 함수를 이용하여 텍스트 파일로 저장] [quote 옵션 사용] [점수가 0~100점 이외의 값이 입력된 경우 NA로 처리하는 프로그램 - 1] 파일 내용의 일부를 변경하여 읽어온 후 확인 [점수가 0~100점 이외의 값이 입력된 경우 NA로 처리하는 프로그램 - 2 (데이터 추가 변경, 반복문 사용)] 파일 내용의 일부를 변경하여 읽어온 후 확인 반복문을 사용하여 점수가 0~100점 이외의 값이 입력된 경우 NA로 처리 2021. 7. 8.
[R 프로그래밍 언어 활용 데이터 분석] 07 - 데이터 가공 - 파일 읽기 R 프로그래밍 언어 활용 데이터 분석 과정 - 4회차 07 - 데이터 가공 - 파일 읽기 데이터 수집과 정제 데이터 정제 : 데이터를 수집한 후, 데이터를 처리하기 위해 가장 먼저 하는 작업 데이터 분석 방법이 아무리 뛰어나더라도 분석에 사용되는 데이터의 품질이 좋지 않다면 분석 결과가 왜곡되거나 다른 결론이 나올 수 밖에 없음 파일 읽기와 쓰기 함수 [read.table() : 일반 텍스트 파일을 읽을 때 사용] Usage 정보 옵션 - sep : 구분 기호 명시 - na.strings : NA로 인식하고자 하는 문자열을 정의 - strip.white : 빈칸을 제거 [read.csv() : CSV 파일을 읽을 때 사용] Usage 정보 파일 읽기 - 1 파일을 읽어오기 위해 실습에 사용할 txt 파일.. 2021. 7. 8.
[R 프로그래밍 언어 활용 데이터 분석] 06 - 반복문 R 프로그래밍 언어 활용 데이터 분석 과정 - 3회차 06 - 반복문 반복문 데이터 검토 시 반복적으로 값을 변경하면서 사용해야 하는 경우 존재 R에서 제공하는 반복문 repeat, while, for문 반복문의 형식 [repeat문 이용] [while문 이용] [for문 이용] [while문 이용] [for문 이용] 조건문과 반복문을 활용하여 특정 범위 내에서 조건에 맞는 값 찾기 2021. 7. 7.
[R 프로그래밍 언어 활용 데이터 분석] 05 - 조건문 R 프로그래밍 언어 활용 데이터 분석 과정 - 3회차 05 - 조건문 조건문 데이터 정제를 위해 사용 데이터 정제란? 특정 조건에 맞는 값을 찾아내거나 일부 구간의 값을 추출하는 것 조건문을 사용하면 데이터를 정제하여 다양한 목적에 맞게 작업할 수 있음 조건문 형식 []에 행/열 조건 명시 if문 사용 ifelse문 사용 if/else문을 합쳐놓은 형태 2021. 7. 7.
[R 프로그래밍 언어 활용 데이터 분석] 04 - R 언어 문법 익히기 2 R 프로그래밍 언어 활용 데이터 분석 과정 - 3회차 04 - R 언어 문법 익히기 2 데이터 프레임 - 가장 흔히 쓰이는 표 형태의 데이터 구조를 가짐. - 행렬과 달리 여러 데이터형을 혼합하여 저장할 수 있음. - 리스트와 달리 행의 수를 일치시켜서 저장해야 함. 데이터 프레임 명 2021. 7. 7.
[R 프로그래밍 언어 활용 데이터 분석] 03 - R 언어 문법 익히기 1 R 프로그래밍 언어 활용 데이터 분석 과정 - 2회차 03 - R 언어 문법 익히기 1 data() > data() hist(데이터셋명) > hist(Nile) 주석 > #주석처리할 내용 주석문은 프로그램 내부에서 처리되지 않는다는 것을 알 수 있다. args(함수명) > args(max) > args(sum) 변수에 값을 저장하기 변수 (variable) : 분석에 필요한 자료를 일시적으로 저장하거나 처리결과를 저장할 수 있는 기억 공간 : R의 모든 변수가 객체 형태로 생성되므로 하나의 변수에 자료, 함수, 차트, 이미지 등 모든 형식을 저장할 수 있음 변수에 값을 저장할 때에는 항상 변수가 왼쪽에 오도록 해야하며, 변수에 값을 저장하는 방법에는 두 가지가 있다. (1) 등호 기호를 사용하여 변수에 .. 2021. 7. 6.
[R 프로그래밍 언어 활용 데이터 분석] 02 - R & R Studio 설치 R 프로그래밍 언어 활용 데이터 분석 과정 - 1회차 02 - R & R Studio 설치 [R 설치] 1. https://www.r-project.org/ 접속 2. CRAN 메뉴 클릭 3. Korea 서버의 다운로드 URL 클릭 (Korea 목록의 링크 중 아무 링크나 클릭해도 무관) 4. 운영체제 선택 5. Subdirectories에서 base 선택 6. 설치 파일 다운로드 7. 설치 [R Studio 설치] 1. https://www.rstudio.com/ 접속 2. 페이지 우측 상단의 Download 클릭 3. 설치 파일 다운로드 위쪽에 있는 링크들은 install 버전, 아래쪽에 있는 링크들은 무설치 버전입니다. 무설치 버전은 파일 다운로드 후 압축 해제만 해주면 바로 사용이 가능합니다. 2021. 7. 5.
[R 프로그래밍 언어 활용 데이터 분석] 01 - R 언어 알아보기 R 프로그래밍 언어 활용 데이터 분석 과정 - 1회차 01 - R 언어 알아보기 [R언어란?] - 비교적 최근에 개발된 프로그래밍 언어 중 하나 - 1990년, 뉴질랜드 오클랜드 대학의 로스 이하카와 로버트 젠틀맨에 의해 개발된 통계 프로그래밍 언어 S-PLUS의 무료 버전 형태 [R언어의 특징] - 데이터 분석에 특화된 언어 통계를 포함한 데이터 분석 작업에 활용할 목적으로 개발된 언어 컴파일 과정 없이도 바로 실행하여 결과를 확인할 수 있는 스크립트 언어 - 탄탄한 사용자 커뮤니티 사용자 층이 두텁기 때문에 다양한 커뮤니티가 존재 초보자를 위한 학습 자료 풍부 국내 검색 사이트를 통해서 찾을 수 있는 한글 자료들이 증가하는 추세 - 다양한 패키지 제공 데이터 분석에 사용되는 함수들을 종류별로 묶어 패.. 2021. 7. 5.