
1.데이터 수집 빅카인즈(https://www.bigkinds.or.kr) 한국언론진흥재단에서 관리하는 신문기사 빅데이터 서비스 플랫폼 우리나라 신문 기사들로부터 주요인물, 주요 키워드, 주요 이슈 등을 볼 수 있음. 사용 데이타셋 :코로나 관련 뉴스 검색 2. 데이터 불러오기 - 한글이 꺠어져 나올때는 CSV 파일을 utf-8 csv 파일로 저장후 불러온다. - tools > project Option > code encoding 에서 text encoding이 UTF-8인지 확인 data

R Studio Cloud 에 대하여 알아보자! https://rstudio.cloud/ RStudio Cloud - Do, share, teach, and learn data science rstudio.cloud 1. 로그인 R Studio Cloud는 기본적으로 Google or GitHub로 로그인이 가능해서 쉽게 로그인이 가능하다. 2. Project 생성 : 상단 오른쪾 new Project 버튼 클릭 -> 새로운 프로젝트 생성 3. 추가기능 WorkSpace 사용을 통해 관리 Learn 탭에는 DataCamp Course가 있어서 R을 배우기에 매우 용이 Data Camp는 기본적으로 코드를 공부 할수 있는 사이트 4. 화면 구성 패키지 프로그램과 같다. getwd() 경로가 기본적으로 Cl..

Chapter11. 누가 생존 했을까? 1. Titanic Dataset 2. 데이터 수집 3. 데이터 살펴보기 4. 데이터 정제하기 5. 데이터 시각화하기 1. Titanic Dataset 타이타닉 데이터셋 사이트 주소 : https://www.Kaggle.com/c/titanic/data Titanic - Machine Learning from Disaster | Kaggle www.Kaggle.com 2. 데이터 불러오기 data str(data) 'data.frame':891 obs. of 12 variables: $ PassengerId: int 1 2 3 4 5 6 7 8 9 10 ... $ Survived : int 0 1 1 1 0 0 0 0 1 1 ... $ Pclass : int 3 1..

9.3.3 결측치 처리 데이터가 비어있는 값을 결측치(Missing Value) 라고 한다 종류 의미 설명 is.na() 결측치 확인 및 대체 데이터가 결측치면 T, 아니면 F anyNA() 결측치 확인 데이터 전체를 대상으로 확인 na.rm() 결측치 제외 na.rm = TRUE 설정하면 결측치를 제외하고 분석 na.omit() 결측치 제거 NA가 있는 행은 제거 1. 데이터프레임을 만들어보자 data data class korean english math 1 A 82 NA 82 2 B 68 98 74 3 C 75 NA 63 4 D 50 99 NA 2. 결측치를 넣어보자 data[1,3] anyNA(data) [1] TRUE na.rm() > mean(data$korean) [1] NA > mean(d..

수업 준비 1. R_studio 에서 프로젝트 확인 2. 경로 셋팅 : ctrl +shift + h > setwd("C:/Users/USER/Dropbox/R/Mybook") 3. 기존 data 삭제 rm(list=ls()) 실습1. 데이터 프레임을 생성 후 .csv 로 저장 해 보자. df df class korean english math 1 1 76 82 78 2 2 80 86 79 3 3 86 83 81 4 4 73 87 8 #save of data write.csv(df, "class_mean.csv") 실습2. .csv 파일을 불러보자.(별도의 패키지 없이 내장 함수 사용) > read.csv("class_mean.csv") X class korean english math 1 1 1 75 8..
1.4 행렬 #matrix() 함수 > x x [,1] [,2] [1,] 1 4 [2,] 2 5 [3,] 3 6 > > y y [,1] [,2] [,3] [,4] [1,] 1 3 5 7 [2,] 2 4 6 8 > > z1 z1 [,1] [,2] [,3] [1,] 1 4 7 [2,] 2 5 8 [3,] 3 6 9 > > z2 z2 [,1] [,2] [,3] [1,] 1 2 3 [2,] 4 5 6 [3,] 7 8 9 #행과 열에 이름 부여 > rnames cnames > x x 1열 2열 1행 1 4 2행 2 5 3행 3 6 #rbind, cbind 함수 사용 > a a [1] 1 2 3 > b b [1] 4 5 6 > c c [1] 7 8 9 > > x x [,1] [,2] [,3] a 1 2 3 b 4 ..
Error 코드에 오류가 있어 실행되지 않음 Warning message 코드는 실행 되지만 어떤 부분을 조심하라는 경고 메세지 객체 "a"를 찾을 수 없다. > a Error: object 'a' not found asd 함수를 찾을 수 없다. > asd() Error in asd() : could not find function "asd" 불필요한 )기호가 입력되었다. Error: unexpected ')' in "asd())" 코드 폰트가 이상 할 경우 alt + 입력되어서 폰트간격이 넓어짐 : 다시 한번 누르면 됨. 한글 문서가 꺠어 질 경우 : 메모장에서 파일을 열어서 ANSI로 변경하여 R로 다시 불러옴
코드를 실행했는데 에러가 발생하였다면 아래 먼저 확인 해 보자. 초보자의 가장 흔한 실수는 오타이다.! 패키지를 로드했는가? 데이터를 불어왔는가? 변수명, 특히 대소문자를 정확히 보자! ∨ 완결 되지 않은 코드를 실행 한 경우 - 콘솔창이 완결 되지 않은 경우, + 기호가 표시 된다. 괄호가 닫혔는지 확인 해 보자. esc를 눌러 입력 대기 상태로 되돌아 온 후 다시 코드를 실행하자. ∨ 콘솔창에 이상한 문자가 입력되어 있는 경우 콘솔창에 > 기호가 표시되어 있는지 확인 해 보자. ESC 눌러 입력 대기 상태로 되돌아 온 후 다시 소스 코드 실행 ∨ 등호 == 개수 확인 ∨ 대 소문자 확인 ∨ 따옴표 확인 ∨ 엑셀 파일을 불러 올 경우 : xlsx, xls 인지 확인 ∨ 파일 경로 확인 : Ctrl + ..

1. RStudio에서 프로젝트 생성하기 데이터를 다루는 작업을 하다보면 여러 개의 스크립트 파일과 데이터 파일이 생성되거나 필요하게 됩니다. 여러 파일들을 효율적으로 관리하려면, 주제별로 하나의 프로젝트를 만들어 폴더로 관리하면 보다 쉽고 편리하게 작업을 진행해 나갈 수 있습니다. RStudio에서 프로젝트(Project)를 생성해 봅시다. 오른쪽 상단에 있는 ‘Project(None)’ 아이콘 을 클릭한 후 [New Project]를 클릭합 니다. 또는 파일 [File]에서 [New Project]을 선택할 수도 있습니다. Create Project 창이 나타나면 새 프로젝트 폴더를 만들기 위해서는 [New Directory] 를 클릭하고, 이미 만들어진 프로젝트 폴더를 사용할 경우 [Existion..

1.R이란? 통계 및 그래픽을 위한 프로그래밍 언어 1990년대 초 뉴질랜드 오클랜드 대학의 로버트 젠틀맨과 로스 이하카에 의해 통계처리를 목적으로 개발 데이터마이닝, 머신러닝 등으로 확장되어 응용 가능 오픈소스 언어이며, 인터프리터 언어로 컴파일 과정을 거치지 않아 분석 과정이 간결 비 전공자도 쉽게 배울 수 있는 장점을 가짐 데이터 분석은 “데이터 수집” -> “정제” -> “시각화”를 통해 분석하는 과정을 거쳐 데이터 안에 숨어있는 정보를 찾아내는 것 ⁃장점 1)통계 분석 등에 활용할 수 있는 패키지 수가 많음 2)사용자 간에 다양한 정보를 공유 가능 3)R은 무료 4)다양한 운영체제에서 동작 ⁃단점 1)쉬워도 프로그래밍 언어 2)처리 속도가 느림 3)사용 중 문제가 발생하면 스스로 해결해야 함 2..
- Total
- Today
- Yesterday