
1. 데이터 준비 data > dataset > abalone 2. 데이터 불러오기 3. 데이터 살펴보기 http://archive.ics.uci.edu/ml/datasets/Abalone UCI Machine Learning Repository: Abalone Data Set Data Set Characteristics: Multivariate Number of Instances: 4177 Area: Life Attribute Characteristics: Categorical, Integer, Real Number of Attributes: 8 Date Donated 1995-12-01 Associated Tasks: Classification Missing Values? No Number of We..
1. 기계학습 모델 오렌지3의 model 위젯개변과 분야를 간단히 정리 해 보자 모델 개념 분야 선형회귀 Linear Regression 수치로 이루어진 변수들의 관계를 함수로 나타내고 새로운 수치를 예측 지도 - 회귀 최근접 이웃 kNN k-NN(k-Nearest Neighbors) 새로운 데이터가 들어왔을때 데이터간의 거리가 가까운 데이터를 확인하여 분류하는 기계학습 모델 지도 - 분류 로지스틱 회귀 logistic - Regression 입력값을 결합하여 어던 사건의 발생 가능성을 확률적으로 예측 지도 - 분류 서포트 벡터 머신 SVM 집단사이의 마진을 최대화하는 결정 기계를 찾는 학습 모델 지도- 분류 나이브 베이즈 Naive Bayes 데이터 특성들이 단순하게 독립적으로 영향을 미친다는 베이즈 ..
1. 기계학습 모델 오렌지3의 model 위젯개변과 분야를 간단히 정리 해 보자 모델 개념 분야 선형회귀 Linear Regression 수치로 이루어진 변수들의 관계를 함수로 나타내고 새로운 수치를 예측 지도 - 회귀 최근접 이웃 kNN k-NN(k-Nearest Neighbors) 새로운 데이터가 들어왔을때 데이터간의 거리가 가까운 데이터를 확인하여 분류하는 기계학습 모델 지도 - 분류 로지스틱 회귀 logistic - Regression 입력값을 결합하여 어던 사건의 발생 가능성을 확률적으로 예측 지도 - 분류 서포트 벡터 머신 SVM 집단사이의 마진을 최대화하는 결정 기계를 찾는 학습 모델 지도- 분류 나이브 베이즈 Naive Bayes 데이터 특성들이 단순하게 독립적으로 영향을 미친다는 베이즈 ..

1. 위젯의 연결 - 기능을 수행하는 아이콘들로 위젯을 불러와 연결하는 과정을 통해 데이터 처리, 시각화, 모델 적용 등 분석 평가를 할 수 있다. - 위젯끼리 연결되면 점선이 실선으로 변경 2. 위젯의 유형 : 점선 방향을 통해 입출력 지원 여부를 확인 할 수 있다. - 오른쪽 점선 : 출력만 지원 - 양쪽의 점선 : 입출력 모두 지원 - 왼쪽의 점선 : 입력만 지원 3. 위젯의 추가 및 삭제 - 위젯클릭, 드래그, 오른쪽 마우스 클릭후 원하는 위젯 선택 - 삭제 할 위젯의 오른쪽 마우스 클릭 후 삭제, del 키 4. 위젯의 연결 : 드래그 하여 연결하면 실선으로 변경 됨 5. 프로젝트 수행 데이터준비 모델학습 성능평가 [예제] iris 데이터셋을 활용한 데이터 시각화 1. 새파일 데이터 준비 2. ..

1. 기본화면구성 좌 / 우 화면 구성 좌측 작업에 필요한 메뉴, 위젯, 설명, 작업 정보 등... 1) 메뉴바 2) 위젯이 정렬된 카테고리 3) 선택 된 위젯의 설명문 출력 4) 작업정보, 위젯의 정렬, 텍스트 주석, 화살표 추가 등 작업 실행 일시 정지 도움창 활성화 기능 지원 2. 시작 new : 새로만들기 open : 열기 Recent : 최근 파일 Video Tutorials : 사용법 Get started : 안내 사이트 연결 Example : 예제 Documnet : 설명서 3. 위젯 카테고리 오렌지에서는 위젯을 통해 다양한 프로그래밍 작업을 쉽게 할 수 있다. 자세한 위젯의 관한 사이트는 아래에서 안내하고 있다. https://orangedatamining.com/widget-catalog..

1. Orange 프로그램 소개 orange3 가 어떤 프로그램인지 살펴보자. 비전공자 / 초보자를 위한 기계학습과 데이터 분석을 위한 오픈소스 소프트웨어 코딩없이 위젯을 이용한 데이터 시각화와 이를 통해 간단한 데이터 분석을 수행 통계 분포, 상자 그림 및 산점도를 탐색하거나 의사 결정 트리, 계층적 군집화, 열 지도, MDS 및 선형 투영법 등 그래프 제작 데이터 모델을 생성하고 그 성능을 평가 가능 2. Orange3 설치 1. 프로그램 파일 다운로드 https://orangedatamining.com/download/#windows Download Linux / Source Anaconda If you are using python provided by Anaconda distribution, y..
미국 동북중부 437개 지역의 인구통계 정보를 담고 있는 midwest 데이터를 사용해 데이터 분석 문제 midwest는 ggplot2 패키지에 들어 있습니다. Q1. popadults는 해당 지역의 성인 인구, poptotal은 전체 인구를 나타냅니다. midwest 데이터에 '전체 인구 대비 미성년 인구 백분율' 변수를 추가하세요. > midwest midwest % + mutate(ratio_child=(poptotal-popadults)/poptotal*100) > head(midwest) PID county state area poptotal popdensity popwhite popblack popamerindian popasian popother 1 561 ADAMS IL 0.052 6609..

데이터 생성 > # 중간고사 데이터 생성 > test1 > # 기말고사 데이터 생성 > test2 test1 id midterm 1 1 60 2 2 80 3 3 70 4 4 90 5 5 85 > test2 id final 1 1 70 2 2 83 3 3 65 4 4 95 5 5 80 left_join() * by에 변수명을 지정할 때 변수명 앞 뒤에 겹따옴표 입력 > total total id midterm final 1 1 60 70 2 2 80 83 3 3 70 65 4 4 90 95 5 5 85 80 > name name class teacher 1 1 kim 2 2 lee 3 3 park 4 4 choi 5 5 jung > exam_new exam_new id class math english s..
> mpg %>% + filter(class == "compact") %>% # compact 추출 + group_by(manufacturer) %>% # manufacturer별 분리 + summarise(count = n()) %>% # 빈도 구하기 + arrange(desc(count)) # 내림차순 정렬 # A tibble: 5 × 2 manufacturer count 1 audi 15 2 volkswagen 14 3 toyota 12 4 subaru 4 5 nissan 2 Q1. 어떤 회사에서 "compact"(경차) 차종을 가장 많이 생산하는지 알아보려고 합니다. 각 회사별 "compact" 차종 수를 내림차순으로 정렬해 출력하세요. > mpg %>% + group_by(manufacturer..
집단별로 요약하기 > exam %>% + summarise(mean_math=mean(math)) mean_math 1 57.45 > exam %>% + group_by(class) %>% + summarise(mean_math=mean(math)) # A tibble: 5 × 2 class mean_math 1 1 46.2 2 2 61.2 3 3 45 4 4 56.8 5 5 78 > exam %>% + group_by(class) %>% + summarise(mean_math=mean(math), + sum_math=sum(math), + median_math=median(math), + n=n()) # A tibble: 5 × 5 class mean_math sum_math median_math n ..
- Total
- Today
- Yesterday