알지오 평생교육원 R프로그래밍, 빅데이터통계R 강좌 리뷰입니다.
전문가들이 뽑은 꼭 배워야하는 실무활용 강의
그동안 찾던 R프로그래밍, 빅데이터통계R 강좌의 완전판 !
여러분의 마지막 강의가 되어드리겠습니다.
알지오에서는 PC와 스마트폰, 태블릿을 이용해서 언제, 어디서나 공부를 할 수 있습니다.
열심히 공부해서 R프로그래밍, 빅데이터통계R 강좌를 마스터해보세요.
<R프로그래밍, 빅데이터통계R 강좌 샘플동영상>
<R프로그래밍, 빅데이터통계R 강좌 리뷰>
R프로그래밍 교육을 찾기 너무 어려웠어요.
내용도 너무 어려워서 혼자 공부하기도 막막했고요ㅠㅠ
그런데 알지오 R프로그래밍 강의를 알게되고 수강을 시작하면서부터 실력이 달라지는게 느껴졌어요~
쉽게 설명해주셔서 빅데이터통계가 재밌게 느껴지고 강의가 지루하지 않아요~
반복적으로 수강할 수 있어서 그런지 꾸준히 배울수 있었습니다.
많은 도움이 되었습니다.
R프로그래밍, 빅데이터통계R 강좌 정보입니다. 추천 인터넷 강의 : 알지오
R프로그래밍강의,R프로그래밍강좌,R프로그래밍교육,R프로그래밍학원,R프로그래밍인강,R프로그래밍인터넷강의,R프로그래밍인터넷강좌,R프로그래밍동영상,R프로그래밍동영상강의,R프로그래밍동영상강좌,R프로그래밍배우기,R프로그래밍사용법,R프로그래밍사용방법,빅데이터통계R강의,빅데이터통계R강좌,빅데이터통계R교육,빅데이터통계R학원,빅데이터통계R인강,빅데이터통계R인터넷강의,빅데이터통계R인터넷강좌,빅데이터통계R동영상,빅데이터통계R동영상강의,빅데이터통계R동영상강좌,빅데이터통계R배우기,빅데이터통계R사용법,빅데이터통계R사용방법
- 01.42분 확률분포(연속형 확률분포)
정규분포, 지수분포, 균등분포, t-분포, 신뢰구간의 의미에 대해서 설명합니다.
책갈피 : [00:04] R_programming 설명/[00:54] 확률분포/[01:13] 연속형 확률분포/[01:22] 연속형 확률분포의 R명칭/[02:17] 정규분포(norm)/[02:26] 밀도 함수/[02:30] 누적분포 함수/[02:32] 분위수 함수/[02:33] 난수발생 함수/[02:52] 확률분포에 R명칭 적용/[03:12] 함수사용방법 정확히 알고싶을때/[03:18] 알컴애드창에 ?함수이름 설정/[03:30] 함수에 대한 설명 확인/[03:39] 필요한 인자 표시/[03:57] X확률변수값, mean값,sd값 필요/[04:27] 지정값 확인/[04:56] 예제보기/[05:07] X축에 들어갈 확률변수값지정/[05:22] 밀도값 Y축으로 설정/[05:27] 예제 코드 실행/[05:32] Seq 함수/[06:12] X값을 인풋으로 dnorm함수 수행/[06:22] 예제 코드 실행/[06:38] 예제 plot(x=x, y=dnorm(x))값 설정/[07:03] 예제 코드 실행/[07:40] 선타입변경 그림제목설정파라미터추가/[07:52] Type="l" main=그림제목 설정/[08:40] 예제2로 그래프그리기/[08:50] 알컴앤드창에 ?plot.function 입력/[09:01] Plot 함수는 curve 함수와 동일사용/[09:35] 예제2 plot(dnorm,-3,3)값 설정/[09:52] 예제 코드 실행/[10:13] 예제1 예제2 동시에 실행/[10:31] 동시사용시 par 함수 사용/[10:57] Par(mfrow) 예제보기/[11:47] Par(mfcol) 함수/[11:58] 예제 코드 실행/[12:14] 정규분포의 확률밀도함수/[12:28] Plot에 dnorm 함수에 평균인자, 표준편차 지정/[12:52] Plot에 dnorm 함수에 평균값, 표준편차값 지정/[13:12] 예제 코드 실행/[13:21] 사용한 파라미터 확인/[13:25] Ylab 함수/[13:50] Text와 mtext 함수비교설명/[14:34] Expression 함수 사용/[15:17] Cex파라미터/[15:58] 누적분포함수(pnorm)/[16:14] 그래프 예제/[16:53] 학률밀도함수와 누적분포함수의 관계/[17:09] 1차원 함수 수치접근 integrate/[17:19] 무한대(infinity)는 inf로 표시/[17:31] 예제1번 코드 실행/[17:52] 예제2번 lower.tail 옵션사용/[18:08] Lower.tail 사용결과 설명/[19:27] 예제2번 코드 실행/[19:40] 예제3번 pnorm코드를 그래프수행/[20:17] 예제3번 코드 실행/[20:29] 분위수 함수/[20:57] 실제 사용코드로 설명/[21:15] Qnorm 함수 사용/[21:27] 예제보기/[22:05] Qnorm 함수 적용/[22:54] 예제 코드 실행/[23:12] 난수 발생/[23:38] 1000개 랜덤한 샘플 추출코드/[24:01] 추출한 결과 x에 넣고 hist로 확인/[24:13] 예제 코드 실행/[24:54] 빈도수로 histogram 그리기/[24:57] Ferq=f로 지정으로 밀도그래프/[25:18] Histogram 값과 표준정규분포 겹치기/[25:34] Plot 함수에 add값 /[26:10] Layout 함수 사용 /[26:27] Matrix /[27:21] 지수분포/[27:38] 지수분포의 예/[28:28] 함수의 기본적인 사용방법/[28:50] Rate값/[29:22] 지수분포의 밀도함수 그래프 생성/[29:36] Plot 함수에 rate=3/[29:51] Plat 함수에 rate=2 col,lty 지정/[30:33] Plat 함수에 rate=1 col,lty 지정/[31:02] Legend 함수/[31:23] Legend 위치 지정/[31:41] Legend 내용 지정/[32:02] Legend 순서에 맞춰서 col, lty값 지정/[32:53] 예제 코드 실행/[33:32] 지수분포의 누적분포함수사용방법/[33:39] 정규분포와 지수분포의 누적분포함수 차이점/[34:15] 예제보기/[35:56] Pexp(q=5 ,rate=1/5,lower.tail) 코드 실행/[36:14] 예제문제값 변경/[36:38] Pexp(10,rate=1/5)-pext(5, rate-1/5) 코드 실행/[37:17] 균등분포/[38:26] 각분포들의 모수/[38:50] 예제보기/[39:00] Runif(n=25)/[39:40] 균등분포에 밀도함수 겹쳐서 생성/[40:09] Breaks 옵션/[40:20] 예제 코드 실행/[41:01] 예제 2번 수행/[41:20] M.list 벡터에 입력/[41:55] Mfrow로 2개의 행과 2개의 열로 나누기/[42:09] 예제 코드 실행/[43:13] T분포/[44:03] T분포의 확률밀도함수/[44:35] Plot 에 add 옵션 이용/[45:00] 각예제별로 col,lty 다르게지정/[45:15] 예제 코드 실행 /[46:04] 표본분포 모의실험/[46:34] 표본의 크기, 반복횟수 지정/[47:02] Xsample로 T값계산/[48:30] 예제 코드 실행/[48:55] 신뢰구간에서 신뢰계수의 의미 예제/[49:28] 신뢰계수/[50:14] Upper, lower 실현/[51:05] 신뢰구간구하기 모의실험/[51:49] Mu 평균판단 index 변수에 저장/[52:32] Mtext 지정/[52:55] 예제 코드 실행/[54:31] Segments 함수/[54:47] I,lower, i,upper 연결선 plot에 추가/[54:58] Egments r 기본사용방법/[55:25] Col,lty를 index값에 의존해 맞춤/[56:03] 예제 코드 실행/[57:04] 반복횟수 수정/[57:05] 예제 코드 실행/[57:25] Paste 함수
- 02.1시간 1분 확률분포(이산형 확률분포)
베르누이 분포, 이항분포, 포아송 분포, 초기하분포, 일변량 데이터의 정리, 범주형 데이터를 위한 막대그림, 파이그림, 점그림, 연속형 데이터를 위한 그래프, 줄기-잎 그림, 상자그림
책갈피 : [00:07] 이산형 확률분포/[00:12] 이산형 확률분포의 R명칭/[00:37] 이항분포(binnom)/[00:36] 이항분포의 모수 size/[00:46] prob/[00:54] 베르누이 시행의 조건/[01:36] 베르누이 시행 코드/[02:28] 코드 실행 /[03:28] 이항분포관련함수의 사용법/[03:52] 이항분포의 예제/[06:42] 예제코드 실행/[07:43] 확률문제를 dbinom,pbinom이용/[08:03] 성공횟수가 5번일 확률 예제/[08:26] 예제코드 실행/[08:44] 성공횟수가 6번 이하일 확률 예제/[09:31] 예제코드 실행/[09:43] 성공횟수가 7번 이상일 확률 예제/[11:12] 예제코드 실행/[11:49] n의 크기에 따른 이항분포의 밀도함수/[13:07] 실행코드값 그래프로 확인/[14:15] 그래프의 plot값 /[14:35] N=10 : p=0.2일 경우/[15:02] N=10 ; p=0.7일경우/[15:22] N=100 : p=0.2일 경우/[15:59] For문을 이용하여 그래프그리기/[17:08] 예제코드 실행/[17:45] 함수 Rbinom 베르누이 시행/[18:20] 코드 실행/[19:00] 포아송분포의 R함수 사용방법/[19:12] 지수분포(exp)/[19:29] 포아송분포(pois)/[20:27] lambda값/[20:45] 포아송분포와 관련된 확률문제/[21:36] ppois 함수/[22:44] 예제코드 실행/[23:54] 포아송분포 예제/[23:57] n=10; p=01일 경우/[24:10] n=100 ; p=0.01일경우/[24:30] 예제코드 실행/[24:55] 초기하분포(hyper)/[26:11] 초기하분포와 이항분포의 차이점/[27:04] 초기하분포 예제/[27:13] m=5 :n=10: p=m/(n+m)일 경우/[27:15] m=1000; n=2000일경우/[27:58] 예제코드 실행/[28:19] 물고기 개체수 추정 절차 예제/[30:35] p.1 변수/[30:53] Which.max 함수/[31:05] Which.max 함수 사용예제/[31:05] 예제코드 실행/[31:55] abline 함수/[32:29] 예제코드 실행/[33:14] 일변량 데이터관련 함수/[34:10] 일변량 범주형 데이터/[34:19] 명목형 데이터/[34:34] 순서형 데이터/[35:08] 막대그림 그래프(barplot)/[36:22] State.region 요인정보 사용예제/[36:39] State.region 데이터 내용/[37:19] 예제코드 실행/[37:46] Horiz=TRUE 옵션 사용/[38:05] 예제코드 실행/[38:19] 범주형 데이터가 factor인 경우/[38:51] state.region에 class함수 적용/[39:29] 예제코드 실행/[39:40] mtcars 데이터프레임 사용/[39:57] mtcars 데이터 내용/[40:59] names.arg 옵션사용/[41:32] 예제코드 실행/[41:56] 범주형데이터를 파이그림(pie)/[43:29] State.region데이터 이용 pie그래프생성/[43:55] 예제코드 실행/[44:49] pct사용/[44:59] 문자형백터 my.label이용/[45:19] pie에 col인자 적용/[45:40] 예제코드 실행/[46:02] plotrix 패키지 불러오기/[46:17] pie3D 함수/[46:39] 예제코드 실행/[46:52] explod 옵션/[47:18] fan.plot 함수적용/[47:27] 예제코드 실행/[48:19] 점그림(dotchart)/[49:13] pie그래프 예제를 이용할 경우 dotchart에 오류 확인/[49:40] table함수에 counts 속성살펴보기/[49:55] 예제코드 실행/[50:49] as.numeric 도수 분포표에 속성변경/[51:13] 예제코드 실행/[51:34] 일변량 연속형 데이터를 위한 그래프/[52:31] 줄기-잎 그림/[53:03] 줄기-잎 그림은 stem함수사용/[53:49] women데이터 프레임이용/[54:02] women데이터 불러오기/[54:21] Attach함수/[54:39] 예제코드 실행/[54:59] stem에 scale을 이용하여 그래프늘리기/[55:26] 예제코드 실행/[56:02] 상자그림 그래프/[56:57] 상자그림 표시형식 두가지/[57:38] 상자그림(boxplot)/[58:38] Alltime.moies 데이터사용/[58:51] 패키지 UsingR/[59:03] Alltime.moies 데이터 불러오기/[01:00:17] 예제코드 실행/[01:00:54] my-box=boxplot(gross)객체할당
- 03.57분 연속형 데이터를 위한 그래프, 데이터의 요약통계, 일변량 데이터
상자그림, 히스토그램, 커널밀도추정그림, 데이터 중심에 대한 요약통계, 데이터 퍼짐에 대한 요약통계, 일변량 데이터와 관련된 통계적 추론, 모평균에 대한 검정 및 신뢰구간 추정, 모비율에 대한 검정 및 신뢰구간 추정, 정규성 검정, 분포중심에 대한 비모수 검정
책갈피 : [00:04] My_box 변수의 할당량 출력/[00:22] 예제코드 실행/[00:28] 개체안에 들어있는 name/[00:43] 구성 리스트/[00:57] Stats/[01:26] Out/[01:51] %in% 연산자/[02:14] %in% 연산자 기능/[02:49] 예제코드 실행/[02:58] %in% 결과를 대괄호 안에 입력/[03:16] 예제2번/[03:43] 예제코드 실행/[03:58] 히스토그램/[04:11] 히스토그램 작성방법/[04:39] Hist함수/[04:45] Hist함수 사용방법/[05:12] 각 구간을 나누는 점들로 이루어진 벡터/[05:20] 각 구간의 개수를 표시하는 하나의 숫자/[05:33] 각 구간의 개수를 계산하는 알고리즘을 칭하는 문자열/[05:54] 기본예제코드 실행/[06:12] 구간을 바꾼 예제코드 실행/[06:38] Freq 옵션/[06:59] Probability 옵션/[07:13] Freq 옵션과 Probability 옵션 비교예제/[07:40] 예제코드 실행/[08:19] 줄기-잎 그림의 한계/[08:24] 상자그림의 한계/[08:50] 히스토그램의 한계/[09:02] 커널밀도추정그림/[09:33] Density 함수/[09:44] Faithful 데이터/[09:50] Faithful 데이터 확인/[10:28] Density 함수결과 fit개체에 할당/[10:37] 예제코드 실행/[11:23] 기본 plot함수 실행/[11:33] 예제코드 실행결과 확인/[11:52] polygon함수에 col옵션 추가/[12:35] Rug함수/[12:46] 예제코드 실행/[13:33] Jitter 함수/[14:06] 히스토그램에 커널밀도추정그림 겹쳐그리기/[14:51] Hist함수를 확률밀도로 표현/[15:06] Rug함수/[15:14] Ddensity함수/[15:27] 예제코드 실행/[15:42] 상자그림의 한계를 완화/[15:54] Violin plot/[16:01] Vioplot 패키지 설치/[16:18] 예제코드 실행/[17:14] Horizontal 옵션 결과 설명/[18:01] 일변량 데이터의 요약통계/[18:34] 데이터 중심에 대한 요약통계/[18:53] Mean, Median 함수/[19:02] Faithful의 변수 waiting/[19:14] 연속형데이터에서의 최빈값/[19:33] 최빈값 계산법/[20:09] 예제코드 실행/[20:38] 데이터에 결측값이 포함되어 있는 경우/[20:54] Airquality변수인 Ozone/[21:04] 예제코드 실행/[21:35] Na.rm 옵션/[21:56] 예제코드 실행/[22:15] Rm(remove)/[22:33] 치우친 분포의 그래프 및 요약통계량/[23:31] Cfb데이터 확인/[23:56] Income 평균값과 중앙값의 차이/[23:59] 예제코드 실행/[24:20] 실행결과를 Hist과 커널추정그림으로 확인/[24:34] 예제코드 실행/[25:06] Log변환시 주의사항/[25:24] 예제코드 실행/[26:10] 실행결과를 Hist과 커널추정그림으로 확인/[27:21] 데이터 퍼짐에 대한 요약통계/[27:42] 범위(range)/[28:00] 예제코드 실행/[28:22] 사분위범위(Interquartile range)/[28:38] Quantile 함수/[28:54] 예제코드 실행/[29:16] IQR함수/[29:34] 예제코드 실행/[29:53] 표준편차(Standrd deviation), 분산(Variance)/[30:31] Var, sd함수/[30:42] 예제코드 실행/[31:03] 일변량 데이터와 관련된 통계적 추론/[31:18] 단일 모집단의 모평균에 대한 검정 및 신뢰구간 추정/[31:49] T-test함수/[31:46] Alternative 함수/[32:29] 예제문제 실습/[33:15] t.test(x, alternative="less",mu=17)/[33:41] 주어진가설에 대한 t.test함수/[33:43] 예제코드 실행/[34:27] 95% 신뢰구간 계산/[34:46] Alternative옵션이 two.sided로 변경/[35:14] 수행결과를 res1에 할당/[35:24] 예제코드 실행/[35:46] T.test(x)$conf.int/[35:53] 예제코드 실행/[36:09] 단일 모집단의 모평균에 대한 검정 및 신뢰구간 추정/[37:02] 패키지 usingR 불러내기/[37:12] 예제코드 실행/[37:51] 단일 모집단의 모비율에 대한 검정 및 신뢰구간 추정/[38:36] Prob.test 함수/[38:52] 옵션 alternative/[39:02] 옵션 conf.lever/[39:42] X에 성공횟수를 지정하는 방법/[39:49] x=성공횟수/[40:07] Tavle()작성된 도수분포표 입력(성공횟수, 실패횟수)/[40:20] 1x2 행렬(성공횟수, 실패횟수)/[40:50] 모비율의 추정량인 X/n이 정규분포를 따르지 않는경우/[41:22] 기본 사용방법/[41:58] 예제/[43:16] Prop.test/[43:48] 예제코드 실행/[44:48] Alternative를 greate로 변경(Alternative를 to.sidede로 변경)/[44:57] 예제코드 실행/[45:15] 예제/[46:04] 95%신뢰구간 코드/[46:20] 패키지 usingR 불러오기/[46:37] 예제코드 실행/[46:58] 예제/[47:48] 예제코드 실행/[48:05] 경고메세지/[48:12] Binom.test/[48:58] 정규성 검정/[49:37] Shapiro.test() 함수/[50:17] 예제/[50:33] 예제코드 실행/[51:50] 히스토그램, 커널밀도추정그림/[52:10] 분위수-분위수 그래프/[52:33] 예제그래프/[53:07] 분위수-분위스 그림(Q-Q plot)/[53:42] 예제코드 실행/[54:42] 예제/[54:44] 예제코드실행/[55:06] Shapiro.test(log(price))/[55:28] 단일 모집단의 분포중심에 대한 비모수 검정/[56:26] Wilcoxon signed rank
- 04.1시간 1분 이변량 범주형 데이터
도수분포표 작성, 이변량 범주형 데이터를 위한 그래프, 상자그림, 커널밀도추정 그림, 평균 막대그림, 연속형 변수의 분포 비교를 위한 요약통계, 산점도 작성, 상관계수 계산
책갈피 : [00:13] Wilcox.test 사용방법/[00:31] 비모수 vs t-검정/[00:46] 그래프확인/[01:26] Log로 변환된 income/[01:48] 변수 Income/[02:29] 예제코드 실행/[02:39] P-value값/[02:52] 그래프확인/[03:04] Log변환된 income에 대괄호 적용/[03:16] 예제코드 실행/[04:35] 이변량 데이터의 정리/[05:21] 이변량 범주형 데이터의 정리/[05:31] 분할표 작성/[05:51] 데이터 Arthritis 이용예제/[06:14] 데이터 Arthritis 내용보기/[07:06] 1차원 도수분포표 작성/[07:17] 예제코드 실행/[08:00] 1차원 상대도수분포표 작성/[08:07] 예제코드 실행/[08:38] options로 소수점 자리수 조절/[09:09] 예제코드 실행/[09:36] 2차원 도수분포표 작성/[10:05] 예제코드 실행/[10:24] 2차원 분할표의 한계분포(marginal distribution)작성/[10:41] 행.열 합계구하기/[10:52] Margin.table 함수/[11:12] 예제코드 실행/[11:50] Addmargins 함수/[11:59] 예제코드 실행/[13:00] 2차원 상대도수분할표(결합분포표) 작성/[13:17] 예제코드 실행/[15:19] Table() 유용한 정보/[15:30] Airqualty $Ozone 데이터 보기/[16:18] UseNA="ifany" 옵션/[16:23] 예제코드 실행/[16:36] SAS(proc freo) or spss(crosstabs) 출력/[16:53] Crosstable함수/[17:03] 예제코드 실행/[17:20] Format="spss"옵션/[17:36] 예제코드 실행/[17:45] Expected, chisq 옵션/[18:04] 예제코드 실행/[18:25] 이변량 범주형 데이터를 위한 그래프/[19:08] 안전벨트 이용 데이터이용/[19:17] 데이터내용보기/[19:37] 쌓아올린 막대그림(barplat)/[19:44] 예제코드 실행/[20:46] 막대그림에 legend옵션 추가/[21:06] 예제코드 실행/[21:30] 옆으로 붙여 놓은 막대그림 작성/[21:35] Beside=t 옵션사용/[21:39] 예제코드 실행/[21:50] Spine plot/[22:09] Spine 함수/[22:20] 예제코드 실행/[23:08] 선에 종류와 색깔 조절/[23:17] Gpar 옵션사용/[23:41] Mosaic plot/[24:22] 예제코드 실행/[25:09] Mosaic 함수/[25:37] 예제코드 실행/[26:07] Direction=h로 지정/[26:14] 예제코드 실행/[26:45] 이변량 연속형 데이터의 정리/[27:40] 정규분포 t분포, 균등분포 난수발생시킨 결과사용/[28:11] 나란히 서 있는 상자그림/[28:25] 예제코드 실행/[29:09] 실습에 사용할 데이터내용/[29:33] Boxplot(mpg~cy`, data=mtcars)/[29:49] 예제코드 실행/[30:12] Plot함수 사용/[30:31] 예제코드 실행/[30:56] 겹쳐 그린 커널밀도추정그림/[31:35] Cyl 갯수에 따른 연비에분포를 생성/[31:54] 예제코드 실행/[32:34] 그래프상에 모든값이 나타나지 않는경우/[32:46] 위치조정/[32:52] 예제코드 실행/[33:31] Sm.density.compare(x,group,...)함수사용/[33:55] 예제코드 실행/[34:10] Cyl종류에 따른 mpg값을 평균막대그림으로 생성/[34:42] Aggregate 함수/[35:05] Tapply 함수/[35:21] 예제코드 실행/[36:45] 평균막대그림-barplot+신뢰구간 표시/[36:59] barplot2함수 사용/[38:20] 예제코드 실행/[38:35] 연속형 변수를 병렬적 분포 비교에 유용한 함수/[38:50] Summary() 함수/[38:59] 예제코드 실행/[39:09] Describe()함수/[39:22] 예제코드 실행/[39:42] Stat.desc 함수/[41:13] 예제코드 실행/[41:38] Round 함수 사용/[41:42] 예제코드 실행/[42:28] Describe 함수/[44:18] 예제코드 실행/[44:24] 경고문구 확인/[45:12] Hmisc::describe(mtcars)/[45:24] 예제코드 실행/[45:36] 연속형 변수들의 그룹별 분표 비교애 유용한 함수/[45:49] Aggregate 함수/[46:23] 예제코드 실행/[46:39] Summaryby 함수/[47:09] 예제코드 실행/[47:22] 두 연속형 변수들의 관계를 나타내는 그래프 및 요약통계/[48:49] 산점도(plot)/[49:47] Plot(x,y=null,type="p",axes=t...)/[50:42] Abline함수/[51:08] Loess.smooth 함수/[51:20] 예제코드 실행/[51:36] plot함수를 이용한 산점도코드를 실행/[51:59] 상관계수(cor)/[53:38] 예제코드 실행/[53:53] 상관계수를 구하는 코드를 실행/[54:19] 오류발생확인/[54:47] pairwise.complete.obs/[55:08] Method 옵션/[56:41] 통계적추론을 할수있는 R 함수사용법/[57:24] 두 범주형 변수의 독립성 검정/[57:51] 카이제곱 독립성 검정/[58:00] Chisq.test(x,y=null, simulate.p.value=f)/[59:21] Monte carlo 모의실험
- 05.57분 이변량 데이터와 관련된 통계적 추론, 회귀분석
카이제곱 독립성 검정, Fisher의 정확검정, 두 모집단의 모비율 차이에 대한 검정, 신뢰구간 추정, 두 모집단의 모평균 차이에 대한 검정 및 신뢰구간 추정, 두 모집단의 중심차이에 대한 비모수 검정, 회귀분석, 단순선형회귀모형, 다중선형회귀모향
책갈피 : [00:07] 카이제곱 독립성 검저/[00:13] 예제코드 실행/[00:57] 패키지 vcd 데이터/[01:21] 카이제곱 검정 실행/[01:32] 결과값 설명/[02:23] Assocstats/[02:43] 연관성 측도 관련된 통계량/[02:45] 예제코드 실행/[03:24] Fisher의 정확 검정/[04:09] Simulat 옵션/[04:31] 기타옵션 설명/[04:41] 2X2 분할표/[04:56] 오즈(odds)/[05:49] 오즈비(odds ratio, OR)/[06:30] 오즈비 2X2분할표 예/[08:05] Fisher의 정확검정/[08:20] 옵션 or/[08:31] 옵션 alternative/[08:48] 옵션 conf.int/[09:01] 옵션 conf.level/[09:11] 실습에서 사용할 teataste 내용 확인/[09:18] 2x2분할표/[10:21] 귀무가설 or=1/[10:40] 대립가설 or>1/[11:28] 설정후 fisher.test/[11:33] 예제코드 실행/[12:05] 직업 만족도 데이터/[12:23] 카이제곱 검정과 Fisher 검정 결과/[13:08] 카이제곱 검정 예제코드 실행/[13:38] Simulate.p.value=true값 적용/[13:41] 예제코드 실행/[14:21] Fisher 정확검정 예제코드 실행/[15:06] Simulate.p.value=true값 적용/[15:32] 예제코드 실행/[15:58] Systerm.time R함수 이용/[16:02] 예제코드 실행/[16:17] 카이제곱 Fisher 결과값 시간비교/[16:56] 두 모집단의 모비율 차이에 대한 검정 및 신뢰구간 추정/[17:45] Prop.test/[18:40] x값, n값 입력/[19:14] 옵션 alternative/[19:50] "less","greater"/[20:59] 귀무가설(ho), 대립가설(h1) 설정/[21:11] 예제코드 실행/[21:26] 함수 prop.test(x=x, n=n)/[22:07] prop.text(x=x12)$p.value/[22:10] 예제코드 실행/[22:48] 두 모집단의 모평균 차이에 대한 검정 및 신뢰구간 추정/[23:04] 독립된 두 표본에 대한 추론/[23:24] 짝을 이룬 표본에 대한 추론/[23:53] 독립된 두 표본에 대한 추론 예제/[23:57] T.test/[24:14] 옵션 Alternative 설정/[24:24] 옵션 var.equal 설정/[25:19] 옵션 conf.level 설정/[25:59] 귀무가설 검정/[26:09] 예제코드 실행/[26:52] Mtcars 데이터 이용/[27:07] Mtcars 데이터 내용 확인/[28:01] T.test 로 변수 지정/[28:04] 예제코드 실행/[29:26] Boxplot을 이용한 분포 비교/[29:25] 예제코드 실행/[30:13] 두 모집단의 분산 동일성에 대한 f-검정/[30:27] var.test 함수 이용/[30:43] 귀무가설 = 분산1/분산2=1/[31:22] 예제코드 실행/[32:32] var.equal 함수사용하지 않을경우/[32:46] 짝을 이룬 표본에 대한 추론 예제/[33:03] T.test/[33:06] Paired=t/[33:30] Mass에 shoes 데이터 확인/[34:52] t.test(a,b, paired=T) 모평균 검정 실행/[34:57] 모평균 검정 실행결과 확인/[35:58] 두 모집단의 중심차이에 대한 비모수 검정/[36:08] Wilcoxon rank sum 검정/[36:12] Wicoxon singed rank 검정/[36:31] Wilcox,test 함수 사용/[37:13] 귀무가설 mu=0/[37:18] 옵션 pairde=f/[37:52] 균등분포에서 10개 랜덤추출/[38:19] 예제코드 실행/[38:44] 변수 mpg, am/[39:08] 예제코드 실행/[39:37] Alternative="less"/[40:01] 경고문구 출력/[40:26] shoes$A, shoes$B, paired=t/[40:41] 예제코드 실행/[40:54] 경고문구 출력/[41:24] 회귀분석/[42:00] 단순선형회귀모형/[42:21] 종속변수, 독립변수/[42:41] 오차항 확인/[42:50] 데이터프레임 women이용/[43:24] plot(weight~height, data=women) 두변수 비교/[43:29] 예제코드 실행/[43:56] 함수 lm(linear model)/[43:59] 예제코드 실행/[44:50] 함수 lm 주요인자/[45:25] names(fit) 내용 확인/[45:54] 회귀분석 결과의 획득에 유용하게 사용되는 함수/[46:20] 패키지 car이용/[46:48] 예제코드 실행/[47:17] 다중선형회귀모형/[47:24] 종속변수, 독립변수/[47:44] 오차항 확인/[48:23] 회귀모형의 적합/[48:43] 함수 lm 사용방법/[48:48] 옵션 data/[48:59] 옵션 subset/[49:18] Subeset이용 예제/[49:58] 옵션 weights/[50:28] R공식에서 사용되는 기호/[50:41] 다중선형회귀모형/[50:45] State.x77 데이터 내용 확인/[51:35] State.x77 데이터 타입 data.frame/[52:56] Plot(states)/[53:00] 예제코드 실행/[54:11] Scatterplotmatrix함수/[54:26] 예제코드 실행/[55:14] Pairs(states)/[55:21] 예제코드 실행/[55:44] Pairs 개념, 사용예제 확인/[56:06] Pairs 예제 결과확인/[56:31] 기존예제에 pairs예제를 조합/[56:46] 예제코드 실행/[56:59] 종속변수 murder과 독립변수 지정/[57:09] 예제코드 실행
- 06.56분 다중선형회귀모형
회귀모형의 추론, 회귀모형의 anova표 사용, 회귀진단 및 대안탐색, 회귀모형의 가정 만족여부 확인, 동일분산 가정 확인, 정규분포가정 확인, 독립성 가정 확인, 선형관계 확인, 다중공선성 확인에 특이한 관찰값 탐지
책갈피 : [00:07] 다중선형회귀모형/[00:42] # summary/[01:08] Residuals/[01:36] Coefficients/[02:51] Signif. codes/[03:00] Multiple R-squared/[04:05] F-statistic/[04:41] anova/[05:14] 분산분석기법/[05:25] 효과에 따른 변동, 오차 변동/[05:54] F ratio/[07:05] anova를 적용한 회귀결과/[09:13] anova표 살펴보기/[10:05] fit, fit2/[11:06] illiteracy/[11:35] 귀무가설을 기각하기 못하는 예/[11:57] fit3과 fit1의 비교/[12:31] frost/[12:46] # predict/[13:01] object/[13:13] newdata/[13:26] interval/[13:58] Population/[14:14] Murder/[14:29] 결과 보기/[15:20] data=women/[16:22] n차 다항회귀 모형 설정/[16:28] poly, I/[17:06] poly함수의 일반적 사용방법/[18:06] raw=T/[18:22] weight, height/[18:34] 결과 보기/[18:51] 1차 단순회귀모형, 2차 다항회귀모형/[19:06] 회귀분석/[19:55] 회귀모형의 가정 만족여부 확인/[20:19] plot/[20:55] par/[21:28] which/[21:54] 단순선형회귀모형/[23:00] 네가지 회귀모형의 가정/[24:11] 오차항의 동일분산 가정/[24:58] ncvTest/[26:01] 오차항의 정규분포 가정/[26:36] 로버스트 선형회귀/[26:56] shapiro.test/[27:01] 결과 확인/[27:52] 오차항의 독립성 가정/[28:39] durbinWatsonTest/[28:55] 1차 자기상관 관계/[29:38] length/[30:52] expression/[31:08] 결과 확인/[32:14] p-value/[32:56] women 데이터프레임 살펴보기/[33:46] 선형관계/[35:00] 독립변수, 종속변수/[35:20] crPlots/[35:29] 부분잔차 산점도 작성/[37:21] 다중 공선성/[38:32] 분산팽창계수/[39:12] 결과 확인/[40:51] 특이한 관찰값 탐지/[41:31] influence.measures/[42:20] inf/[43:03] 미50개주 데이터 출력/[44:17] 그래프 작성/[45:08] hat/[45:42] Leverage/[45:48] abline/[46:41] 코드 수행/[47:11] identify/[48:20] labels/[49:23] identify종료/[50:13] Cook's Distance/[51:25] influence.measures/[51:52] avPlots/[54:06] id.method/[54:23] 코드 수행
- 07.55분 대안 탐색
종속변수의 변환, 독립변수의 변환, 변수의 선택, 검정에 의한 방법, 모형선택 기준에 의한 방법, 최근접 이웃을 사용한 분류, 정의, KNN알고리즘
책갈피 : [00:10] 잔차/[00:36] 스튜던트화 잔차/[00:54] p밸류 계산/[01:37] 세가지 통계값에 대한 그래프/[02:02] 코드 수행 결과/[02:40] 알래스카 주의 경우/[03:05] 네바다주의 경우/[03:54] 자유도, t분포/[04:48] outlierTest/[05:06] 코드 수행/[05:55] Bonferonni p밸류/[06:51] 대안 탐색/[07:26] 종속변수 독립변수의 관계/[08:00] 변환 R함수 살펴보기/[08:15] Box-Cox변환/[09:21] 코드 살펴보기/[09:28] 람다값/[09:43] 코드수행 결과/[11:20] 반응변수 변환시 주의점/[12:38] powerTransform 함수 적용 결과/[13:51] 종속변수의 로그변환/[14:34] 독립변수의 변환방법/[15:00] boxTidwell/[16:01] 함수적용결과/[16:35] 오류발생 요소 제거/[17:25] women을 이용 boxTidwell 함수 수행/[18:14] R공식에서 사용되는 기호/[18:24] 다항회귀모형 설정 결과/[18:37] summary함수를 이용한 결과값/[20:09] 모델의 선형성 확인/[20:41] 변수선택에 대해 살펴보기/[21:08] 변수선택의 두가지 방법/[21:24] 검정에 의한 방법/[22:13] 검정방법의 단점/[23:05] addterm, dropterm/[23:28] state.x77을 이용해서 살펴보기/[23:39] data.frame 형태/[25:20] 전진선택법/[26:44] 코드수행을 통한 변수영향력 알아보기/[28:04] fit=update/[28:32] 기호.물결./[29:03] 코드수행 결과/[29:36] addterm에 변수 적용/[29:55] population, Area, illiteracy/[31:03] 후진소거법/[32:41] dropterm함수 수행결과/[34:01] 변수를 제거한 수행결과/[34:34] 유의 수준/[35:16] 전진선택법의 추가검정/[36:06] 단계별 선택법/[36:22] 후진소거법/[36:50] 모형선택 기준에 의한 방법/[37:06] 통계량의 종류/[37:53] 모든 가능한 회귀방법/[38:56] 빅데이터/[39:19] AIC, BIC/[39:36] regsubsets/[40:05] 수행 결과 확인/[41:12] 모형의 최적기준/[41:38] names(cri.fits)/[41:54] rsq. rss/[42:09] adjr2, cp, bic, outmat/[42:33] 수정결정개수와 cp통계량을 이용한 모형선택/[43:29] 코드수행 결과/[44:51] 회귀개수가 다섯개인 모형/[45:08] 회귀개수가 여섯개인 모형/[45:42] AIC를 이용한 단계별 변수선택법/[46:45] 코드수행 결과/[48:39] both/[49:45] step을 이용한 결과/[50:48] 기계학습/[51:18] 기계학습의 세분화/[51:29] 기계학습 알고리즘/[51:46] 기계학습 내용시 참조할 웹페이지 주소/[51:56] 최근접 이웃을 사용한 분류/[53:00] 최근접이웃 분류기의 정의/[53:37] KNN알고리즘
- 08.54분 최근접 이웃을 사용한 분류
KNN알고리즘을 활용한 유방암 진단, 나이브 베이즈를 사용한 분류, 베이즈 이론, SMS 메세지 필터
책갈피 : [00:12] dist 함수/[00:24] 유클리드 거리방법/[00:57] 유클리드거리& 맨하튼거리/[01:58] 테스트 데이터, 훈련데이터/[02:18] TEST데이터의 범주 분류/[02:35] 1NN분류/[02:45] k=3/[03:44] 미래의 데이터 일반화 결정/[04:03] k의 설정/[05:45] 실습의 단계/[05:50] uci기계학습 저장소 사이트/[06:06] Breast Cancer Wisconsin/[06:17] 기부 데이터 다운로드/[06:26] wdbc.data/[06:36] wdbc.names/[06:50] 유방암덩어리에 대한 측정값/[08:03] 실습데이터 보기/[08:28] read.table/[08:44] stringsAsFactors/[09:22] 코드수행 결과/[10:15] id, diagnosis/[10:27] knn알고리즘 적용을 위한 데이터 다듬기/[10:44] 코드수행 결과/[11:19] labels옵션/[11:51] summary/[13:08] 수치데이터의 정규화 사용자함수 만들기/[13:39] 코드 수행 결과/[13:49] 간단한 백터로 함수 수행/[14:20] 사용자 정의 함수 적용/[14:37] lapply/[15:21] summary함수로 결과값 보기/[15:45] 훈련과 테스트 데이터 만들기/[16:54] 코드 수행/[16:57] 훈련셋과 테스트셋을 만들 때의 주의점/[17:41] sample함수/[18:13] knn알고리즘/[19:11] 훈련데이터수의 제곱근/[19:47] Euclidean distance/[20:08] 모델 성능 평가/[20:20] CrossTable/[20:37] prop.chisq/[21:04] 양성, 악성의 결과값들 확인/[21:43] Cell Contents/[23:46] 정규화 방법 변환/[24:22] scalse함수 적용 결과보기/[25:26] 교차표 결과값/[26:17] for/[26:36] CrossTable함수의 수행 결과/[27:17] res$t/[27:45] Results1/[28:54] 결과값 확인/[30:24] 나이브 베이즈를 사용한 분류/[31:07] 베이즈 이론/[31:26] 예제를 통한 살펴보기/[31:59] 사전확률/[32:23] 사후확률/[32:49] Viagra/[33:11] 주변우도/[33:22] 우도/[35:11] 나이브베이즈 알고리즘/[35:40] 나이브베이즈 알고리즘의 단점/[36:03] 나이브베이즈 알고리즘의 장점/[36:36] SMS Spam Collection/[36:54] 다운로드 경로/[37:09] 파일내용 살펴보기/[37:47] 변경한 데이터/[38:20] sms_raw/[38:54] Sys.setlocale/[39:53] Korean_korea/[40:40] 결과값 확인/[41:44] factor/[42:15] 텍스트 처리에 필요한 방법/[43:00] library(tm)/[43:25] sms_corpus/[43:52] corpus함수 적용결과 수행/[45:13] 예시/[45:30] tm_map/[45:45] content_transformer/[46:41] removeNumbers/[47:18] removeWords, stopwords/[48:36] removePunctuation/[49:04] stripWhitespace/[49:38] DocumentTermMatrix/[51:05] 빈도매트릭스에서의 표현/[51:58] 데이터 준비와 탐구/[53:21] 결과 확인
- 09.57분 결정트리와 규칙을 사용한 분류
결정트리의 이해, 결정트리의 활용 예시, 결정 트리의 가지치기, C5.0결정 알고리즘, 결정트리를 이용한 은행 대출관리
책갈피 : [00:02] 단어 클라우드/[00:22] wordcloud패키지/[01:08] random.order/[01:41] 수행결과 확인/[01:59] subset/[02:46] scale변수/[03:02] 수행결과 확인/[04:08] 데이터를 적용해 모델 훈련/[05:27] findFreqTerms/[06:21] convert_counts/[08:09] naiveBayes함수/[08:24] 수행결과 확인/[08:44] 나이브베이즈 알고리즘 적용/[09:09] e1071패키지/[09:19] naiveBayes함수의 사용방법/[09:51] laplace추정기/[10:26] 코드 수행 결과값/[12:05] predict로 테스트메세지의 범주 예측/[12:58] 수행결과 확인/[13:52] 예측값과 실제범주 비교/[14:18] prop.t/[14:35] dnn/[14:45] 교차표 생성/[15:43] 모델성능향상 방법/[16:17] 결과 살펴보기/[17:05] 나이브베이즈 알고리즘 정리/[18:02] 결정트리 분류/[18:45] 결정트리의 이해/[19:25] 루트 노드, 결정 노드, 잎 노드/[20:15] 활용되는 분야/[21:18] 결정트리 가지치기/[21:38] 예시를 통한 살펴보기/[24:04] 결정트리 가지치기의 경우/[25:09] 결정트리의 속성구분 특징/[26:53] C5.0 알고리즘을 통한 실습/[27:32] C5.0 알고리즘의 특성/[27:53] 속성의 선택/[28:27] Entropy를 계산하는 방법/[29:33] Entropy 예시/[31:24] 결정트리 가지치기의 원리/[32:15] C5.0알고리즘의 장단점/[32:36] 사후 가지치기/[33:08] 위험대출 신청자 예제/[33:28] UCI기계학습 저장소/[33:41] view all data sets/[33:50] German Credit Data/[34:50] credit.csv/[35:06] 실습데이터 저장방법/[35:31] read.csv/[35:40] str함수로 데이터구조 살펴보기/[37:04] 체킹계좌, 세이빙계좌/[37:41] 대출기간, 대출총액/[38:19] 훈련데이터, 테스트데이터/[39:47] set.seed/[40:41] runif/[41:04] 데이터 분류 코드 수행/[42:07] C50패키지/[43:35] factor속성/[44:05] 결과값 확인/[44:48] summary함수로 트리내용 살펴보기/[47:40] 훈련데이터상 잘못된분류 교차표/[48:44] credit_pred/[49:14] 코드수행 결과/[50:18] Boosting/[51:19] C5.0함수의 부스팅/[51:46] 코드수행 결과/[52:29] summary함수를 적용한 살펴보기/[53:04] credit_boost_pred10/[54:28] error_cost/[54:44] matrix내용 살펴보기/[55:49] 패널티를 적용한 모델 결과
- 10.54분 규칙학습자 & 회귀기법
규칙 학습자의 이해, 독버섯 식별을 위한 실습, 회귀 이해, 선형 회귀를 사용한 의료비 예측 실습
책갈피 : [00:02] 규칙학습자/[00:14] 규칙학습자의 활용예시/[00:34] 규칙학습자와 결정트리의 차이/[01:59] 결정트리로부터의 규칙학습자/[02:44] 동물집단 예시/[03:42] 트리의 규칙으로 살펴보기/[04:34] C5.0함수/[05:03] 수행 결과 확인/[06:21] 규칙학습자 알고리즘 적용 수행 결과/[07:27] 규칙학습기를 이용한 독버섯 식별하기 예제/[07:47] UCI기계학습저장소의 버섯데이터 셋/[08:22] 항목설명/[08:57] mushrooms.csv/[09:19] raw데이터 저장/[09:52] read.csv/[10:04] 명목형 척도/[10:44] 구조 살펴보기/[11:53] NULL제거/[12:16] 범주정보 살펴보기/[12:42] poisonous, edible/[13:02] OneR/[13:59] 틸트 연산자/[14:31] 닷의 사용/[14:40] ?formula/[14:57] 훈련셋과 테스트셋/[15:28] 수행결과 확인/[16:02] 용어설명/[17:04] summary함수를 분류기에 적용/[18:25] mushroom_classififier/[18:55] mushroom_prediction/[19:27] 결과값 확인/[19:57] 추가적인 함수 살펴보기/[20:08] JRip/[20:41] 수행결과 확인/[20:55] foul/[22:18] summary함수를 분류기에 적용/[23:00] 나누어 정복하기, 구분해 정복하기/[23:22] 선형 회귀,트리, 모델 살펴보기/[23:36] 회귀분석/[24:08] 활용 예시/[24:47] 단순 선형 회귀/[25:09] 다중 회귀/[25:19] 로지스틱 회귀/[25:33] 포아송 회귀/[25:56] 미국의 환자의료비를 포함한 가상데이터셋/[26:25] 보험회사/[27:46] insurance.csv 구조 확인/[28:37] age/[29:00] sex, bmi/[29:28] children, smoker/[29:46] region/[31:00] 차지의 분포 살펴보기/[32:33] table(insurance$region)/[33:10] cor/[34:52] pairs/[35:50] pairs.panels/[36:41] 추가적인 시각정보/[38:53] 로이스 곡선/[39:22] 데이터로 모델 훈련/[39:55] 수행 결과 살펴보기/[42:14] 더미 코딩/[42:39] sex변수/[42:59] region변수/[45:50] summary로 결과값 살펴보기/[46:40] 0.05레벨/[48:10] 모델 성능 향상/[49:52] age2/[50:16] bmi항목/[52:47] 결과값 확인
- 11.58분 수치 데이터의 예측 회귀기법 & 인공 신경망 알고리즘
인공 신경망 알고리즘의 이해, 인공신경망 알고리즘을 이용한 콘크리트의 내구력 모델 학습/인공 신경망 알고리즘의 이해, 인공신경망 알고리즘을 이용한 콘크리트의 내구력 모델 학습
책갈피 : [00:02] 수치예측 트리 알고리즘 살펴보기/[00:19] 회귀 트리/[01:09] 모델 트리/[02:23] 회귀트리와 모델트리의 이해/[04:17] 수치예측용 트리/[04:44] 결정트리 방법/[04:54] 수치결정 트리에서의 균일성/[05:06] 표준편차리덕션/[06:45] SDR/[08:34] 화이트와인 데이터 예시/[08:53] whitewines.csv 구조 살펴보기/[09:43] 회귀 트리 모형/[10:34] hist로 살펴보기/[11:10] wine_train, wine_test 수행 결과/[11:50] rpart패키지/[12:15] ?rpart.control/[12:40] rpart함수 수행 결과/[14:11] rpart.plot/[14:23] 코드수행 결과/[14:40] 디지트 파라미터/[14:53] fallen.leaves=T/[15:11] type옵션/[15:28] ?rpart.plot/[15:49] extra옵션 조정/[16:04] prdict를 사용한 수행 결과 확인/[18:24] 평균 절대 오차값 계산하기/[19:56] 성능향상을 위한 모델트리 만들기/[20:40] 수행 결과 확인/[22:11] 데이터등급 예측결과 살펴보기/[23:11] 인공신경망 알고리즘/[23:46] 인풋, 아웃풋 신호/[23:58] 생물학적 뉴런/[24:30] 인공 뉴런/[26:15] 휴리스틱/[27:33] 인공 두뇌/[28:31] 인공신경망 활용 예시/[29:52] 블랙박스 기법/[31:23] 인공뉴런 모델 살펴보기/[33:09] 네트워크 토플로지/[33:21] 활성함수/[33:34] 임계활성함수/[34:45] 로지스틱 시그모이드 함수/[35:40] 다양한 활성함수 살펴보기/[35:52] neuralnet/[36:51] 쌍곡선탄젠트 함수/[37:55] 스쿼싱함수/[38:57] normalize/[39:30] 네트워크 토플로지/[39:52] 노드, 링크/[40:28] 층/[41:06] 인공신경망 네트워크 예시 그림/[42:30] 은닉층/[43:12] 멀티플 히든레이어/[43:20] 정보진행 방향/[43:49] 전방향 네트워크/[43:59] 재귀 네트워크/[45:48] neuralnet의 옵션/[47:09] 과적합/[48:31] 가중치 학습 알고리즘/[49:42] 오차 역전파 알고리즘/[51:04] 인공신경망 알고리즘의 장단점/[52:15] 콘크리트 압축 내구력 예시/[52:40] concreate.csv함수 구조 살펴보기/[53:23] 속성 데이터의 분포 살피기/[54:15] lapply를 사용한 코드 수행/[55:11] normalize
- 12.58분 인공신경망 알고리즘 & 서포트 벡터 머신
콘크리트의 내구력 모델의 실습, 서포트 벡터 머신의 원리, 광학식 문자 인식 실습
책갈피 : [00:02] concrete_norm/[00:50] train, test/[01:12] 콘크리트 내구력 모델화/[01:28] multilayer feedforward neural network/[02:04] RSNNS패키지/[02:58] 속성 공식/[03:46] concrete_model 수행/[04:09] plot 적용 피드포워드 신경망 생성/[05:14] 바이어스 텀/[06:31] compute함수/[07:38] 코드 수행 결과/[08:23] predicted_strength/[09:21] 코드 수행 결과/[11:08] concrete_model2/[12:10] 코드 수행 결과/[12:50] 서포트 벡터 머신/[13:19] 서포트 벡터 머신의 이해/[13:43] 초평면/[14:37] 선형 분리/[15:35] 의사결정의 경계/[16:38] 최대 마진 초평면/[16:49] 서포트 벡터/[17:46] 벡터 기하학/[18:00] 벡터기하학의 기본 원리/[18:15] 볼록 껍질/[18:40] 서포트벡터머신 활용분야/[19:15] 분류 작업 활용/[19:39] 이미지 처리/[20:25] 이미지데이터 문제 해결/[21:25] 광학식 문자 인식/[22:57] 손글씨 이미지 데이터/[23:02] UCI기계학습저장소 URL/[23:24] letterdata.scv구조/[24:41] 이미지 부가설명/[24:59] 서포트벡터머신 학습기의 처리속성/[26:19] ksvm함수/[26:38] 속성 데이터의 분포 살피기/[27:03] train, test 수행/[27:47] 서포트벡터머신 적용 선택패키지/[28:09] kernlab/[29:02] 커널정보/[29:28] 커널트릭/[29:47] 커널 함수의 형식/[30:06] 예제 살펴보기/[31:17] 커널의 의미/[31:36] 선형 커널/[31:50] 차수 다항 커널/[31:57] 시그모이드 커널/[32:22] 가우시안 RBF커널/[33:38] 선형 커널함수 사용/[33:55] ?ksvm 검색/[34:13] C옵션/[34:44] Cost Value/[36:24] 코드 수행 결과/[37:05] test데이터로 성능 살펴보기/[37:25] predict함수의 타입 옵션/[37:57] 코드 수행 결과/[38:24] 예측된 문자와 실제문자 비교/[39:17] agreement/[40:52] RBF커널 사용/[41:07] rbfdot 코드 수행 결과/[41:57] K평균을 이용한 군집화 머신러닝/[42:49] clustering/[43:55] 군집화의 활용예시/[45:08] 학회개체 예시/[46:38] 축 평행분할/[47:42] k평균 알고리즘/[51:56] k평균 알고리즘의 속성값/[52:57] k평균 알고리즘의 장단점/[54:06] 군집의 수/[55:32] k값의 설정/[56:09] 엘보우 기법
- 13.54분 K평균을 이용한 군집화 & 연관규칙
K평균을 이용한 잠재 고객 분류 실습, 연관규칙의 이해, 연관 규칙을 이용한 실습 데이터 학습
책갈피 : [00:01] k평균을 이용한 잠재고객 분류실습/[01:16] 데이터 수집/[01:22] snsdata.csv 구조 살펴보기/[01:33] snsdata 설명/[01:57] 스트럭쳐 함수 결과 살펴보기/[03:20] 데이터에 대한 모델 훈련/[03:47] kmeans함수/[05:50] as.data.frame/[06:44] 데이터의 그룹핑/[07:22] k값의 설정/[07:58] elbow point값 코드 수행/[09:15] plot 결과 확인/[10:31] iter.max파라미터/[11:20] kmeans함수로 생성한 객체 구조/[11:34] withinss/[11:46] tot.withinss/[12:00] betweenss/[12:10] size/[13:08] totss/[13:16] centers항목/[16:18] 클러스터 항목 살펴보기/[16:43] teens$cluster/[16:59] aggregate/[17:21] 코드 수행 결과/[17:45] 결측값과 잘못된 정보/[18:18] ifelse함수/[20:46] mean/[21:40] 결측값 확인/[22:07] ave함수/[22:23] ?ave/[22:36] ave예시/[24:22] mean함수/[24:54] FUN/[25:35] 코드 수행 결과/[26:27] 군집에 따른 남녀비율 차이 살펴보기/[27:09] table함수/[28:23] useNA/[29:03] aggregate/[30:09] friends~cluster/[31:03] 모델 평가 살펴보기/[34:09] 추가적인 더미 변수생성/[34:35] 코드 수행 결과/[35:36] 연관 규칙/[36:01] 장바구니 데이터 분석 식료품 규칙/[36:25] 연관성 규칙/[37:35] 연관 규칙 활용 예시/[38:22] 연관 규칙의 장단점/[39:21] 선물가게DB 살펴보기/[40:39] support, confidence/[40:56] 꽃->병문안카드 신뢰도계산/[42:23] 병문안카드->꽃 신뢰도 계산/[44:47] Apriori원리/[45:17] 예시/[48:20] apriori함수/[48:39] 식료품 구매 데이터/[48:52] 엑셀로 groceries.csv살펴보기/[50:05] read.transactions함수 결과값 살펴보기/[52:13] inspect함수
- 14.54분 연관규칙 & 모델 성능 평가
연관 규칙을 이용한 실습 데이터, 정확도와 오차율, 카파통계, 민감도, 특이도, 정밀도, ROC 커브
책갈피 : [00:00] 통계값을 시각화하는 함수/[00:10] itemFreguencyPlot/[00:39] 서포트 옵션을 이용한 제한표현 결과/[01:15] 탑엔 옵션을 이용한 제한표현 결과/[01:43] image/[01:51] groceries객체 내용 살펴보기/[03:31] image함수를 통한 시각적 내용확인/[04:20] 거래내역 살펴보기/[06:11] sample을 이용한 랜덤효과/[07:06] 데이터로 모델을 훈련하는 코드 살펴보기/[07:14] apriori함수 실행방법/[07:58] 옵션이 없는 코드 수행결과/[08:51] 기본설정값을 낮춰보기/[09:58] 신뢰도값/[10:19] 예시/[12:37] groceryrules옵션을 사용한 코드수행결과/[13:45] 연관규칙의 이해/[14:31] lift값/[15:59] Inspect함수/[16:28] 규칙의 해설/[17:43] arules패키지/[18:11] sort/[18:35] 코드 수행 결과/[19:38] subset/[20:24] 코드 수행 결과/[22:18] %ain%/[22:52] %pin%/[23:32] %in%/[24:01] lhs/[24:43] groceryrules_df/[25:19] write/[25:38] csv파일을 엑셀로 열어보기/[25:55] 모델성능 평가 방법/[26:08] train, test/[27:17] 나이브 베이즈 실습 이용/[27:41] e1071패키지/[27:49] sms_classifier/[28:07] CrossTable/[28:24] 정확도와 오차율/[29:02] True Positive/[29:16] True Negative/[29:29] False Positive/[29:40] False Negative/[30:48] confusionMatrix/[31:35] 코드 수행 결과/[33:21] 카파 통계/[37:20] kappa/[38:14] kappa2/[38:59] 민감도, 특이도, 정밀도의 계산/[39:10] sensitivity/[39:48] specificity/[40:25] precision/[41:07] caret패키지/[41:52] 코드 수행 결과/[44:10] ROCR패키지/[44:22] 예제확인
- 15.58분 모델 성능 평가 & 데이터의 시각화(1)
샘플링 방법, 파라미터 조절, 메타학습을 활용한 모델 성능 향상, ggplot 함수의 기본적인 사용 방법, 산점도, 선 그래프, 막대 그래프
책갈피 : [00:02] 모델성능 향상방법/[00:18] 샘플링 방법/[00:37] 홀드아웃 기법/[01:11] credit.csv구조 살펴보기/[01:38] runif/[02:25] order/[03:22] 홀드아웃 기법의 문제점/[04:34] 층화 무작위 홀드아웃 기법/[04:47] createDataPartition/[06:17] credit_train, credit_test/[06:42] 코드 수행 결과/[07:56] 반복 홀드아웃 기법/[08:03] 교차검정/[09:24] createFolds/[09:55] 그룹생성 결과/[10:47] test데이터를 만드는 방법/[11:04] folds, my_function lapply/[11:28] my_function/[12:04] kappa2/[12:28] cv_results/[13:49] 부트스트랩 샘플링/[14:48] 교차검증과 부트스트랩의 차이점/[16:03] 파라미터 조절/[16:22] KNN알고리즘/[17:40] 시행착오방법의 단점/[18:01] 캐럿패키지 정리표/[18:39] 자동조절기능/[19:04] 캐럿패키지의 모델생성과 탐색/[20:09] train함수의 사용방법/[20:27] 코드 수행 결과/[20:40] 입력된 데이터에 대한 간략한 정보/[20:59] 부트 스트랩핑 방법/[21:15] 경고출력 내용 살펴보기/[21:35] 복원추출/[23:37] predict/[24:01] train함수의 조건을 변경하여 수행/[24:42] trControl/[25:08] cv/[25:40] best/[26:19] oneSE/[26:30] tolerance/[27:32] expend.grid/[27:54] 코드 수행 결과/[28:40] 새로운 조건으로 코드수행/[30:58] 메타학습방법/[31:04] bagging방법/[31:54] ipred패키지/[32:45] 코드 수행 결과/[33:51] boosting방법/[34:13] bagging과 boosting의 차이점/[34:37] random forests방법/[35:11] randomForest함수/[35:41] ntree파라미터/[36:00] mtry파라미터/[36:50] 코드 수행 결과/[37:54] 기본파라미터값 정확도/[38:56] m_rf, m_c50 결과 비교/[40:01] R을 활용한 데이터의 시각화/[40:13] ggplot2, gcookbook/[41:02] 산점도 그리기/[41:55] mtcars 데이터프레임 내용 살펴보기/[42:58] + geom_point/[43:51] 산점도 비교 코드 수행 결과/[44:07] 선 그래프 그리기/[44:19] + geom_line/[44:41] 그래프 비교 수행 결과/[44:49] 막대 그래프 그리기/[45:02] + geom_bar/[45:10] stat="bin"/[46:02] 코드 수행 결과/[46:14] barplot/[47:40] 코드 수행 결과/[48:00] 히스토그램 그리기/[48:57] binwidth옵션/[49:33] breaks인자의 다양한 활용/[50:01] 히스토그램 그래프 비교/[50:36] hist함수의 breaks옵션 수정해서 살펴보기/[51:06] 박스 플롯 그리기/[51:40] 패키지 비교 결과/[52:07] interaction/[52:58] 함수곡선 그리기/[54:32] 막대 그래프 그리기/[55:26] BOD 데이터프레임 코드 수행 결과/[56:43] fill 파라미터
- 16.59분 데이터의 시각화(2)
막대그래프의 모양 수정, 누적 막대 그래프, 비율 누적 막대 그래프, 클리블랜드 점 그래프
책갈피 : [00:00] 여러그룹의 막대그래프 그리기/[00:09] cabbage_exp 살펴보기/[01:01] x, y, fill/[01:37] identity, dodge/[01:59] dodge를 명시하지 않은 경우/[02:38] dodge를 명시한 수행 결과/[03:14] scale_fill_brewer/[03:36] display.brewer.all수행 결과/[04:13] 팔렛을 사용한 그룹정보 색 확인/[04:34] scale_fill_manual/[05:11] reorder를 사용한 x축 순서 재정렬하기/[05:27] uspopchange데이터 살펴보기/[06:28] rank/[06:49] change, rank(change)값을 비교하기/[07:55] upc객체를 사용한 그림 그리기/[09:16] reorder함수를 사용한 코드 수행 결과/[11:02] FUN=mean/[12:21] labs/[12:56] 음수와 양수막대 다르게 색상 입히기/[13:14] climate데이터 살펴보기/[13:54] stack, identity/[14:25] position옵션 유무에 따른 결과값/[15:36] 0을 기준으로 그래프 색상을 변경하는 방법/[16:25] 코드 수행 결과/[16:48] 그래프 색상을 메뉴얼하게 지정하는 방법/[18:04] 코드 수행 결과/[18:39] 막대의 너비와 간격 조절하기/[19:35] pg_mean데이터 살펴보기/[20:19] width정보를 다르게 한 비교/[21:40] position_dodge/[22:34] dodge와 width값 설정에 따른 비교/[25:18] 누적 막대그래프/[25:51] 옵션이 없는 상태의 수행 결과/[26:48] guides/[27:24] cabbage_sxp 코드 수행 결과/[27:58] 비율 누적 막대 그래프/[28:35] play패키지/[29:17] 코드 수행 결과/[30:35] ddply/[31:16] Date정보에 따른 결과/[33:00] percent_weight코드 수행 결과/[34:52] 막대그래프에 라벨 추가하기/[35:16] geom_text/[36:01] 코드 수행 결과/[37:18] 묶인 막대 그래프/[38:22] position_dodge/[39:37] ymax지정방식/[40:29] 코드 수행 결과/[40:49] geom_text/[41:36] 누적 막대 그래프/[42:58] ddply함수 이용/[43:55] 코드 수행 결과/[44:42] ce데이터 플랫/[45:44] y값을 재설정한 결과/[48:00] 클리블랜드 점 그래프 그리기/[48:37] geom_point/[48:48] tophitters2001 데이터 살펴보기/[49:30] tophit/[49:45] tophit객체표 보기/[50:26] reorder, theme_bw/[51:19] theme/[51:57] element_line/[52:50] geom_segment/[55:42] xend, yend, color 수치를 바꾼 결과/[56:50] 백그라운드와, 테마, 포인트를 변경한 결과/[58:11] y축 명칭의 재정렬
- 17.53분 데이터의 시각화(3)
클리블랜드 점 그래프, 선 그래프, 축 정보 변경하기, 여러 그룹 선 그래프, 그래프에 음영 채우기, 신뢰 영역 추가, 산점도, 산점도, 적합된 회귀선 추가
책갈피 : [00:01] facet_grid/[00:42] 그래프 분할 결과 확인/[01:07] free_y/[01:59] space="free_y"/[02:29] ggplot을 이용한 선 그래프 그리기/[02:58] BOD데이터 내용 살펴보기/[03:45] x축 변수가 숫자형 변수일때/[04:10] 축정보 변경하기/[05:00] scale_y_continuous/[06:14] 순서를 바꾼 수행 결과/[06:51] ylim, scale_y_continuous/[07:28] coord_cartesian/[08:47] 코드 수행 결과/[09:24] expand_limits/[10:01] 점 추가하기/[10:11] geom_point/[10:49] 여러 선 그리기/[11:08] ToothGrowth데이터 살펴보기/[12:22] c("supp","dose")/[12:37] summarise/[13:18] 품목별 무게의 합계 결과보기/[14:31] 비타민 주입량에 따른 치아길이 평균 그래프/[15:15] group=supp/[15:57] colour=supp/[17:23] 그룹별로 포인트 모양을 바꾸는 방법/[18:29] 그룹별로 색상을 다르게 하는 방법/[19:12] 코드 수행 결과/[19:38] position_dodge/[20:03] x축이 명목형일 경우 선으로 연결하기/[20:44] 연결형과 명목형의 차이 알아보기/[22:08] group=1/[22:34] 그룹이 여러개인 데이터 프레임의 경우/[23:51] 맵핑정보와 그룹정보 표현/[24:50] climate데이터 살펴보기/[25:52] clim/[26:52] 그래프에 음영 넣기/[27:10] geom_area/[28:16] 코드 수행 결과/[28:55] geom_line/[29:22] 신뢰 영역 추가하기/[29:32] geom_ribbon/[30:37] 신뢰구간에 점선 경계선 추가하기/[31:20] 산점도/[31:38] heightweight데이터 살펴보기/[32:25] 코드수행 결과/[33:49] scale_colour_manual/[35:24] scale_shape_manual/[35:51] scale_fill_manual/[36:16] 도형의 모양과 채우는 방식을 다르게 표현하기/[36:51] heightweight group/[39:35] legend/[40:22] 연속변수를 색상이나 크기에 대입하기/[41:02] 코드수행 결과/[41:28] scale_colour_gradient/[42:21] 에스테틱스의 종류/[43:24] 연속변수를 크기에 대입한 결과/[43:55] scale_size_manual/[44:40] 코드 수행 결과/[45:58] scale_size_area/[47:19] 적합된 회귀선 추가하기/[47:30] 선형 모델로 데이터 적합/[49:06] 코드 수행 결과/[49:37] 비선형 모델로 데이터 적합/[52:04] 외삽법을 이용할 경우
- 18.1시간 3분 데이터의 시각화(4)
이미 만들어진 모형의 적합선 추가하기, 그래프의 주석 및 라벨 추가하기, 데이터의 분포 요약, 히스토그램, 밀도곡선, 박스플롯
책갈피 : [00:02] 만들어진 모형의 적합선 추가하기/[00:14] heightweight데이터 내용 확인/[01:43] geom_line/[01:50] 별도의 데이터 프레임/[02:25] newdata/[02:50] 코드 수행 결과/[04:04] 그래프 확인/[04:37] predvals 데이터 프레임 내용 확인/[05:33] 성별정보 산점도 그래프 보기/[06:20] 선형회귀분석/[06:43] plyr패키지/[07:46] models 내용 살펴보기/[08:15] f, m 회귀분석 수행 결과/[08:37] predict/[09:50] lm의 경우/[10:25] loess의 경우/[12:15] 그래프 확인/[13:00] xrange/[13:37] 외삽/[14:09] 모형개수들을 주석으로 추가하기/[14:21] 회귀분석 결과 살펴보기/[16:04] 코드 수행 결과/[16:20] parse=T/[17:04] inf, just/[19:09] just값을 조절한 코드 수행/[21:19] 텍스트 위치 변동을 위한 변경/[21:40] 텍스트 위치 변경 코드 설명/[22:00] 산점도의 점에 라벨 붙이기/[22:07] countries데이터 프레임 내용 확인/[22:55] df객체 내용/[23:38] annotate를 통한 주석 추가/[24:30] newdata 설정/[25:35] 코드 수행 결과/[26:08] geom_text/[26:53] size를 바꾼 수행 결과/[27:31] hjust, vjust/[28:48] x좌표, y좌표 치환/[29:31] hjust를 -1로 할 경우/[30:57] 일부열만 라벨을 붙이는 경우/[32:05] 데이터 분포 요약 방법/[32:22] 히스토그램/[32:27] geom_histogram/[32:52] faithful 데이터 살펴보기/[33:38] 간단한 히스토그램 그려보기/[34:37] width, fill, colour를 바꾼 히스토그램 결과/[35:11] /5 binsize/[36:03] origin/[37:54] ggplot/[38:53] 여러그룹을 히스토그램 생성하는 방법/[39:12] birthwt데이터 프레임 확인/[40:01] facet_grid(smoke~.)/[41:37] 라벨값을 조정한 결과/[42:34] revalue/[43:18] 코드 수행 결과/[43:42] facet_grid(race~.)/[44:45] scales="free"/[45:16] space="free"/[46:05] factor(smoke)/[47:06] position="identity"/[47:42] 밀도 곡선/[48:29] density/[48:51] expand_limits/[51:07] geom_histogram/[52:06] y=..density../[53:13] colour, fill/[54:27] facet_grid/[55:19] 박스 플롯/[55:29] 박스 플롯의 구성 살펴보기/[57:07] outlier.size, outlier.shape/[59:00] 옵션을 다르게한 세가지 그림을 비교해보기/[01:00:18] notch 삽입/[01:01:24] stat_summary
- 19.59분 데이터의 시각화(5)
윌킨슨 점그래프, 이차원 데이터의 밀도그래프 그리기, 주석, 텍스트 주석넣기, 선 추가하기, 부분 강조하기, 오차막대 추가하기, 축, 축 정보 변경, 눈금설정
책갈피 : [00:01] geom_violin/[01:04] violin그래프/[02:42] trim=F/[03:29] scale="count"/[03:46] adjust/[04:26] 윌킨슨 점 그래프/[05:05] 코드 수행 결과/[05:22] geom_dotplot/[07:20] boxplot, dotplot의 좌표위치 수정/[08:51] 이차원 데이터의 밀도 그래프/[09:29] stat_density2d/[10:15] colour=..level../[10:52] alpha=..level../[12:25] alpha=..density../[12:45] geom="raster"/[13:49] 대역폭을 수정한 수행 결과/[14:20] 주석/[15:01] 텍스트 주석 넣기/[16:44] annotate, geom_text/[18:27] x=inf, x=-inf/[18:49] parse=T/[19:34] Function: '*/[20:37] %*%/[21:10] 선 추가하기/[22:40] 수평선과 수직선 그리기/[23:04] 각도가 잇는 선 추가/[23:06] geom_abline/[24:23] 코드 수행 결과/[24:43] geom_hline/[25:53] PlantGrowth데이터 프레임 살펴보기/[26:10] 명목형 변수값/[26:30] pg/[28:25] 선분을 추가하는 방법/[28:33] climate데이터/[29:44] 코드 수행 결과/[30:19] angle, length를 수정한 결과값/[31:10] 각도를 조절한 활용/[31:26] 부분 강조하기(음영추가)/[31:30] rect/[33:10] 오차 막대 추가하기/[33:27] geom_errorbar/[35:06] 코드 수행 결과/[35:31] dodge/[36:39] position_dodge(.9)/[37:26] geom_line, geom_point/[38:23] pd= position_dodge/[39:04] 분할면에 주석 넣기/[39:34] mpg데이터 살펴보기/[40:25] 기본분할 그래프 내용 살펴보기/[41:00] f_labels 생성/[43:00] 축 정보 변경/[43:22] 기본 그래프 외형 살펴보기/[44:59] limits=rev/[46:05] scale_x_discrete/[47:14] 코드 수행 결과/[48:33] scale_y_continuous/[48:50] ylim/[49:02] scale_y_reverse/[50:36] 눈금 설정/[50:52] sp + coord_fixed/[51:48] 코드 수행 결과/[52:39] breaks=seq/[53:20] ratio/[54:48] PlantGrowth/[55:58] scale_x_discrete/[57:23] theme/[57:35] element_blank/[58:34] 라벨과 눈금을 동시에 제거하는 코드 수행/[58:57] breaks=NULL
- 20.59분 데이터의 시각화(6)
축, 눈금 라벨 변경, 축 라벨 변경, 축을 따라 선 표시, 범례위치 조절, 데이터 변형, 데이터 부분집합 취하기, 연속변수를 범주형 변수로 코딩, 집단별로 변형, reshape
책갈피 : [00:02] 눈금 라벨 변경/[00:14] axis.text, axis.title/[00:35] element_blank, element_text/[01:07] 눈금라벨 변경 코드 수행/[01:27] 텍스트 속성을 설정한 결과/[02:31] 축 라벨 변경/[03:58] 코드 수행 결과/[04:25] 축을 따라 선 표시/[04:34] theme_bw/[06:07] axis.line =element_line/[06:46] lineend="square/[07:07] 범례 제거 및 위치 설정/[08:05] 가이드를 이용한 코드 수행 결과/[08:22] scale_fill_discrete 효과/[08:59] legend.position/[10:03] legend.position의 좌표설정 살펴보기/[11:36] legend.justification/[12:39] legene.background/[13:13] theme()내에서 사용하는 테마 속성들/[13:36] element_rect()/[14:43] 설정값을 변경안 코드 수행 결과/[16:01] legend.key = element_blank/[16:34] 데이터 변형 항수/[18:04] PlantGrowth데이터셋 살펴보기/[18:46] subset/[19:37] 코드 수행 결과/[21:15] 대괄호를 이용한 인덱싱 방법/[22:07] with함수/[22:49] transform, mutate/[24:47] 코드 수행 결과/[25:46] cut/[26:10] 결측치/[27:26] NA로 코딩되는 예/[28:06] 명목형 변환/[28:12] wtclass/[28:36] 코드 수행 결과/[29:12] cabbages내용 살펴보기/[31:02] Cult/[32:45] ddply/[36:00] .drop.F/[36:33] 데이터에 결측치가 좋재할때/[36:53] 코드 수행 결과/[38:22] is.na/[38:30] 평균, 표준편차. 빈도수/[38:57] ci/[38:56] 신뢰구간/[39:18] se=sd/[39:54] qt함수/[41:03] 코드 수행 결과/[42:35] summarySE/[42:55] summarise/[44:05] r에서의 장점/[44:34] 신뢰구간 코드 수행/[45:22] ggplot/[45:44] geom_bar, geom_errorbar/[46:12] geom_text/[46:57] 코드 수행 결과/[47:23] reshape2패키지/[50:11] melt함수 적용/[51:11] drunk 예시 살펴보기/[52:19] plum_wide 예시 살펴보기/[54:02] co=corneas/[55:38] dcast/[56:14] 두개의 측정변수가 있는 경우
'추천강의' 카테고리의 다른 글
ugnx11 강좌 추천 리뷰 (0) | 2017.10.18 |
---|---|
엑셀2016 추천 강의 (1) | 2017.10.18 |
레빗아키텍쳐 강의 추천 (0) | 2017.10.17 |
NC코드 강좌 리뷰 추천 (0) | 2017.10.17 |
Gradle IT전문교육 추천 교육 리뷰 (0) | 2017.10.16 |