노센스와 함께하는 데이터 분석

데이터과학자, '현장에서 바로 써먹는' 시리즈 저자

(책) 현바데분 with R

(현바데분withR) 책 교정 및 보충사항

노센스 2021. 9. 23. 23:19

출판 후 시간이 좀 흐른 뒤 다시 책을 보니 편집 때 찾지 못했던 오타나 수정사항 또는 설명이 부족해 보충해야할 사항들이 보여 여기에 수정하면서 하나씩 추가하도록 하겠습니다.

 

독자분들께 불편을 드려 죄송하고, 구매해주셔서 정말 감사드립니다.

 

페이지 유형 내용
53 오타 핵심요약 4번에서 전수전사가 아니라 전수조사
101 수정 끝에서 2번째 줄에
"그리고 대시(-)와 언더바(_)를 조합해서 사용할 수도 있습니다." 
"그리고 언더바(_)를 조합해서 사용할 수도 있습니다."로 변경되어야 합니다.
대시(-)는 변수명으로 사용할 수 없습니다.
185 오타 잠깐만요 상자 안의
후진소거법(Backward Selection) → 후진소거법(Backward Elimination)
196 오타 연습문제 4번의 test의 Sepal.Width(꽃받침 너비)를 종속변수(y)로 하고 에서 Sepal.Length(꽃받침 길이)로 수정
201, 215, 220, 225,230, 234, 238, 243, 247, 258, 294 업데이트 R 3.6.3 버전보다 높은 버전으로 실습할 경우 문자열 데이터를 Factor 타입이 아닌 단순 chr 타입으로 인식하는 문제를 확인하였기 때문에 파일을 불러올 때 stringsAsFactors = TRUE 옵션을 추가해 문자열을 Factor 타입으로 강제 지정
g <- read.csv("ch6-1.csv", header = TRUE, stringsAsFactors = TRUE)
c_train <- read.csv("ch6-2_train.csv", header = TRUE, stringsAsFactors = TRUE)
c_test <- read.csv("ch6-2_test.csv", header = TRUE, stringsAsFactors = TRUE)
209 오타 두 번째 코딩 실습 부분에서 g1이 아니라 g(제공된 스크립트 R파일에는 정상적으로 되어있음)
> g$gender_pred <- ifelse(g1$pred > 0.5, 'm', 'f')
210~212 수정 caret 패키지의 confusionMatrix() 함수가 positive class 기본값을 0으로 둬서 별도 지정 추가
confusionMatrix(g$gender_pred, g$gender, positive = "m")

이로인해 민감도는 93.33%, 특이도는 96.67%로 변경됨
뒤이어 Epi 패키지의 ROC 함수 또한 동일 사유로 AUC값은 동일하나 그래프에 표시되는 민감도 및 특이도가 positive class 0을 기준한 값이므로 주의
237 업데이트 install.packages("randomForest") 대신
install.packages("https://cran.r-project.org/src/contrib/Archive/randomForest/randomForest_4.6-14.tar.gz", repos = NULL, type="source") 로 변경
(randomForest 최신 패키지의 R 3.6.3 버전 미 지원 문제로 이전 버전 설치, https://datawithnosense.tistory.com/43 참고)
270 오타 그림 7-3에서 (w1, w1, b, θ) → (w1, w2, b, θ)
294 수정 첫 번째 코딩실습의 패키지 설치에서 keras, tensorflow 라이브러리를 불러온 후 함수를 이용해 본격적으로 해당 패키지를 설치할 때 path를 못찾거나 miniconda가 설치되어있지 않다는 등의 오류로 설치가 안되는 문제
Anaconda를 설치하고, install_keras(), install_tensorflow()를 실행하면 정상적으로 설치되며 
Anaconda 설치방법은 하기 포스팅 참고
https://datawithnosense.tistory.com/24