노센스와 함께하는 데이터 분석

데이터과학자, '현장에서 바로 써먹는' 시리즈 저자

분류 전체보기 67

현장에서 바로써먹는 데이터 분석 with R

안녕하세요. 제가 작년(2020년) 10월부터 준비한 책이 드디어 세상에 나왔습니다. 데이터 분석업무를 10년 넘게 하면서 쌓은 노하우를 한 권의 책에 담았습니다. 책 제목은 "현장에서 바로써먹는 데이터 분석 with R" 입니다. 처음 쓰는 책이라 부족한 점이 많습니다. 하지만 시중의 어떤 책보다 쉽게 데이터 분석이라는 분야에 접근할 수 있게 만든 책이라는 것은 확실히 보장할 수 있습니다. 꼭 데이터 분석이라는 기술적인 측면 외에도 해당 분야의 이론과 배경지식을 쌓는데도 도움이 될 수 있게 만들었으며 실습을 위한 도구로 R을 선택했을뿐 꼭 R을 위한 책은 아닙니다. 본질은 데이터 분석이라는 기술이며 그 기술을 구현하기 위해 R이라는 도구를 썼을 뿐입니다. 기회가 된다면 Python(파이썬) 코드로 책을..

(파이썬) 아나콘다 설치하기

[ 설치 데스크탑 PC 기본정보 ] ● OS : windows 10 ● GPU : Nvidia GeForce GTX 1060 3GB ● CPU : Intel(R) Core(TM) i5-6500 (3.2GHz) ● RAM : 16GB [ 설치 노트북 기본정보 ] ● 제조사 : 애플 맥북 에어 13 ● OS : windows 10 ● CPU : Intel(R) Core(TM) i5-1030NG7 (1.10GHz) ● RAM : 8GB 파이썬(Python)을 이용한 데이터 분석 환경으로 가장 널리 사용되는게 아나콘다(Anaconda)입니다. 아나콘다를 설치하게되면 파이썬과 필수적인 라이브러리가 자동으로 설치되고, R을 쉽게 쓸수 있게 도와주는 RStudio와 유사한 주피터 노트북(Jupyter Notebook..

(R) R 및 RStudio 설치하기

[ 설치 PC 기본정보 ] ● OS : windows 10 ● GPU : Nvidia GeForce GTX 1060 3GB ● CPU : Intel(R) Core(TM) i5-6500 (3.2GHz) ● RAM : 8GB Python과 함께 데이터 분석용 언어이자 프로그램으로 널리 사용되고 있는 R 설치방법에 대해서 알아보겠습니다. 설치할 버전은 3.6.3 버전입니다. 구글(google)에서 "r download"라고 검색하셔서 첫 번째 결과로 이동합니다. 현재 기준으로는 4.0.3 버전까지 나와있네요. 최신 버전의 경우 과거 소스 호환이나 안정성 면에서 위험성이 있기 때문에 3.6.3 버전을 다운로드 받겠습니다. Previous releases 링크를 눌러 이동합니다. 그러면 아래와 같이 전체 버전 리..

(R) Tensorflow GPU 설정 방법

[ 설치 PC 기본정보 ] ● OS : windows 10 ● R : 3.6.3 64bit ● RStudio : 1.3.1093 ● Tensorflow : 2.2.0 ● GPU : Nvidia GeForce GTX 1060 3GB ● CPU : Intel(R) Core(TM) i5-6500 (3.2GHz) ● RAM : 8GB R에서 Keras, Tensorflow를 사용하는 경우 GPU를 사용할 수 있는 설정 방법에 대해서 설명드리겠습니다. 순서는 아래와 같습니다. ① 본인의 그래픽 카드가 지원되는 그래픽 카드인지 확인 ② R에서 Keras, Tensorflow 설치 및 본인이 설치한 Tensorflow 버전에 맞는 CUDA 및 cuDNN 버전 확인 ③ Nvidia CUDA Toolkit 설치 ④ Nv..

(엑셀) 인쇄 관련 팁 (페이지, 반복할 행 설정 방법)

아마도 많은 분들께서 아실테지만 모르시는 분들을 위해 글을 씁니다. 엑셀파일을 인쇄하다보면 힘든 점이 참 많은데요. 예를들어 현재 시트가 여러 페이지로 출력된다든지, 행이 너무 많아서 항목을 입력한 첫 행이 2페이지 부터는 없어서 보기가 어렵다든지 말이죠. 예를들어가며 하나씩 설명드릴게요. 아래와 같은 시트가 있습니다. 행이 많아서 스크롤을 내려보니 왠지 A4 한 장에 출력되지 않을 것 같습니다. 우선 페이지가 어떻게 출력되는지 궁금한데요. 이럴 때는 오른쪽 하단에 위치한 『페이지 나누기 미리보기』를 클릭하면 페이지가 어떻게 출력될지 알 수 있습니다. (파일 메뉴에서 인쇄를 클릭해도 볼 수 있습니다.) 『페이지 나누기 미리보기』를 하게되면 아래처럼 인쇄될 부분만 표시되고 나머지는 회색배경으로 표시됩니다...

(엑셀) 노하우 2020.12.28

(엑셀) 틀고정 사용법

엑셀을 사용하다 보면 많은 행 또는 열 때문에 기준이 되는 행, 열값을 보기가 어려울 경우가 많습니다. 예를들어 설명드릴게요. 아래보시는 것처럼 Data가 많아 한 페이지에 행이 다 보이지 않습니다. 이때 마우스 스크롤을 내리면 아래처럼 보이면서 위에 행이 뭔지 알 수가 없습니다. 바로 이런 문제 때문에 『틀 고정』이라는 기능이 존재합니다. 기준이 되는 행, 열값을 고정시킨채로 다른 Data를 보기 편하게 하기 위함이죠. 『틀 고정』은 『보기』 메뉴에 존재합니다. 간단하게 『첫 행 고정』, 『첫 열 고정』 이라는 걸 선택해서 사용할 수 있지만 작업을 하다 보면 대부분 첫 행, 첫 열은 여백으로 두는 경우가 많기 때문에 사용할 일이 거의 없습니다. 여기선 4행에 '판매일자', '제품명' 등과 같이 항목이름..

(엑셀) 노하우 2020.12.28

(엑셀) AND, OR 함수 사용법

이번 시간에는 엑셀 함수에서 단독으로 보다는 함수 내에 자주 사용되는 논리함수인 AND와 OR에 대해서 알아보겠습니다. 아마도 대부분은 AND와 OR이 어떤 함수인지 정도는 아실 거라 생각됩니다. 다만 이 녀석들을 어떻게 써야할지 모르시는 경우가 많을거라 생각되어 설명드립니다. 먼저 AND 함수의 경우 다양한 로직들이 모두 만족되어야 "True"를 출력하고 하나라도 만족하지 못하면 "False"를 출력하는 함수입니다. 예를들어 설명드리겠습니다. 아래와 같이 원가와 포장비가 있습니다. AND 함수를 이용해서 원가나 포장비 어느 하나라도(둘다 음수인 경우도 포함) 음수일 경우 "False"를 출력하고, 그 외의 경우 "True"를 출력하려 합니다. E5에 AND 함수삽입을 합니다. (참고로 AND함수는 논리..

(엑셀) 노하우 2020.12.28