노센스와 함께하는 데이터 분석

데이터과학자, '현장에서 바로 써먹는' 시리즈 저자

(파이썬) 데이터 분석 실습 4

(파이썬) 윈도우 파이썬 및 주피터 랩 설치하기

파이썬(Python)을 사용하는 환경으로 그 동안 아나콘다(Anaconda)를 이용했었는데 라이센스 정책(개인 무료, 기업 유료)이 바뀌면서 그냥 파이썬을 설치하고, 주피터 랩(Jupyter Lab)만 설치한 환경을 구축해보도록 하겠습니다. 1. 파이썬(3.11.3) 설치하기 먼저 파이썬을 설치하겠습니다. 구글에서 "python download" 라고, 검색하거나 아래 링크를 클릭하면 파이썬 다운로드 페이지로 이동합니다. https://www.python.org/downloads/ Download Python The official home of the Python Programming Language www.python.org 여기서 원하는 버전이 있다면 해당 버전을 설치하고, 그렇지 않다면 아래와 같..

(파이썬) 빅데이터분석기사 실기 작업형2 체험하기 코드

파이썬 책 집필을 마치고, 책 내용을 이용해서 빅데이터분석기사 실기 작업형2 체험하기 코드를 한 번 만들어 보았습니다. 해당 코드는 예전에 제가 R로 작성했던 것과 언어만 다를뿐 거의 동일하며 auc는 0.82~0.83 수준으로 R을 이용했을 때 보다 다소 높게 나타났습니다. 오버샘플링(Over Sampling)이 성능 향상에 가장 큰 영향을 미쳤으나 R의 경우는 시험환경에서 Caret 패키지를 제공해 오버샘플링을 쉽게 할 수 있었는데 파이썬의 경우 imblearn 패키지를 제공해주지 않아 해당 패키지 없이 단순히 랜덤 오버 샘플링을 판다스(pandas)를 이용해 구현했습니다. 전체적인 순서는 아래와 같습니다. 1. 결측치 및 이상치 처리, 파생변수 생성 2. 랜덤오버샘플링 3. 분포변환(Standard..

(파이썬) 주피터 노트북

주피터 노트북(Jupyter Notebook)은 파이썬을 사용자가 쉽게 쓸 수 있도록 도와주는 보조 프로그램입니다. R로 따지면 RStudio와 비슷한 프로그램이라고 생각하면 큰 무리가 없습니다. 주피터 노트북은 아나콘다를 설치하면 자동으로 설치가 됩니다. 실행을 할 때는 권한 문제로 인해 패키지가 설치 안되는 문제가 생길 수 있기 때문에 "관리자 권한으로 실행"합니다. 주피터 노트북을 실행하면 아래와 같이 웹 브라우저를 기반으로 실행됩니다. 우측 상단의 "New" 버튼을 통해 "Python 3"을 선택하면 파이썬 코드를 작성할 수 있는 주피터 노트북 파일(*.ipynb)이 생성됩니다. 아래 빨간색 상자로 표시한 곳을 셀(Cell)이라고 부르며 코드를 입력하는 곳입니다. 파일의 이름은 제목인 "Untit..

(파이썬) 아나콘다 설치하기

[ 설치 데스크탑 PC 기본정보 ] ● OS : windows 10 ● GPU : Nvidia GeForce GTX 1060 3GB ● CPU : Intel(R) Core(TM) i5-6500 (3.2GHz) ● RAM : 16GB [ 설치 노트북 기본정보 ] ● 제조사 : 애플 맥북 에어 13 ● OS : windows 10 ● CPU : Intel(R) Core(TM) i5-1030NG7 (1.10GHz) ● RAM : 8GB 파이썬(Python)을 이용한 데이터 분석 환경으로 가장 널리 사용되는게 아나콘다(Anaconda)입니다. 아나콘다를 설치하게되면 파이썬과 필수적인 라이브러리가 자동으로 설치되고, R을 쉽게 쓸수 있게 도와주는 RStudio와 유사한 주피터 노트북(Jupyter Notebook..