노센스와 함께하는 데이터 분석

데이터과학자, '현장에서 바로 써먹는' 시리즈 저자

파이썬 7

(파이썬) 윈도우 파이썬 및 주피터 랩 설치하기

파이썬(Python)을 사용하는 환경으로 그 동안 아나콘다(Anaconda)를 이용했었는데 라이센스 정책(개인 무료, 기업 유료)이 바뀌면서 그냥 파이썬을 설치하고, 주피터 랩(Jupyter Lab)만 설치한 환경을 구축해보도록 하겠습니다. 1. 파이썬(3.11.3) 설치하기 먼저 파이썬을 설치하겠습니다. 구글에서 "python download" 라고, 검색하거나 아래 링크를 클릭하면 파이썬 다운로드 페이지로 이동합니다. https://www.python.org/downloads/ Download Python The official home of the Python Programming Language www.python.org 여기서 원하는 버전이 있다면 해당 버전을 설치하고, 그렇지 않다면 아래와 같..

(현바데분with파이썬) 신경망 시각화 방법

독자분께서 도움을 요청하셔서 이렇게 포스팅을 합니다. "Chapter 7 인공 신경망과 딥 러닝"에서 Keras로 구현한 딥 러닝 모델의 신경망 구조를 시각화할 수 있는 방법에 대해서 설명드리겠습니다. 먼저, graphviz라는 패키지를 설치해야합니다. 해당 패키지의 경우 그래프를 쉽게 그릴 수 있게 해주지만 path로 인한 오류가 발생하는 까다로운 녀석이라 꼭 이 순서대로 해주시기 바랍니다. 아래 사이트에 가면 graphviz 패키지 windows EXE installer를 다운로드 받을 수 있습니다. https://graphviz.org/download/ Download Graph Visualization Software graphviz.org 가장 최신 버전을 받아 보았습니다. https://git..

(현바데분with파이썬) 실습 환경 프로그램 다운로드 링크

생각해보니 실습 환경 프로그램의 링크를 만들면 독자분들께서 더 편리하실 것 같아 링크를 남겨놓습니다. 모든 실습은 windows 10 64bit 환경에서 이뤄집니다. [아나콘다 기반 파이썬 환경] ● 아나콘다(2020.11) : https://repo.anaconda.com/archive/Anaconda3-2020.11-Windows-x86_64.exe ● JDK(17.0.4.1) : https://download.oracle.com/java/17/archive/jdk-17.0.4.1_windows-x64_bin.exe ● JPype(1.1.2, python 3.8X용) : [기본 파이썬 환경] ● 파이썬(3.8.5) : https://www.python.org/ftp/python/3.8.5/python..

현장에서 바로 써먹는 데이터 분석 with 파이썬

안녕하세요. 저자 김임용(노센스)입니다. 다가오는 30일 제가 집필한 2번째 책(현장에서 바로 써먹는 데이터 분석 with 파이썬)이 세상에 나옵니다. 2021년 8월에 첫 책(현장에서 바로써먹는 데이터 분석 with R)을 출간하고, 다행히도 나름대로의 성과가 나와서 이번 책을 준비할 수 있었습니다. 겨우 1년도 지나지 않았는데 데이터 분석이라는 분야는 더 빠르게 바뀌었고, 활용하는 언어로 R보다는 파이썬(Python)을 선호하게 되었습니다. 아직까지도 고급통계(요인분석, 구조방정식 등) 분야에 있어서는 R의 패키지가 뛰어나지만, 파이썬의 머신러닝 패키지인 사이킷런(scikit-learn)이 너무 강력하고, 편리해 파이썬의 인기가 더 많아진 것 같습니다. 이번 책은 첫 번째 출간한 책과 내용은 거의 동..

(파이썬) 빅데이터분석기사 실기 작업형2 체험하기 코드

파이썬 책 집필을 마치고, 책 내용을 이용해서 빅데이터분석기사 실기 작업형2 체험하기 코드를 한 번 만들어 보았습니다. 해당 코드는 예전에 제가 R로 작성했던 것과 언어만 다를뿐 거의 동일하며 auc는 0.82~0.83 수준으로 R을 이용했을 때 보다 다소 높게 나타났습니다. 오버샘플링(Over Sampling)이 성능 향상에 가장 큰 영향을 미쳤으나 R의 경우는 시험환경에서 Caret 패키지를 제공해 오버샘플링을 쉽게 할 수 있었는데 파이썬의 경우 imblearn 패키지를 제공해주지 않아 해당 패키지 없이 단순히 랜덤 오버 샘플링을 판다스(pandas)를 이용해 구현했습니다. 전체적인 순서는 아래와 같습니다. 1. 결측치 및 이상치 처리, 파생변수 생성 2. 랜덤오버샘플링 3. 분포변환(Standard..

(파이썬) 주피터 노트북

주피터 노트북(Jupyter Notebook)은 파이썬을 사용자가 쉽게 쓸 수 있도록 도와주는 보조 프로그램입니다. R로 따지면 RStudio와 비슷한 프로그램이라고 생각하면 큰 무리가 없습니다. 주피터 노트북은 아나콘다를 설치하면 자동으로 설치가 됩니다. 실행을 할 때는 권한 문제로 인해 패키지가 설치 안되는 문제가 생길 수 있기 때문에 "관리자 권한으로 실행"합니다. 주피터 노트북을 실행하면 아래와 같이 웹 브라우저를 기반으로 실행됩니다. 우측 상단의 "New" 버튼을 통해 "Python 3"을 선택하면 파이썬 코드를 작성할 수 있는 주피터 노트북 파일(*.ipynb)이 생성됩니다. 아래 빨간색 상자로 표시한 곳을 셀(Cell)이라고 부르며 코드를 입력하는 곳입니다. 파일의 이름은 제목인 "Untit..

(파이썬) 아나콘다 설치하기

[ 설치 데스크탑 PC 기본정보 ] ● OS : windows 10 ● GPU : Nvidia GeForce GTX 1060 3GB ● CPU : Intel(R) Core(TM) i5-6500 (3.2GHz) ● RAM : 16GB [ 설치 노트북 기본정보 ] ● 제조사 : 애플 맥북 에어 13 ● OS : windows 10 ● CPU : Intel(R) Core(TM) i5-1030NG7 (1.10GHz) ● RAM : 8GB 파이썬(Python)을 이용한 데이터 분석 환경으로 가장 널리 사용되는게 아나콘다(Anaconda)입니다. 아나콘다를 설치하게되면 파이썬과 필수적인 라이브러리가 자동으로 설치되고, R을 쉽게 쓸수 있게 도와주는 RStudio와 유사한 주피터 노트북(Jupyter Notebook..