노센스와 함께하는 데이터 분석

데이터과학자, '현장에서 바로 써먹는' 시리즈 저자

분류 전체보기 67

OpenAI의 ChatGPT-4 공개

서비스(GPT-3.5) 실시 후 단 5일만에 100만명의 사용자를 끌어낸 ChatGPT 열풍이 가시지 않고 있습니다. 그리고 불과 몇 일 전인 2023.03.15. GPT-4의 기술을 공개했고, ChatGPT Plus 요금제($20/month)를 통해 미리 사용해볼 수 있는 기회를 제공하고 있습니다. OpenAI 측에서 공개한 GPT-4 Technical Report에 따르면 GPT-4는 아래 그림과 같이 다양한 시험에서 매우 우수한 성적을 거뒀습니다. 특히 미국 통합 변호사 시험(Uniform Bar Exam)에서 3.5의 경우 하위 10% 수준이었지만 4의 경우 상위 10%를 차지할 정도로 높은 성능 변화를 나타내고 있습니다. 그리고 체감이 컸던 한국어 질의 응답의 수준이 3.5 대비 크게 향상되었습..

이슈 2023.03.21

(현바데분with파이썬) 신경망 시각화 방법

독자분께서 도움을 요청하셔서 이렇게 포스팅을 합니다. "Chapter 7 인공 신경망과 딥 러닝"에서 Keras로 구현한 딥 러닝 모델의 신경망 구조를 시각화할 수 있는 방법에 대해서 설명드리겠습니다. 먼저, graphviz라는 패키지를 설치해야합니다. 해당 패키지의 경우 그래프를 쉽게 그릴 수 있게 해주지만 path로 인한 오류가 발생하는 까다로운 녀석이라 꼭 이 순서대로 해주시기 바랍니다. 아래 사이트에 가면 graphviz 패키지 windows EXE installer를 다운로드 받을 수 있습니다. https://graphviz.org/download/ Download Graph Visualization Software graphviz.org 가장 최신 버전을 받아 보았습니다. https://git..

(현바데분with파이썬) 실습 환경 프로그램 다운로드 링크

생각해보니 실습 환경 프로그램의 링크를 만들면 독자분들께서 더 편리하실 것 같아 링크를 남겨놓습니다. 모든 실습은 windows 10 64bit 환경에서 이뤄집니다. [아나콘다 기반 파이썬 환경] ● 아나콘다(2020.11) : https://repo.anaconda.com/archive/Anaconda3-2020.11-Windows-x86_64.exe ● JDK(17.0.4.1) : https://download.oracle.com/java/17/archive/jdk-17.0.4.1_windows-x64_bin.exe ● JPype(1.1.2, python 3.8X용) : [기본 파이썬 환경] ● 파이썬(3.8.5) : https://www.python.org/ftp/python/3.8.5/python..

(현바데분withR) PostgreSQL DB 연결용 iris 테이블 생성 방법

독자분께서 도움을 요청하셔서 이렇게 포스팅을 합니다. "Chapter 9 참고할 만한 내용들"에서 "1 데이터베이스 연결 및 SQL 사용법" 실습을 하기 위해서는 PostgreSQL을 설치하고, 스키마(Schema)를 생성한 뒤에 테이블(Table)을 만들고, iris 데이터까지 밀어넣어야 합니다. PostgreSQL 설치는 별도 포스팅을 할 예정이며 하기 사이트에서 본인의 OS 환경에 맞춰 최신버전을 다운로드 받아 install 하면 됩니다. 다만 주의할 점은 설치 시 비밀번호를 입력해야하는데 잊지않도록 해야합니다. https://www.enterprisedb.com/downloads/postgres-postgresql-downloads Download PostgreSQL PostgreSQL Datab..

(현바데분with파이썬) 책 교정 및 보충사항

출판 뒤 다시 책을 보니 편집 때 찾지 못했던 오타나 수정사항 또는 설명이 부족해 보충해야할 사항들이 보여 여기에 수정하면서 하나씩 추가하도록 하겠습니다. 독자분들께 불편을 드려 죄송하고, 구매해주셔서 정말 감사드립니다. 페이지 유형 내용 8 오타 이론보다 실습을 먼저 해보고 싶은 이과장을 위한 학습 추천 코스 → 이론보다 실습을 먼저 해보고 싶은 이 과장님을 위한 학습 추천 코스 (저는 전국에 계신 모든 이 과장님들을 존경합니다. (_ _) ) 98 오타 핵심요약 4번의 마크다운 젤 밑에 줄 바꿈 단축키 또는 기호가 스페이스바 2번 → 스페이스바 2번 111 오타 코딩실습의 In [8] 주석에서 # head() 함수를 → # head() 메소드를 194~214 오타 코딩실습의 라인 표시 Out [7] ..

현장에서 바로 써먹는 데이터 분석 with 파이썬

안녕하세요. 저자 김임용(노센스)입니다. 다가오는 30일 제가 집필한 2번째 책(현장에서 바로 써먹는 데이터 분석 with 파이썬)이 세상에 나옵니다. 2021년 8월에 첫 책(현장에서 바로써먹는 데이터 분석 with R)을 출간하고, 다행히도 나름대로의 성과가 나와서 이번 책을 준비할 수 있었습니다. 겨우 1년도 지나지 않았는데 데이터 분석이라는 분야는 더 빠르게 바뀌었고, 활용하는 언어로 R보다는 파이썬(Python)을 선호하게 되었습니다. 아직까지도 고급통계(요인분석, 구조방정식 등) 분야에 있어서는 R의 패키지가 뛰어나지만, 파이썬의 머신러닝 패키지인 사이킷런(scikit-learn)이 너무 강력하고, 편리해 파이썬의 인기가 더 많아진 것 같습니다. 이번 책은 첫 번째 출간한 책과 내용은 거의 동..