노센스와 함께하는 데이터 분석

데이터과학자, '현장에서 바로 써먹는' 시리즈 저자

전체 글 68

ChatGPT의 파라미터 수 의미

ChatGPT가 쏘아올린 초거대(Super-Giant) AI에 대한 관심이 뜨겁습니다. GPT는 Generative Pre-trained Transfomer의 약자로 생성적(Generative)이라는 의미는 모델이 새로운 텍스트를 생성할 수 있다는 것을 의미하며, 사전학습(Pre-trained)이라는 의미는 모델이 대량의 텍스트 데이터를 사용하여 사전에 학습이 되었다는 것을 의미합니다. 그리고 Transformer는 모델의 기본 구조를 의미합니다. 생성형 모델의 성능 향상을 위해서는 매우 복잡한 신경망이 요구되고, 복잡한 신경망에는 엄청난 수의 파라미터가 존재합니다. 이렇게 파라미터 수가 엄청나게 많은 AI 모델을 초거대 AI라고 부르고 있으며 주요기업의 초거대 AI 현황은 아래와 같습니다. 가장 뛰어난..

이슈 2023.03.22

OpenAI의 ChatGPT-4 공개

서비스(GPT-3.5) 실시 후 단 5일만에 100만명의 사용자를 끌어낸 ChatGPT 열풍이 가시지 않고 있습니다. 그리고 불과 몇 일 전인 2023.03.15. GPT-4의 기술을 공개했고, ChatGPT Plus 요금제($20/month)를 통해 미리 사용해볼 수 있는 기회를 제공하고 있습니다. OpenAI 측에서 공개한 GPT-4 Technical Report에 따르면 GPT-4는 아래 그림과 같이 다양한 시험에서 매우 우수한 성적을 거뒀습니다. 특히 미국 통합 변호사 시험(Uniform Bar Exam)에서 3.5의 경우 하위 10% 수준이었지만 4의 경우 상위 10%를 차지할 정도로 높은 성능 변화를 나타내고 있습니다. 그리고 체감이 컸던 한국어 질의 응답의 수준이 3.5 대비 크게 향상되었습..

이슈 2023.03.21

(현바데분with파이썬) 신경망 시각화 방법

독자분께서 도움을 요청하셔서 이렇게 포스팅을 합니다. "Chapter 7 인공 신경망과 딥 러닝"에서 Keras로 구현한 딥 러닝 모델의 신경망 구조를 시각화할 수 있는 방법에 대해서 설명드리겠습니다. 먼저, graphviz라는 패키지를 설치해야합니다. 해당 패키지의 경우 그래프를 쉽게 그릴 수 있게 해주지만 path로 인한 오류가 발생하는 까다로운 녀석이라 꼭 이 순서대로 해주시기 바랍니다. 아래 사이트에 가면 graphviz 패키지 windows EXE installer를 다운로드 받을 수 있습니다. https://graphviz.org/download/ Download Graph Visualization Software graphviz.org 가장 최신 버전을 받아 보았습니다. https://git..

(현바데분with파이썬) 실습 환경 프로그램 다운로드 링크

생각해보니 실습 환경 프로그램의 링크를 만들면 독자분들께서 더 편리하실 것 같아 링크를 남겨놓습니다. 모든 실습은 windows 10 64bit 환경에서 이뤄집니다. [아나콘다 기반 파이썬 환경] ● 아나콘다(2020.11) : https://repo.anaconda.com/archive/Anaconda3-2020.11-Windows-x86_64.exe ● JDK(17.0.4.1) : https://download.oracle.com/java/17/archive/jdk-17.0.4.1_windows-x64_bin.exe ● JPype(1.1.2, python 3.8X용) : [기본 파이썬 환경] ● 파이썬(3.8.5) : https://www.python.org/ftp/python/3.8.5/python..

(현바데분withR) PostgreSQL DB 연결용 iris 테이블 생성 방법

독자분께서 도움을 요청하셔서 이렇게 포스팅을 합니다. "Chapter 9 참고할 만한 내용들"에서 "1 데이터베이스 연결 및 SQL 사용법" 실습을 하기 위해서는 PostgreSQL을 설치하고, 스키마(Schema)를 생성한 뒤에 테이블(Table)을 만들고, iris 데이터까지 밀어넣어야 합니다. PostgreSQL 설치는 별도 포스팅을 할 예정이며 하기 사이트에서 본인의 OS 환경에 맞춰 최신버전을 다운로드 받아 install 하면 됩니다. 다만 주의할 점은 설치 시 비밀번호를 입력해야하는데 잊지않도록 해야합니다. https://www.enterprisedb.com/downloads/postgres-postgresql-downloads Download PostgreSQL PostgreSQL Datab..

(현바데분with파이썬) 책 교정 및 보충사항

출판 뒤 다시 책을 보니 편집 때 찾지 못했던 오타나 수정사항 또는 설명이 부족해 보충해야할 사항들이 보여 여기에 수정하면서 하나씩 추가하도록 하겠습니다. 독자분들께 불편을 드려 죄송하고, 구매해주셔서 정말 감사드립니다. 페이지 유형 내용 8 오타 이론보다 실습을 먼저 해보고 싶은 이과장을 위한 학습 추천 코스 → 이론보다 실습을 먼저 해보고 싶은 이 과장님을 위한 학습 추천 코스 (저는 전국에 계신 모든 이 과장님들을 존경합니다. (_ _) ) 98 오타 핵심요약 4번의 마크다운 젤 밑에 줄 바꿈 단축키 또는 기호가 스페이스바 2번 → 스페이스바 2번 111 오타 코딩실습의 In [8] 주석에서 # head() 함수를 → # head() 메소드를 194~214 오타 코딩실습의 라인 표시 Out [7] ..