노센스와 함께하는 데이터 분석

데이터과학자, '현장에서 바로 써먹는' 시리즈 저자

빅데이터분석기사 4

(파이썬) 빅데이터분석기사 실기 작업형2 체험하기 코드

파이썬 책 집필을 마치고, 책 내용을 이용해서 빅데이터분석기사 실기 작업형2 체험하기 코드를 한 번 만들어 보았습니다. 해당 코드는 예전에 제가 R로 작성했던 것과 언어만 다를뿐 거의 동일하며 auc는 0.82~0.83 수준으로 R을 이용했을 때 보다 다소 높게 나타났습니다. 오버샘플링(Over Sampling)이 성능 향상에 가장 큰 영향을 미쳤으나 R의 경우는 시험환경에서 Caret 패키지를 제공해 오버샘플링을 쉽게 할 수 있었는데 파이썬의 경우 imblearn 패키지를 제공해주지 않아 해당 패키지 없이 단순히 랜덤 오버 샘플링을 판다스(pandas)를 이용해 구현했습니다. 전체적인 순서는 아래와 같습니다. 1. 결측치 및 이상치 처리, 파생변수 생성 2. 랜덤오버샘플링 3. 분포변환(Standard..

제3회 빅데이터분석기사 최종합격 후기 및 실기시험 팁

이전에 데이터 전문가포럼 카페(http://naver.me/56YqXoRv)에 올린 제 합격수기를 공유해봅니다. 우선 저는 현업에서 10년이 넘는 기간 동안 데이터분석 업무를 수행하고 있으며, 작년(2021년) 8월에 R 서적을 출간하기도 했습니다. 파이썬 보다는 R이 도움말을 사용할 수 있고, 함수명이 짧기 때문에 시험에 유리해서 R로 응시했습니다. R에서 ?나 help()를 이용해 도움말을 찾아볼 수 있는 것은 구글링을 하는 것과 유사한 수준의 장점이라고 생각하며 R의 경우 각종 패키지나 함수의 사용법에 예제까지 포함되어있기 때문에 함수 사용법이 제대로 기억나지 않더라도 도움말의 예제를 보면 충분히 문제를 해결할 수 있습니다. ​ ​[단답형] ​ 개인적으로 단답형의 경우가 작업형 보다 더 어려울 것으..

(R) 빅데이터분석기사 실기 작업형2 체험하기 코드

빅데이터분석기사 3회차 실기가 몇 일 남지 않은 상황에서 공부한 내용을 공유해 봅니다. 실시시험의 작업형2가 40점으로 가장 큰 배점을 차지하며, R이나 파이썬을 처음 접하는 분들께는 꽤나 어렵지 않을까 생각됩니다. 다행히도 한국데이터산업진흥원에서 실기시험을 체험해 볼 수 있는 링크를 제공해줘서 작업형2를 풀어보았습니다. https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/3 구름EDU - 모두를 위한 맞춤형 IT교육 구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/ edu..

국가공인 데이터 분석 자격증 소개 및 합격률

데이터 분석 분야에 많은 관심이 쏟아지면서 관련 자격증에 대한 수요가 매우 높아졌습니다. 이에따라 한국데이터산업진흥원(Kdata)에서 국가공인 데이터분석 준전문가(ADsP, Advanced Data analytics Semi-Professional)와 데이터분석 전문가(ADP, Advanced Data analytics Professional) 자격증을 만들었고, 작년에 처음으로 국가기술자격증으로 빅데이터 분석기사 자격증이 생겼습니다. 데이터분석 준전문가(ADsP)의 경우 별도의 응시자격이 없기 때문에 많은 대학생들이 컴활이나 정보처리기사와 같이 스펙을 추가하기 위해 취득하고 있습니다. 난이도도 일반 기사 시험 대비 낮고, 필기시험 한 번으로 끝나기 때문에 비전공자라도 큰 어려움없이 단 기간에 취득할 수..