제2회 빅데이터 분석기사(실기) - 시험준비 전략
작성자 정보
- ◆딥셀◆ 작성
- 작성일
컨텐츠 정보
- 21,350 조회
본문
이번에는 빅데이터 분석기사 실기 시험에 대한 준비 전략에 대한 저의 생각을 정리해 보겠습니다.
순전히 제 개인적인 생각이므로 참고만 하시기 바랍니다.(파이썬 기준)
1. 시험에 대한 정보
이 번이 첫 시험이므로 기출 문제에 대한 정보나 사례 정보는 전혀 없는 상황이고 공식홈페이지에서 공지한 예제 3개가 얻을 수 있는 정보의 전부입니다. 여기서 소개한 예제 문제와 시험 환경을 참고하여 시험에 대한 정보를 정리해 보면 다음과 같습니다.
1) 시험 문제 유형과 배점 그리고 합격 기준
- 공지된대로 단답형이 3점짜리 10문제, 작업형 제1유형이 10점짜리 3문제, 그리고 작업형 제2유형이 40점짜리 1문제
- 100점 만점에 60점 이상 합격, 과락 없이 전체 60점이상이면 됨.(Q&A)
2) 시험 환경
- 시험 환경 체험 링크 참고, 반드시 직접 확인 필요
- 주피터 노트북과 같이 줄 단위 실행이 안되고 전체 코드를 하나의 .py 파일에 작성하듯이 코딩하여 실행하여야 함
- 데이터를 테이블 형태로 볼 수 있음
- 그래픽을 사용할 수 없음
- 인터넷이나 책 등 다른 자료를 참고할 수 없음
- 파이썬의 help()함수가 유일하게 참고할 수 있는 정보임
3) 사용 가능 패키지
- 시험환경에 설치된 파이썬 패키지 목록이 예제와 함께 공개, 사용할 수 있는 패키지는 이 목록에 있는 것만 가능한 것 같음
2. 실력에 따른 준비 전략
전체 100점 만점에 60점 이상이면 합격입니다. 제일 부담을 갖는 문제가 작업형 제2유형의 문제인데 여기서 0점을 맞아도 나머지를 다 맞으면 60점으로 합격이 가능합니다. 현실적으로 단답형과 작업형 제1유형을 다 맞는 것도 쉽지는 않을 것입니다. 그래서 제2유형에서 부분점수로 10점에서 20점 정도를 받으면 합격 가능성을 많이 올릴 수가 있습니다. 시험을 준비하는 분들의 개인의 실력과 처한 상황이 다를 것이므로 먼저 준비생의 실력에 따른 전략부터 유형별 전략 그리고 시험 환경에 맞는 준비 전략에 대해 정리해 보겠습니다.
작업형의 경우 준비생의 실력을 어느정도 기초가 있는 분들과 기초가 많이 부족한 분들로 나누어 전략을 생각해 보겠습니다.
1) 기초 실력이 있으신 분들
작업형 문제를 풀기위해서는 기본적으로 코딩능력(파이썬 또는 R, 여기서는 파이썬에 대해서만 다룹니다.)이 있어야 합니다. 그리고 머신러닝에 대해 어느정도 이해하고 트레이닝과 예측을 할 수 있어야 합니다. 파이썬 패키지 둥 pandas, numpy, sklearn 등을 어느정도 다룰 수 있어야 합니다. 이런 능력이 되시는 분들은 짧지만 남은 시간동안 집중적이고 효율적으로 준비하여 이 번에 합격하는 것을 목표로 하는 것이 좋을 것 같습니다.(시험은 무조건 일찍 붙는 것이 좋습니다.)
2) 기초 실력이 없으신 분들
필기 시험은 책으로 열심히 준비하시어 합격했지만 코딩이나 머신러닝에 대한 기초가 약하거나 거의 없으신분들은 짧은 시간 준비하여 합격하는 것이 쉽지는 않을 것 같습니다. 그래서 이런 분들은 다음(2회) 시험이나 그 이후 시험 합격을 목표로하는 것이 현실적인 것 같습니다. 하지만 이런 분들도 이 번 시험 합격을 목표로 준비하는 분들과 동일하게 준비를 하실 것을 추천합니다. 그렇게 준비하고 시헙을 보신 다음에 코딩과 머신러닝을 기초부터 다시 공부하는 것이 좋을 것 같습니다. 좀 이해가 안가더라도 예제와 예상문제 풀이 코드를 암기하여 실행해보신 다음에 시험이 끝난 뒤 기초 공부를 하는 것이 시험 준비에는 더 도움이 될 것 같습니다.
3. 문제 유형별 준비 전략
1) 단답형
단답형 문제는 예제와 같이 문제가 요구하는 답을 한 두 단어의 용어로 쓰는 문제입니다. 이러한 형식에 적합한 예상문제를 만들어서 암기하는 것이 좋을 것 같습니다. 합격을 위해서는 10문제 중 8문제 이상을 맞추는 것이 필요할 것 같습니다. 필기시험 교재에 있는 내용이나 기타 빅데이터 관련되 자료에서 얻을 수 있는 내용들 중에서 예상문제를 만들어 보는 것이 좋을 것 같습니다. 이 게시판에도 '단답형 예상문제'를 만들어서 생각나는 대로 예상 문제를 올리겠습니다. 다른 분들도 예상문제를 올리시어 더 많은 문제들을 함께 공유하면 공부하면 좋을 것 같습니다.
2) 작업형 제1유형
제1유형의 문제는 프린트 문으로 하나의 출력을 표시하면 되는 문제입니다. 예제와 같이 간단한 계산을 하여 최종 결과를 print()문으로 출력하면 됩니다. 문제에서 주어진 계산을 직접하는 코드를 짜는 것 보다 패키지에 있는 함수를 호출하여 처리하는 코딩을 해서 가능한 한 짧은 시간에 문제를 푸는 것이 좋을 것 같습니다. 특히 sklearn에 있는 계산 관련 함수(메써드)들 중 1 유형 문제에 쓰기 좋을 것 같은 함수들을 모아서 연습하는 것이 좋을 것 같습니다. 이 문제도 예상문제를 함께 만들어서 공유하면서 준비하면 많이 도움이 될 것 같습니다.
3) 작업형 제2유형
가장 난이도가 높고 준비하기도 어려운 문제일 것 같습니다. 그리고 시간도 많이 걸리 것 같으므로 다른 문제들 푸는 시간을 절약하여 제2유형의 문제를 푸는데 시간을 더 할애할 수 있으면 좋을 것 같습니다. 문제에서 요구하는 것은 머신러닝을 사용하여 모델을 트레이닝하고 트레이닝된 모델루 주어진 테스트 데이터를 예측(추론)하여 지정된 형식의 파일로 저장하여 파일을 제출하는 방식입니다. 점수는 예측한 결과의 스코어에 따라 차등적으로 부여됩니다.
제출을 못 하거나 잘 못된 형식의 파일을 제출하면 점수를 얻을 수 없으므로 무조건 정확한 형식의 파일을 만들어 제출하여 부분 점수라도 받는 것을 목표로 하는 것이 좋습니다. 먼저 제출 파일을 만드는 코드를 만든 다음 남을 시간에 따라 정확도를 올릴 수 있는 코드를 완성하여 답을 업그레이는 하는 것이 좋을 것 같습니다.
그리고 2유형의 문제는 sklearn의 모델을 이용하는 것이 필수입니다. 예제와 같이 sklearn을 이용하여 분류문제를 푸는 것이 나올 확률이 가장 높아 보입니다. 그리고 회귀 문제나 다른 유형의 문제들에 대해 예상 문제를 만들어서 준비하는 것이 도움이 될 것 같습니다.
4. 시간 안배 전락
전체 시험 시간이 3시간입니다. 배점에 따라 시간을 나누어 보면 다음과 같습니다.
- 단답형 : 54분
- 작업형 제1유형 : 54분
- 작업형 제2유형 : 72분
단답형과 제1유형에서 시간을 조금 단축한다면 제2유형에서 시간을 조금 더 사용할 수 있을 것입니다. 주어진 시간으로 볼 때 제2유형의 문제도 1시간에서 2시간 사이에 풀 수 있는 문제가 나올 수 밖에 없을 것입니다. 이 점을 고려하여 예상 문제를 만들어 보고 풀이 방법을 만들어 놓는 것이 좋을 것 같습니다.
전략적으로 단답형과 제1유형에서 시간을 30분 이상 절약하여 제2유형에서 100분 이상의 시간을 사용할 수 있으면 좋을 것 같습니다.
이상 시험 준비에 대한 전체적인 전략을 정리해 보았습니다. 다음 게시글에서는 유형별 구체적인 준비 전략과 예상문제 및 효율적인 풀이법에 대해 정리해 보도록 하겠습니다.
*** 다시 한 번 강조하지만 이 내용은 어디까지나 주관적인 예측과 생각이으로 참고만 하시고 각자 자신의 결정에 따라 준비하시면 될 것 같습니다. 이 사이트에서는 시험 결과에 대해 어떠한 책임도 질 수 없습니다. 또한 이 글의 정보에 대한 정확성도 장담할 수는 없으니 의심나는 내용을 꼭 공식홈페이지나 KDATA에 문의하여 확인하시기를 바랍니다.
관련자료
-
이전
-
다음