제2회 빅데이터 분석기사(실기) - 제1유형 준비
작성자 정보
- ◆딥셀◆ 작성
- 작성일
컨텐츠 정보
- 16,553 조회
본문
작업형 제1유형의 문제에 대해 예제를 보며 분석을 하고 준비 방법에 대해 정리해 보겠습니다.
[예제]
mtcars 데이터셋(mtcars.csv)의 qsec 컬럼을 최소최대 척도(Min-Max Scale)로 변환한 후 0.5보다 큰 값을 가지는 레코드 수를 구하시오.
문제 유형 설명에 분명히 하나의 결과를 print()하라고 나와 있으므로 결과가 대략 한 줄 정도 나오는 코딩이 될 것 같습니다.
그리고 예제의 경우 MinMaxScale로 변환하는 계산이 있는데 sklearn 패키지를 사용할 수 있으므로 이런 문제는 sklearn을 사용하는 방식으로 준비하는 것이 좋으며 sklearn에 있는 다른 함수들을 가지고 푸는 문제에 대비하여 준비하는 것이 좋을 것 같습니다.
예) StandardScaler로 변환하는 문제
그리고 사용 가능한 패키지들 중 sklearn 외에 numpy에 있는 함수들 중 나올 만한 함수들을 골라서 사용법을 익히는 것이 좋을 것 같습니다. 또한 설치된 패키지 중 다음과 같은 웹 크롤링에 사용하는 패키지가 있는데 이들 패키지의 사용법을 익히고 적용하는 연습을 하는 것이 도움이 될 것 같습니다.
- beautifulsoup4
- selenium -> 시험환경에서 selenium 사용이 오류가 나는 것 같은데 저만 그런가요?
웹 크롤링은 작업형 문제에 나올 법하기는 한데 시험환경이 인터넷에 연결이 안되면 사용이 어렵고 연결이 되어 있으면 수험자가 인터넷의 데이터를 조회할 수 있도 있기 때문에 문제로 나오기가 까다로운 면도 있습니다. 웹 크롤링 문제가 나오려면 이러한 점들을 모두 해결해야 하기 때문에 문제 내기가 쉽지는 않겠지만 시간이 된다면 봐 두는 것이 좋을 것 같습니다.
이러한 점들을 고려하여 구체적으로 준비해야할 내용들을 정리해 보도록 하겠습니다.
(시간 관계상 여기까지 하고 계속해서 작성하겠습니다.)
관련자료
-
이전
-
다음