제2회 빅데이터 분석기사(실기) - 단답형 준비 2
작성자 정보
- ◆딥셀◆ 작성
- 작성일
컨텐츠 정보
- 17,123 조회
본문
연습 문제 추가 합니다. 기존 연습문제에도 답을 추가하였으니 검토 바랍니다.
기출 데이터를 가지고 예상 문제를 고른 것이 아니므로 적중률을 기대하기는 어려울 것 같습니다.
11) ROC 커브의 Y축은?
12) 모델의 일반화 오차에 대해 신뢰할 만한 추정치를 구하기위해 훈련, 평가 데이터를 기반으로 하는 검증 기법은?
13) 전체 데이터를 비복원추출 방법을 이용하여 랜덤하게 학습 데이터와 평가 데이터로 나눠 검증하는 기법은?
14) 데이터 집합을 무작위로 동일 크기를 갖는 K개의 부분 집합으로 나누고, 그중 1개 집합을 평가 데이터로, 나머지 (K-1)개 집합을 학습 데이터로 선정하여 분석 모형을 평가하는 기법은?
15) 주어진 자료에서 단순 랜덤 복원추출 방법을 활용하여 동일한 크기의 표본을 여러 개 생성하는 샘플링 방법은?
16) 모델의 파라미터 수가 많거나 학습용 데이터 세트의 양이 부족한 경우 발생되는 현상으로 제한된 학습 데이터 세트에 너무 지나치게 특화되어 새로운 데이터에 대한 오차가 매우 커지는 현상을 뜻하는 용어는?
17) 과대적합을 방지하기 위하여 학습과정에서 신경망의 일부를 사용하지 않는 방법은?
18) 여러 가지 변수를 비교할 수 있는 시각화 그래프로 칸 별로 색상을 구분하여 데이터 값을 표현하는 방법은?
19) 중요 정보를 하나의 그래픽으로 표현해서 보는 사람들이 쉽게 정보를 이해할 수 있도록 만드는 시각화 방법은?
20) 의사결정나무의 특징인 분산이 크다는 점을 고려하여 배깅과 부스팅보다 더 많은 무작위성을 주어 약한 학습기들을 생성한 후 이를 선형 결합하여 최종 학습기를 만드는 방법은?
답)
11) TP 비율, 12) 교차 검증, 13) 홀드 아웃 교차 검증, 14) K 폴드 교차 검증, 15) 부트스트래핑(부트스트랩), 16) 과대적합, 17) 드롭아웃, 18) 히트맵, 19) 인포그래픽, 10) 랜덤포레스트
관련자료
-
이전
-
다음