728x90

이거라도 보고가자 ㅠㅠ 딥셀 최고...

1) 특정 분류 모델의 성능을 평가하는 지표로, 실제값과 모델이 예측한 예측값을 한 눈에 알아볼 수 있게 배열한 행렬은?

혼동행렬, confusion matrix

2) 데이터베이스의 구조와 제약 조건에 관한 전반적인 명세를 기술한 메타데이터의 집합은? 

스키마

3) 정밀도와 재현율이 모두 중요할 때 사용하는 성능지표로 정밀도와 재현율의 조화평균으로 구하는 스코어는?

F1-score

4) 딥러닝 알고리즘의 하나로 커널을 하용하여 적은 수의 매개변수를 여러 번 활용하는 방식을 쓰면 이미지 분석에 많이 사용되는 알고리즘은?

CNN

5) 시간 순서가 있는 데이터에 적합한 딥러닝 알고리즘으로 언어처리에 많이 사용되는 신경망 알고리즘은?

RNN

6) ROC 커브의 X 축은 ( ) 레이트이다. ( )에 들어갈 말은?

FP

7) 모델 내부에서 결정되는 변수로 데이터를 가지고 모델을 트레이닝하면서 결정하는 값은?

파라미터(매개변수)

8) 머신러닝 모델에서 데이터로부터 결정하지 못하고 사용자가 직접 설정해 주어야 하는 값은?

하이퍼파라미터(초매개변수)

9) 다음과 같은 특징을 같는 데이터베이스는?

데이터 간의 관계를 정의하지 않는다.

아주 큰 대용랑의 데이터를 저장할 수 있다.

분산형 구조를 갖는 경우가 대부분이다.

고정된 스키마를 사용하지 않아도 된다.

NoSQL

10) 수집한 데이터를 다양한 각도에서 관찰하고 이해하는 과정으로 데이터를 분석하기 전에 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정을 뜻하는 용어는?

EDA(탐색적 데이터 분석)

11) ROC 커브의 Y축은?

TP 비율

12) 모델의 일반화 오차에 대해 신뢰할 만한 추정치를 구하기위해 훈련, 평가 데이터를 기반으로 하는 검증 기법은?

교차 검증

13) 전체 데이터를 비복원추출 방법을 이용하여 랜덤하게 학습 데이터와 평가 데이터로 나눠 검증하는 기법은?

홀드 아웃 교차 검증

14) 데이터 집합을 무작위로 동일 크기를 갖는 K개의 부분 집합으로 나누고, 그중 1개 집합을 평가 데이터로, 나머지 (K-1)개 집합을 학습 데이터로 선정하여 분석 모형을 평가하는 기법은?

K 폴드 교차 검증

15) 주어진 자료에서 단순 랜덤 복원추출 방법을 활용하여 동일한 크기의 표본을 여러 개 생성하는 샘플링 방법은?

부트스트래핑(부트스트랩)

16) 모델의 파라미터 수가 많거나 학습용 데이터 세트의 양이 부족한 경우 발생되는 현상으로 제한된 학습 데이터 세트에 너무 지나치게 특화되어 새로운 데이터에 대한 오차가 매우 커지는 현상을 뜻하는 용어는?

과대적합 또는 과적합

17) 과대적합을 방지하기 위하여 학습과정에서 신경망의 일부를 사용하지 않는 방법은?

드롭아웃

18) 여러 가지 변수를 비교할 수 있는 시각화 그래프로 칸 별로 색상을 구분하여 데이터 값을 표현하는 방법은?

히트맵? 트리맵 아닌가

19) 중요 정보를 하나의 그래픽으로 표현해서 보는 사람들이 쉽게 정보를 이해할 수 있도록 만드는 시각화 방법은?

인포그래픽

20) 의사결정나무의 특징인 분산이 크다는 점을 고려하여 배깅과 부스팅보다 더 많은 무작위성을 주어 약한 학습기들을 생성한 후 이를 선형 결합하여 최종 학습기를 만드는 방법은?

랜덤포레스트

21) 머신러닝 모델의 출력값과 사용자가 원하는 실제값의 차이를 구하는 함수를 의미하는 용어는?

손실함수(loss function)

22) 머신러닝 방법의 하나로 새로운 데이터를 입력 받았을 때 가장 가까이 있는 것이 무엇이냐를 중심으로 새로운 데이터의 종류를 정해주는 알고리즘은?

KNN(K 최근접이웃 알고리즘)

23) 간단한 형태의 인공신경망 선형 분류기로 입력층과 출력층으로만 구성되어 있으며 비선형분류를 할 수 없는 신경망을 의미하는 용어는?

퍼셉트론(단층퍼셉트론)

24) 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 분석하여 가치있는 정보를 추출하는 과정을 의미하는 용어는?

데이터마이닝

25) 자연어로 구성된 비정형 텍스트 데이터에서 패턴 또는 관계를 추출하여 가치와 의미 있는 정보를 찾아내는 기법은?

텍스트마이닝

26) 조직적, 자동화된 방법으로 웹을 탐색하는 컴퓨터 프로그램은?

웹크롤러

27) 사용자의 의사결정에 도움을 주기위해 기간시스템의 데이터베이스에 축적된 데이터를 공통의 형식으로 변환해서 관리하는 데이터를 의미하는 용어는?

데이터 웨어하우스

28) 관계형 데이터베이스 관리시스템의 데이터를 관리하기 위해 설계된 특수목적의 프로그래밍 언어는?

SQL

29) 어떤 목적을 가지고 만들어진 데이터라고 정의되며 다른 데이터를 설명하거나 관련된 주요 정보 제공을 목적으로 사용되는 데이터는?

메타데이터

30) 키-값 쌍으로 이루어진 데이터 오브젝트를 전달하기 위해 인간이 읽을 수 있는 텍스트를 사용하는 개방형 데이터 표준 포맷으로 인터넷에서 자료를 주고 받을 때 많이 사용되는 데이터 저장 형식은?

json

 

출처 : https://deepcell.kr/bbs/board.php?bo_table=bigbungi&wr_id=31

728x90

+ Recent posts