반응형

[빅데이터기사3회] 빅데이터기사 3회 객관식 답 70문제 복원

 

후기

- 전반적으로 3단원이 매우 어려웠습니다.
- adsp와 adp를 기준으로 보았을 때 3안원은 어려웠지만 나머지는 공부를 하지 않아도 절반정도는 맞출 수 있는 수준이였습니다.(adsp 자격증 이 있다면)
- adsp 보다 부담은 덜 한 것이 주관식이 없다는 것이며, adp는 70점이 컷이기 때문에 60점 컷이라고 한다면 절반만 아는 것 풀고 나머지는 잘 찍었을 경우 합격할 가능성이 있다는 것으로 보아 빅데이터기사가 그래도 adp나 adsp보다는 쉽지 않았나 합니다.
- 다만 열심히 공부해도 점수가 잘 나오지 않을수밖에 없는 것이 3회밖에 되지 않았으며, 1회는 코로나로 인하여 취소됐기 때문에 이번이 2회인 시험입니다. 그래서 난이도가 계속 조정이 되고 있는 시점이고 어떠한 문제집이 괜찮은지에 대한 데이터도 없을 뿐더러 문제집 또한 대충 adsp를 기반으로 만들었기 때문에 용어가 시험문제와 다르다는 차이가 있어 공부해도 잘 나오지 않는 시험이라고 할 수 있습니다.

총평

- 일단 adsp 부터 공부하라고 전해드립니다. 빅데이터기사는 열심히 공부해도 잘 나오지 않으며 공부를 하지 않아도 잘 나오는 시험입니다. (adsp 자격증 소유자에 한하여) 그러므로 취업을 고려하시는 분들께서는 adsp부터 따고 그 다음 빅데이터 기사에 도전하시는 것을 권해드립니다. 

 

1. 분석문제정의 vs 프로젝트 기획 vs 도메인 ?
- 분석 문제정의


2. 익명화 vs 최대한 개인정보보호?
- 익명화
> 개인정보보호법 3조 7항 확인 가능


3. 최신 인공지능 vs 기존 인공지능
->  기존 인공지능은 사람이 하나하나 지정함


4. 하둡 - Hbase vs Pig?
-> Pig

5. 카산드라, 비정규데이터 ?
- NoSQL

6. 데이터 사이언티스트 vs 데이터 전문가 차이x?
- 데이터 자동화
-> 차이는 비지니스 관점임

7. EU, 개인정보보호?
- GDPR

8. 비식별 조치 방법 마스킹vs 값대체?
- 값 대체

9. 빅데이터 분석 절차
-> 기획 준비 분석 구현 평가전개

10. 데이터 수집, 분석주기 필요 x?
- 필요함

11. ETL 개념
-?

12. 민감정보 x?
-> 취미

13. 데이터 전처리
->?

14. 3V 개념
- 바리에이션

15. 데이터웨어하우스 특성
- ?

16 비지니스 효과X
-> 재택근무X

17. 아파치 하둡을 관리하는 워크플로우
- OOZIZE




18  군집 추출


19 표본평균 분산 모평균 분산 n값(정보 양 어쩌고 나온)

20 로지스틱 회귀분석
-?

21 이산형에 쓸 수 없는 거
- F 검정

22 신경망 계산
-19


23 과적합 처리법 잘못된것
- 웨이트 합 1

24 커널
- ?

25 활성함수
- ?
- 활성함수 선형이면 의미x

26 프리드먼 검정
- 4개

27 박스콕스변환
=?





28 우측꼬리 그래프
- 왜도 >0,  평균 최빈값<중앙값<평균값 양수


29 전수조사
- 우주선

30 주성분분석
- 음수미포함 행렬분해

31 박스콕스 변환
- 파생변수(?)

32 불균형데이터
- 1번 답
- 2번: 데이터 양많은 카테고리만 정확도가 높아져 검증애매

33 차원축소 요인분석
- 비슷한것 없애기

34 상관계수 기본개념
- 4번  -1이면 음의 상관관계

35 왜도 모양
- 우꼬리-> 왜도>0, 평균 > 중앙값 > 최빈값

36 E(aX+bY) Var(aX+bY)
-> 6,2

37 중심극한정리
- 1번 표본평균의 분산은 n 관계없이 모평균 분산을 따름 x

38 점추정
-  편이성 x
-  불편성, 효율성, 일치성, 충분성

39 유의 수준의 개념
- 1종오류 개념
- 귀무가설이 참인데 대립가설 선택

​40 중심극한
- 왜도X


41 집락추출

42 로지스틱 회귀분석
- 종속변수 정규분포

43. 지니vs카이vs F
-> F

44. 신경망 활성함수의 출력물
- 19

45. RNN-CNN-CNN+RNN-강화학습

46. 초매개변수와 일반매개변수
-?
47. 비모수검정
- 부호검정

48. 가중치를 이용
- 부스팅

49. 마이데이터

50. 평균, 최빈값, 중앙값, 범위
- 범위

51. MAPE수식
- 분모있는 것 답

52. 카이제곱 수식
- ?

53. 경사하강법
- Adaboost X

54. 과대적합 해소방법 X
- 가중치 합1X

55. AUC 설명
- 기준선 X

56. 소프트맥스 함수
- 분산 1 X

57. 시계열
- 자기상관

58. 시계열 성분
-  규칙 X

59. ARIMA 개념
- p, d, q

60. 커널
- ?

61.버블차트

62. 선형과 로지스틱 회귀분석
- ?

63. k-폴드 VS 홀드아웃
- 홀드아웃

64. 연관분석모델 지지도 신뢰도
- 지지도 1/3, 신뢰도 2/3

65. 데이터 시각화
- ?
66. PCA
- 0.956

67. 스펙티비티, 프레시젼, 리콜, 어큐러시
- ?

반응형
반응형

[ADSP 30회] 전공자 ADSP 30회 객관식 주관식 답 복원

 

친구한테 들은 문제를 정리해서 올려보았습니다. 현업에서 일하고 있으므로 아마  90%는 맞지 않을까 생각합니다.  간접적으로 푼 것이기에 완벽하지는 않지만 전공자가 풀어본 답은 다음과 같습니다. 혹시 제가 작성한 답이 아니거나 제가 미쳐 작성하지 못한 답은 답글로 남겨주시면 감사하겠습니다.  

 

해설

전공자가 푼 정답 30개 정도 복원했습니다. 60점 이상이면 합격이니 제가 작성한 것 30개가 있다면 합격이실 것 같습니다. 
마지막 문제가 듣기로는 Machine Learning 인지 Deep Learning인지 논란이 많던데요.
문제가 새로운 데이터를 넣어서 실시간으로 다시 학습해서 사용한다고? 들었습니다. 
모델만 가져와서 사용한다고 했다면 Transfer Learning이고요. 음.. 

제대로 문제를 본 것이 아니라 틀릴 순 있지만 전공자 입장에서는 Online Learning 입니다.
아닐 순 있지만, 현업에서는 그렇게 부르고 사용하고 있습니다. 
Machine Learning이나 Deep learning 정의를 저런식으로 하지는 않습니다.(직접 문제를 본 것이 아니라 100% 확신은 아닙니다)

후기

현업에 적용하고 있기에 매번 공부를 하고 있는데요. 후기와 문제들을 들어보니 이번 ADSP 가 가장 어려웠던 것 같습니다. 전공자인 저도 모르는 문제들이 많이 보였어요. 아마 adsp가 물 시험이라는 소문으로 인하여 난이도를 조금씩 올리고 있는 것 같습니다. 단순히 문제은행으로는 이제 힘들것 같습니다. 

 

 

정답

1단원 :DATA  
1 비정형 정형
2 정형화 데이터
3 단순화
4 천재적
5 unchanged
6 가치창출
7 분석을 통해 가치 창출
8 주관 : information
9 주관:crm
2단원 : 분석 과제  
10 method
11 데이터 중요성
12 accuracy&deploy
13 거버넌스 체계 : 분석, 진단
14 주관:마스터 데이터, 메타 데이터, 데이터 사전
15 주관 : 시급성
3단원 : 데이터 마이닝  
16 시계열 : 안정성 시계열
17 데이터 정규성 : durvbin waston
18 민코우스키 : m 있는 것
19 k평균 : 초기값
20 stdent : income 통계적 유의
21 독립성, 등분산성, 정규성
22 구간 = 이산형
23 som : 경쟁층
24 1종오류 : h0사실, 아니라고 판정
25 그래프 해석 : 중앙값 , 평균 선택
26 주관 : 4개
27 주관: 앙상블
28 주관:25%
29 주관: 포와송 분포
30 주관:0.8
31 online learning

 

반응형

+ Recent posts