반응형

[ADSP 30회] 전공자 ADSP 30회 객관식 주관식 답 복원

 

친구한테 들은 문제를 정리해서 올려보았습니다. 현업에서 일하고 있으므로 아마  90%는 맞지 않을까 생각합니다.  간접적으로 푼 것이기에 완벽하지는 않지만 전공자가 풀어본 답은 다음과 같습니다. 혹시 제가 작성한 답이 아니거나 제가 미쳐 작성하지 못한 답은 답글로 남겨주시면 감사하겠습니다.  

 

해설

전공자가 푼 정답 30개 정도 복원했습니다. 60점 이상이면 합격이니 제가 작성한 것 30개가 있다면 합격이실 것 같습니다. 
마지막 문제가 듣기로는 Machine Learning 인지 Deep Learning인지 논란이 많던데요.
문제가 새로운 데이터를 넣어서 실시간으로 다시 학습해서 사용한다고? 들었습니다. 
모델만 가져와서 사용한다고 했다면 Transfer Learning이고요. 음.. 

제대로 문제를 본 것이 아니라 틀릴 순 있지만 전공자 입장에서는 Online Learning 입니다.
아닐 순 있지만, 현업에서는 그렇게 부르고 사용하고 있습니다. 
Machine Learning이나 Deep learning 정의를 저런식으로 하지는 않습니다.(직접 문제를 본 것이 아니라 100% 확신은 아닙니다)

후기

현업에 적용하고 있기에 매번 공부를 하고 있는데요. 후기와 문제들을 들어보니 이번 ADSP 가 가장 어려웠던 것 같습니다. 전공자인 저도 모르는 문제들이 많이 보였어요. 아마 adsp가 물 시험이라는 소문으로 인하여 난이도를 조금씩 올리고 있는 것 같습니다. 단순히 문제은행으로는 이제 힘들것 같습니다. 

 

 

정답

1단원 :DATA  
1 비정형 정형
2 정형화 데이터
3 단순화
4 천재적
5 unchanged
6 가치창출
7 분석을 통해 가치 창출
8 주관 : information
9 주관:crm
2단원 : 분석 과제  
10 method
11 데이터 중요성
12 accuracy&deploy
13 거버넌스 체계 : 분석, 진단
14 주관:마스터 데이터, 메타 데이터, 데이터 사전
15 주관 : 시급성
3단원 : 데이터 마이닝  
16 시계열 : 안정성 시계열
17 데이터 정규성 : durvbin waston
18 민코우스키 : m 있는 것
19 k평균 : 초기값
20 stdent : income 통계적 유의
21 독립성, 등분산성, 정규성
22 구간 = 이산형
23 som : 경쟁층
24 1종오류 : h0사실, 아니라고 판정
25 그래프 해석 : 중앙값 , 평균 선택
26 주관 : 4개
27 주관: 앙상블
28 주관:25%
29 주관: 포와송 분포
30 주관:0.8
31 online learning

 

반응형
반응형

[adp/adsp] 교차 분석이란

 

1. 교차 분석
- 범주형(명목 척도, 순서 척도) 자료에서 두 변수간의 관계를 알아보기 위하여 사용함
- 적합도 검정, 독립성 검정, 동질성검정에 활용됨
- 카이제곱통계량을 활용함

2. 적합도 검정
- 관측도수와 범주의 기대 도수가 적합한지 확인하기 위한 검정
ex) 귀무가설 : 남자일 확률 50%, 여자일 확률 50%이다. , pvalue 값이 5% 미만이면, 기각

3. 독립성 검정
- 두 변수간의 상관성이 있는지 없는지를 확인하기 위한 검정
ex) 귀무가설 : 두 변수 사이에는 연관이 없다, pvalue 값이 5% 미만이면 연관있음 

4. 동질성 검정
- 모집단에서 표본을 뽑았을 때, 모집단의 분포와 표본 집단의 분포가 동질성을 갖는지 확인하기 위한 검정
ex) 모집단에서 추출한 표본과 모집단의 분포는 동질성이 있다. pvalue 값이 5% 미만이면 연관없음 

결론 
교차 분석은 두 집단간의 동질성을 판단하는 분석 방법으로, 기대 했던 값과의 적합도 검정, 변수들간의 적합도 검정, 모집단과 표본간의 동질성 검정에 활용된다. 

반응형
반응형

[adp/adsp] t분포의 정의

1. t 분포
평균값을 비교하고자 할 때 사용하는 검증 방법

2. t분포 종류
t분포에는 일표본(one sample) t분포, 대응(paired sample) 표본t 분포, 독립표본(independent sample) t 분포가 존재함
2.1 일표본(one sample) t 분포
- 변수의 평균과 특정 값과 일치하는지 확인하는 t검정
- 가설설정-> 유의수준 설정-> 검정통계량 및 유의확률계산->기각여부 판단 및 의사결정 4가지로 구성됨
ex) 해당 센서는평균이 0이라고 하는데 진짜인 확인해보세요.

2.2 대응(paired sample) t 분포
- 두 변수의 평균이 일치하는지 확인하는 t 검정
- 가설설정 -> 유의수준 설정 (일반적으로 0.05) -> 검정 통계량 및 유의확률값 계산 -> 기각여부 및 의사결정 (4단계)
ex) 해당 센서의 데이터가 고장시에는 다르게 나오는 것인지 noraml 상태와 abnormal 상태에서의 평균을 비교해 보세요.

2.3 독립(independent sample) t 분포
- 두 개의 독립된 모집단의 평균을 비교하는 거으로 분산이 같다라는 전제가 필ㅇ하므로 등분산성 분석도 이뤄져야 함
- 가설 설정 -> 유의수준 설정 ->  등분산성 계산 -> 검정통계량 및 유의 확률값 계산 -> 기각여부 및 의사결정 (5단계)
ex) 남, 여의 샤워할 때의 온도가 같은지 확인해 보세요. 

반응형
반응형

[adp/adsp] 확률 분포 정의

 

1. 확률 분포
- 확률 변수들이 가지는 확률에 대한 분포를 의미

2. 확률 분포 종류
2.1 이산형 확률 분포
베르누이분포: 이번 타석에 안타를 칠 확률
이항분포: 5벗중 3번 안타를 칠 확률
기하학분포: 3번째 안타를 친다고 했을 때, 2번 헛수윙할 화률
다항분포: 볼, 스트라이크, 파울이 1번씩 일어날 확률
포아송분포: 10번중 3번 홈런을 친다면, 이번에 홈런을 칠 확률 

2.2 연속형 확률 분포
균일분포 : 화률이 일정한 것
정규분포 : 평균과 표준편차가 있을 때 종모양의 분포
지수분포 : 경과 시간에 대한 연속확률분포
t분포 : 두 집단의 평균이 동일한지를 보는 분포로, n의 개수가 많아지면 정규분포와 비슷하게 됨
카이제곱분포 : 두 집단의 동질성 검정에 활용
f분포 : 두 집단의 분산 분석에 활용 

반응형
반응형

[통계] 상관관계와 상관계수

1. 상관 관계란 
- 양의 상관관계와 음의 상관관계가 있다. 
- x가 증가할 때, y 가 증가하는 것은 양의 상관관계이다. 

2. 상관 계수
- 방향과 힘의 개념이 존재함
- -1부터 1까지 존재함. 
- 0일 경우 상관이 없다고 할 수 있다. 
- 산포도를 그렸을 때, 모여있으면 상관계수의 값이 크다. 

3. 인과관계
- 원인과 관계를 갖는 관계성을 인과관계이다. 
- 저녁을 먹어서 배가 부르다 와 같이 원인과 결과가 있다.
- 상관관계와 관련이 없다. 

4. 참조 
https://www.youtube.com/watch?v=Se7mWTBRfCc&list=PLalb9l0_6WAq-ZNVWOhRdax1nroxFovUb&index=6

 

반응형
반응형

[통계] 변수의 종류는 무엇이 있는가

 

1. 변수란
- 변화하는 숫자이다. 
- 변수의 반대말은 상수일 것이다. 

2. 변수 종류
명목 척도 : 변수에는 이름을 대신할 뿐 의미가 없다. ex) 이름
순위 척도 : 순서에 의미가 있다. ex) 신용도
구간 척도 : 절대값이 없지만 비율에 의미가 있다. ex) 온도
비율 척도 :  0이라는 절대 값이 있다. ex) 몸무게 

3. 참조

https://www.youtube.com/watch?v=otvjWhlefnc&list=PLalb9l0_6WAq-ZNVWOhRdax1nroxFovUb&index=5

 

 

반응형
반응형

[통계] 통계적 가설과 오류, 귀무가설, 대립가설이란?

 

1. 귀무가설
- Null Hypothesis의 약자로 아무 영향이 없다.
- 인과관계가 없다. 

2. 대립가설
- Alternative Hypotheiss 의 약자로 귀무가설과 대립되는 가설이다.
- p value값이 5% 보다 작으면 인과 관계가 존재한다. 

3. 1종 오류, 2종오류로 보는 p value 

  사실이라고 예측 거짓이라고 예측
사실 문제x 1종 오류
거짓 2종 오류 문제x

1종 오류란 사실인데 거짓으로 예측한 확률이며, 5% 이내로 하겠다고 한 p value 를 의미하며, 
사실인데 거짓이라고 예측할 확률을 5% 이내로 하겠다는 것이다. 

 

반응형
반응형

[통계] p value란 무엇인가

 

1. p value란
- 통계를 배우다 보면, p value 값이 0.05 보다 작으니 유의하다 라는 말을 볼 수 있다. 
- probability value 의 약자로 확률값이다.
- 어떠한 사건이 우연히 발생한 사건이 확률이 p value 이다. 

2. 0.05 가 기준인 이유 
- 기준이 0.05인 이유는 프랑스 수학자들이 정한 것임 
- 어떠한 사건이 우연히 발생한 확률이 5% 보다 작다는 것은 무언가 인과관계가 있다는 것이며 이를 유의하다 라고 한다. 

3. 참조
[1]. p value 란, https://www.youtube.com/watch?v=5Xke4ao1g9E&list=PLalb9l0_6WAq-ZNVWOhRdax1nroxFovUb&index=3

 

반응형

+ Recent posts