티스토리 뷰
목차
ADsP의 최대 난관인 3과목 '데이터 분석', 통계학 기초가 전혀 없는 노베이스 비전공자도 과락 없이 합격할 수 있는 전략은 따로 있습니다. 복잡한 R 코딩 대신 해석하는 법, 수학 공식 대신 키워드를 암기하는 '문과생 맞춤형' 3과목 공략법을 공개합니다.
1. R 프로그래밍, 짜지 말고 '해석'하라
많은 비전공자가 3과목을 시작하자마자 R 프로그램을 설치하고 코드를 짜보려다가 포기하곤 합니다. 하지만 ADsP는 실기 시험이 없는 필기시험이므로, 코드를 직접 작성할 필요가 전혀 없습니다. 중요한 것은 주어진 코드가 '무엇을 의미하는지'와 그 결과값을 '어떻게 읽는지'입니다. 예를 들어 `head()`, `summary()`, `str()`과 같은 기초 함수가 어떤 역할을 하는지, 그리고 출력된 결과 화면에서 평균값(Mean), 중앙값(Median), 사분위수(Quantile)가 어디에 위치하는지만 파악하면 됩니다. 복잡한 알고리즘 구현 코드는 시험에 나오지 않으니, 기출문제에 자주 등장하는 데이터 전처리 및 통계 분석 결과표를 보고 해석하는 연습에 집중하십시오. 코딩 공부가 아니라 '독해' 공부라고 생각하면 훨씬 수월해집니다.





2. 통계, 공식 증명 대신 '용도' 암기
통계학 교과서에 나오는 시그마($\sum$)나 적분 기호가 포함된 복잡한 수학 공식을 달달 외우는 것은 비효율의 극치입니다. ADsP 3과목에서 요구하는 것은 공식을 유도하는 능력이 아니라, '언제 어떤 통계 기법을 써야 하는지'를 아는 것입니다. 예를 들어, 두 집단의 평균 차이를 비교할 때는 T-test, 세 집단 이상일 때는 ANOVA(분산분석), 범주형 데이터의 연관성을 볼 때는 카이제곱 검정을 쓴다는 식으로 '상황'과 '기법'을 매칭해서 암기해야 합니다. 또한 모수 검정과 비모수 검정의 차이, 피어슨 상관계수와 스피어만 상관계수의 차이(등간/비율 vs 서열) 등 각 개념의 정의와 사용 조건을 구분하는 문제가 주로 출제되므로, 키워드 중심으로 정리하는 것이 노베이스 합격의 지름길입니다.
3. 마법의 숫자, 유의확률(p-value) 0.05
통계 파트에서 가장 어렵게 느껴지는 '가설 검정'은 딱 하나의 규칙만 기억하면 문제의 80%를 풀 수 있습니다. 바로 "유의확률(p-value)이 유의수준(보통 0.05)보다 작으면 귀무가설을 기각한다(통계적으로 유의하다)"는 원칙입니다. 시험 문제에서 모델의 결과표를 주고 "이 변수는 통계적으로 유의한가?"를 물을 때, 옆에 적힌 Pr(>|t|) 또는 p-value 값이 0.05보다 작은지 큰지만 확인하면 됩니다. 작으면 별표(*)가 찍혀 있고 중요한 변수이며, 크면 중요하지 않은 변수입니다. 이와 더불어 제1종 오류(귀무가설이 참인데 기각)와 제2종 오류(귀무가설이 거짓인데 채택)의 정의만 확실하게 외워두면, 가설 검정 문제는 더 이상 공포의 대상이 아닌 점수 자판기가 될 것입니다.





4. 정형 데이터 마이닝의 분류와 평가지표
데이터 마이닝 파트는 크게 '지도 학습'과 '비지도 학습'으로 나뉘는데, 어떤 알고리즘이 어디에 속하는지 분류하는 것이 첫 번째 과제입니다. 의사결정나무, 인공신경망, 로지스틱 회귀분석은 지도 학습(분류/예측)이고, 군집 분석, 연관 분석은 비지도 학습이라는 큰 틀을 먼저 잡으십시오. 그 후 반드시 마스터해야 할 것은 오분류표(Confusion Matrix)를 통한 평가지표 계산입니다. 정분류율(Accuracy), 재현율(Recall), 정밀도(Precision), F1-Score를 구하는 공식은 단순 사칙연산 수준이므로, 기출문제를 통해 몇 번만 연습하면 비전공자도 쉽게 맞힐 수 있습니다. ROC 커브나 리프트 곡선 같은 개념도 그래프의 모양과 X, Y축이 무엇인지만 파악하면 충분합니다.
5. 과감한 '선택과 집중' 전략
3과목에서 고득점을 노리다가 오히려 과락을 맞는 경우가 많습니다. 비전공자에게는 시계열 분석의 복잡한 수식이나 다차원 척도법의 깊은 이론까지 이해하려는 시도가 독이 될 수 있습니다. 너무 어렵고 이해가 안 되는 10%의 내용은 과감하게 버리십시오. 대신 매 회차 반복해서 출제되는 앙상블 모형(배깅, 부스팅, 랜덤포레스트)의 특징이나 인공신경망의 활성화 함수 같은 핵심 개념을 확실하게 맞히는 전략이 유효합니다. ADsP 시험은 60점만 넘으면 자격증이 나옵니다. 3과목 목표 점수를 50~60점으로 잡고, 1과목과 2과목 암기 파트에서 점수를 벌어 평균을 맞추는 것이 노베이스 합격의 정석입니다. 모르는 문제는 기출문제의 보기 자체를 외워버리는 '양치기'가 통계학 개론서를 읽는 것보다 백번 낫습니다.






