본문 바로가기

여러가지/Python

섹션 12. R-제곱(Squared)

: 성능 결과 측정 (성능평가)

 

새로운 변수 추가 시, 최소제곱합은 줄어들고 총제곱합은 유지된다.

왜냐하면 모델 구축 시, 일반 최소제곱법 사용하기 때문이다.

 

(목표) 최소제곱합 최소화

 

변수 추가 시, 예측 계선하는 계수(b)찾는다.

하지만 찾을 수 없는 경우 0으로 만든다.

즉, 변수를 추가했으나 예측에는 영향을 주지 않게되고, 최소제곱합 변경 또한 안된다.

 

무작위성 상관관계 있는 경우, R-제곱이 개선되고, 최소제곱합 줄어든다.

하지만 의미없다. 따라서 수정된 R-제곱을 사용한다.

 

k : 모델에 포함된 독립 변수의 수

n : 표본 크기

 

k가 증가하면 분모가 감소하여 분수 값 커지게된다.

이를 빼게 되므로 결과적으로 R-제곱이 감소하게된다.

즉, 변수 추가하면 패널티를 받는 것이다.

단, 변수의 가치가 있을 경우 패널티를 충분히 보상받는다.