: 성능 결과 측정 (성능평가)
새로운 변수 추가 시, 최소제곱합은 줄어들고 총제곱합은 유지된다.
왜냐하면 모델 구축 시, 일반 최소제곱법 사용하기 때문이다.
(목표) 최소제곱합 최소화
변수 추가 시, 예측 계선하는 계수(b)찾는다.
하지만 찾을 수 없는 경우 0으로 만든다.
즉, 변수를 추가했으나 예측에는 영향을 주지 않게되고, 최소제곱합 변경 또한 안된다.
무작위성 상관관계 있는 경우, R-제곱이 개선되고, 최소제곱합 줄어든다.
하지만 의미없다. 따라서 수정된 R-제곱을 사용한다.
k : 모델에 포함된 독립 변수의 수
n : 표본 크기
k가 증가하면 분모가 감소하여 분수 값 커지게된다.
이를 빼게 되므로 결과적으로 R-제곱이 감소하게된다.
즉, 변수 추가하면 패널티를 받는 것이다.
단, 변수의 가치가 있을 경우 패널티를 충분히 보상받는다.
'여러가지 > Python' 카테고리의 다른 글
섹션 16. 로지스틱 회귀 (Logistic Regression) (0) | 2024.08.03 |
---|---|
섹션 13. Python에서의 회귀 모델 선택 (0) | 2024.07.21 |
섹션 11. 랜덤 포레스트 회귀 (Random Forest Intuition) (0) | 2024.07.20 |
섹션 10. 의사 결정 트리 회귀 (Decision Tree Intuition) (0) | 2024.07.20 |
섹션 9. 서포트 벡터 회귀 (SVR, Support Vector Regression) (0) | 2024.07.19 |