Upstage AI Lab 3기
Statistics - Correlation Analysis
developzest
2024. 4. 28. 18:24
목차
- Correlation Analysis
- Pearson's Correlation Coefficient
Correlation Analysis
두 변수 간에 어느 정도의 선형적 관계가 있는지 파악하는 방법
상관 관계의 정도를 나타내는 지수인 상관 계수를 통해 분석
자료의 산점도에서 두 변량 사이의 상관관계를 판단하려면 자료의 경향을 나타내는 직선인 추세선 주위에 모여 있는지 살펴봐야 함
- $f(x) = ax + b$
상관관계는 인과관계를 의미하지 않음
Pearson's Correlation Coefficient
두 데이터 X, Y 즉, $(x_1, y_1), (x_2, y_2), \dots, (x_n, y_n)$ 에 대해
X와 Y가 함께 변하는 정도를 X와 Y가 각각 변하는 정도로 나눈 것$r_{xy} = \frac{\displaystyle\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\displaystyle\sum_{i=1}^n(x_i-\bar{x})^2 \displaystyle\sum_{i=1}^n(y_i-\bar{y})^2 }}$