Upstage AI Lab 3기

Statistics - Correlation Analysis

developzest 2024. 4. 28. 18:24

목차

  • Correlation Analysis
    • Pearson's Correlation Coefficient

Correlation Analysis

  • 두 변수 간에 어느 정도의 선형적 관계가 있는지 파악하는 방법

  • 상관 관계의 정도를 나타내는 지수인 상관 계수를 통해 분석

  • 자료의 산점도에서 두 변량 사이의 상관관계를 판단하려면 자료의 경향을 나타내는 직선인 추세선 주위에 모여 있는지 살펴봐야 함

    • $f(x) = ax + b$
  • 상관관계는 인과관계를 의미하지 않음

    Pearson's Correlation Coefficient

  • 두 데이터 X, Y 즉, $(x_1, y_1), (x_2, y_2), \dots, (x_n, y_n)$ 에 대해

    X와 Y가 함께 변하는 정도를 X와 Y가 각각 변하는 정도로 나눈 것

  • $r_{xy} = \frac{\displaystyle\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\displaystyle\sum_{i=1}^n(x_i-\bar{x})^2 \displaystyle\sum_{i=1}^n(y_i-\bar{y})^2 }}$