본문 바로가기

Upstage AI Lab 3기

Statistics - Correlation Analysis

목차

  • Correlation Analysis
    • Pearson's Correlation Coefficient

Correlation Analysis

  • 두 변수 간에 어느 정도의 선형적 관계가 있는지 파악하는 방법

  • 상관 관계의 정도를 나타내는 지수인 상관 계수를 통해 분석

  • 자료의 산점도에서 두 변량 사이의 상관관계를 판단하려면 자료의 경향을 나타내는 직선인 추세선 주위에 모여 있는지 살펴봐야 함

    • $f(x) = ax + b$
  • 상관관계는 인과관계를 의미하지 않음

    Pearson's Correlation Coefficient

  • 두 데이터 X, Y 즉, $(x_1, y_1), (x_2, y_2), \dots, (x_n, y_n)$ 에 대해

    X와 Y가 함께 변하는 정도를 X와 Y가 각각 변하는 정도로 나눈 것

  • $r_{xy} = \frac{\displaystyle\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\displaystyle\sum_{i=1}^n(x_i-\bar{x})^2 \displaystyle\sum_{i=1}^n(y_i-\bar{y})^2 }}$

'Upstage AI Lab 3기' 카테고리의 다른 글

Python EDA - Numpy  (0) 2024.04.30
Linear Regression & Binary Classification  (0) 2024.04.30
Statistics - ANOVA  (0) 2024.04.28
Statistics - 추리통계  (1) 2024.04.28
Statistics - 기술통계  (0) 2024.04.25