2025-09-15 21:56

Tags: 수학 논리학

상관관계

  • 두 변수가 함께 변하는 경향을 나타내는 통계적 척도이지만 인과관계를 의미하지는 않는다.
    • “아이스크림 판매량이 늘면 상어 공격 횟수도 늘어난다”
    • 여름이니까…(공통 원인)

방향 양의 상관, 음의 상관, 무상관

  • 양의 상관관계 (Positive Correlation):
    • 한 변수가 증가할 때 다른 변수도 함께 증가하는 경향. 예를 들어, 공부 시간이 늘어날수록 성적이 오르는 경향.
  • 음의 상관관계 (Negative Correlation):
    • 한 변수가 증가할 때 다른 변수는 감소하는 경향. 예를 들어, 운동량이 많아질수록 체지방률이 낮아지는 경향.
  • 무상관 (Zero Correlation):
    • 두 변수 사이에 뚜렷한 관계가 없는 상태. 예를 들어, 한 사람의 신발 사이즈와 IQ 점수.(웃긴건 일정 수준까진 당연히 있다)

강도 관계의 긴밀함

  • 상관관계의 강도는 상관계수(Correlation Coefficient) 라는 값으로 표현되며, 보통 r로 표기한다. 이 값은 항상 -1과 +1 사이에 위치한다.
  • +1에 가까울수록: 매우 강한 양의 상관관계
  • -1에 가까울수록: 매우 강한 음의 상관관계
  • 0에 가까울수록: 상관관계가 거의 없거나 없음
상관계수 (r)의 절댓값해석
0.0 - 0.2거의 없음
0.2 - 0.4약한 상관관계
0.4 - 0.7뚜렷한 상관관계
0.7 - 1.0강한 상관관

상관관계 해석 시 주의사항

제3의 변수 (숨겨진 변수)

  • 두 변수 A와 B 사이에 높은 상관관계가 나타나더라도, 이는 사실 제3의 변수 C가 A와 B 모두에게 영향을 미치기 때문일 수 있다.
  • 예시: 아이스크림 판매량(A)과 상어 공격 횟수(B)
    • 상관관계:
      • 여름철에 아이스크림 판매량과 상어 공격 횟수는 강한 양의 상관관계를 보인다.
    • 숨겨진 변수:
      • ‘기온’ 혹은 ‘계절’(C)이다.
      • 더운 날씨 때문에 사람들이 아이스크림을 많이 사 먹고, 동시에 바다에서 수영을 많이 하므로 상어와 마주칠 확률이 높아지는 것이다.
    • 결론: 아이스크림 판매가 상어 공격의 원인이 아니다.

우연의 일치

  • 서로 아무런 관련이 없는 두 변수가 우연히 비슷한 패턴을 보이는 경우다.
    • 데이터의 양이 방대해질수록 이런 우연한 상관관계는 얼마든지 나타날 수 있다.
  • 예시: 미국 메인주의 이혼율과 1인당 마가린 소비량
    • 상관관계: 두 변수는 수년간 거의 완벽에 가까운 상관관계를 보였다.
    • 결론: 둘 사이에는 어떠한 논리적, 인과적 연결고리도 없다. 순수한 우연의 일치다.

인과관계의 역전\

  • A가 B의 원인이라고 생각했지만, 실제로는 B가 A의 원인일 수 있다.
  • 예시: 행복한 사람일수록 친구가 많다.
    • 해석 1 (A→B): 행복한 감정(A)이 사람들을 더 사교적으로 만들어 친구(B)를 많이 사귀게 한다.
    • 해석 2 (B→A): 많은 친구(B)와 교류하는 것이 사람을 더 행복하게(A) 만든다.
    • 결론: 어느 쪽이 원인인지, 혹은 둘 다 서로에게 영향을 미치는지 상관관계 분석만으로는 알 수 없다.