2025-09-30 23:58

Tags: 수학

평균 (Average)

  • 데이터의 중심을 파악하고 불확실성을 줄이는 핵심 도구
  • 데이터의 분포나 특이값(outlier)에 따라 현실을 왜곡할 수 있으므로 항상 비판적 사고 필요
  1. 이 평균은 어떤 종류의 평균인가? (산술, 중앙값, 기하…)
  2. 이 평균값에서 제외된 정보는 무엇인가? (데이터 분포, 특이값…)
  3. 이 평균을 통해 전달하려는 의도는 무엇인가? (숨겨진 변수, 의도적 왜곡…)
구분산술 평균 (Mean)중앙값 (Median)최빈값 (Mode)
정의모든 값의 합 / 값의 개수데이터를 순서대로 나열했을 때 중앙에 위치하는 값가장 빈번하게 나타나는 값
사용 시점데이터가 대칭적으로 분포할 때 (예: 시험 점수)데이터가 한쪽으로 치우쳤거나 특이값이 있을 때 (예: 연봉)범주형 데이터를 분석하거나 가장 인기 있는 값을 찾을 때 (예: 선호 색상)
특이값 민감도매우 민감함영향을 거의 받지 않음 (강건함)전혀 영향을 받지 않음

성장률과 투자 수익률에는, 기하 평균 (Geometric Mean)

  • -50% 성장 후 +50% 성장했다면 평균 성장률은 0%일까?

    • 산술 평균으로는 그렇다.
    • (-50 + 50) / 2 = 0.
    • 하지만 실제로는 다르다.
  • 100만 원이 -50% 성장하면 50만 원이 되고, 여기서 +50% 성장하면 75만 원이 된다.

  • 결과적으로 원금 대비 -25% 손실이다.

  • 이처럼 여러 값들이 서로 곱셈이나 비율로 연결될 때, 산술 평균은 왜곡을 발생시킨다.

    • 이때 사용하는 것이 기하 평균이다.
  • 계산법: n개의 값을 모두 곱한 후, n제곱근을 씌운다.

  • 언제 사용할까?:

    • 다년간의 평균 경제 성장률, 평균 물가 상승률, 펀드의 평균 수익률 등 ‘복리’ 개념이 적용되는 모든 변화율의 평균을 계산할 때

평균 속도를 계산할 때는, 조화 평균 (Harmonic Mean)

  • 시속 100km로 서울에서 부산까지 간 후, 시속 60km로 다시 서울로 돌아왔다.
    • 왕복 평균 속도는 얼마일까?
    • 많은 사람이 산술 평균인 시속 80km (100 + 60) / 2라고 착각한다.
  • 하지만 평균 속도는 ‘총 이동 거리 / 총 걸린 시간’으로 구해야 한다.
    • 거리를 L이라 하면, 갈 때 걸린 시간은 L/100, 올 때 걸린 시간은 L/60이다.
    • 총 이동 거리는 2L, 총 걸린 시간은 (L/100 + L/60)이므로,
    • 평균 속도는 2L / (L/100 + L/60) = 시속 75km가 된다.
  • 이처럼 속도, 비율, 밀도 등 단위 당 수치(‘per’의 개념)들의 평균을 구할 때는 조화 평균을 사용해야 정확하다.
    • 계산법: 값들의 역수를 산술 평균 낸 후, 그 결과값을 다시 역수 취한다.
    • 언제 사용할까?: 평균 속도, 투자에서 ‘분할 매수(Dollar Cost Averaging)‘의 평균 매입 단가 등을 계산할 때 사용된다.