EunGyeongKim

히스토그램, 부트스트래핑 본문

ML & DL

히스토그램, 부트스트래핑

EunGyeongKim 2023. 3. 26. 11:24

히스토그램

  • 경험적 히스토그램
    • 관측한 자룔르 이용하여 그린 히스토그램으로 자료를 구간별로 분류하고 구간별 도수를 계산한 뒤 도수를 밀도단위로 바꾸어 밀도단위 히스토그램으로 나타낸것
    • 하지만 시행횟수가 적으면 합의 분포가 정규분포 곡선에 잘 들어맞지 않음
  • 확률 히스토그램
    • 합이 가질수 있는 값을 확률로 계산하여 히스토그램으로 나타냄
  • 중심극한정리(Central limit Theorem)
    • 시행횟수(n)가 증가함에 따라 합이나 평균의 확률 히스토르갬이 정규분포곡선으로 수렴해 가는것
  • 정규분포곡선
    • 모집단의 분포를 수학적인 모형으로 표현하는 이상적인 히스토그램

  • mu = 모평균, sigma = 모표준편차
  • 특히 평균이 0이고 표준편차가 1인 정규분포를 표준정규분포라 하고 Z~N(0,1)으로 표시
  • 표준 정규분포의 확률밀도함수

 

 부트스트래핑(bootstrapping)

  • 추출 횟수가 적을때 표본합, 또는 표본평균의 확률 히스토그램을 정규분포로 근사시키는 것을 위험함. 그러므로 표본의 크기가 작은 경우 원래의 표본으로부터 약 1,000회 정도 복원추출로 표본을 추출하여 1,000개의 표본평균을 구해서 확률 히스토그램의 근사치로 이용하는것.

 

  •  

'ML & DL' 카테고리의 다른 글

[데이터분석] AARRR  (0) 2023.03.27
[데이터분석] 그로스해킹  (0) 2023.03.27
정규분포(normal distribution)  (0) 2023.03.22
백분위수, 사분위수  (0) 2023.03.22
지도학습 : 분류  (1) 2023.03.03
Comments