Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- python 갯수세기
- RMES
- knn
- mMAPE
- 논문editor
- Scienceplots
- 스택
- Python
- Overleaf
- n_neighbors
- 에러해결
- iNT
- MAPE
- 프로그래머스
- n_sample
- 평가지표
- Tire
- SMAPE
- 파이썬을파이썬답게
- Mae
- PAPER
- Alignments
- 카카오
- KAKAO
- 논문
- 논문작성
- Pycaret
- TypeError
- 코테
- mes
Archives
- Today
- Total
EunGyeongKim
히스토그램, 부트스트래핑 본문
히스토그램
- 경험적 히스토그램
- 관측한 자룔르 이용하여 그린 히스토그램으로 자료를 구간별로 분류하고 구간별 도수를 계산한 뒤 도수를 밀도단위로 바꾸어 밀도단위 히스토그램으로 나타낸것
- 하지만 시행횟수가 적으면 합의 분포가 정규분포 곡선에 잘 들어맞지 않음
- 확률 히스토그램
- 합이 가질수 있는 값을 확률로 계산하여 히스토그램으로 나타냄
- 중심극한정리(Central limit Theorem)
- 시행횟수(n)가 증가함에 따라 합이나 평균의 확률 히스토르갬이 정규분포곡선으로 수렴해 가는것
- 정규분포곡선
- 모집단의 분포를 수학적인 모형으로 표현하는 이상적인 히스토그램
- mu = 모평균, sigma = 모표준편차
- 특히 평균이 0이고 표준편차가 1인 정규분포를 표준정규분포라 하고 Z~N(0,1)으로 표시
- 표준 정규분포의 확률밀도함수
부트스트래핑(bootstrapping)
- 추출 횟수가 적을때 표본합, 또는 표본평균의 확률 히스토그램을 정규분포로 근사시키는 것을 위험함. 그러므로 표본의 크기가 작은 경우 원래의 표본으로부터 약 1,000회 정도 복원추출로 표본을 추출하여 1,000개의 표본평균을 구해서 확률 히스토그램의 근사치로 이용하는것.
'ML & DL' 카테고리의 다른 글
[데이터분석] AARRR (0) | 2023.03.27 |
---|---|
[데이터분석] 그로스해킹 (0) | 2023.03.27 |
정규분포(normal distribution) (0) | 2023.03.22 |
백분위수, 사분위수 (0) | 2023.03.22 |
지도학습 : 분류 (1) | 2023.03.03 |
Comments