본문 바로가기
데이터분석

[수학] 통계학입문 (첫번째)

by 101Architect 2016. 5. 2.

통계학입문 세상에서 가장 쉬운 통계학입문

고지마 히로유키 지음 | 박주영 옮김 | 지상사 | 2009년 12월 17일 출간


1강~9강)

l  도수분포표, 히스토그램

계급, 계급값, 도수, 상대도수, 누적도수

도수분포표 평균=계급값*상대도수의 합계

많이 나온 데이터가 평균값에 큰 영향을 준다.

l  산술평균(덧셈), 기하평균(곱셈:성장률), 제곱평균, 조화평균(속도)

l  분산: 불규칙한 상태의 통계량

제곱의 평균: 음수값을 처리하여 평균을 구함

너무 크고, 단위가 다름 편차^2 -> 루트분산 = 표준편차

l  {(계급값-평균값)^2*상대도수} = 도수분포표의 분산

l  (데이터-평균값)/표준편차 = 데이터의 편차의 비율


l  데이터에 일정한 수를 더하여 가공한 경우 -> 편차, 분산, 표준편차 동일

l  데이터에 일정한 수를 곱하여 가공한 경우 -> 평균 k, 편차 k, 분산 k^2, 표준편차 k

l  표준편차의 N배가 되도록 데이터를 가공 -> 데이터 = (이전데이터 평균값) /표준편차 -> 평균은 0, 표준편차는 1


l  주식에서의 수익률의 표준편차 = 주가변동성

l  high 리스트 high 리턴 = 평균 수익률이 높으면 표준 편차도 크다.



l  직선상의 A,B,C,D 는 우연을 가릴 수 없다.

n  직선 위에 있는 상품 = 뛰어난 상품

n  직선 아래 있는 상품 = 열등한 상품

l  샤프지수 클수록 우량금융상품

n  x 의 샤프지수 = (x리턴-국제이자율) / x 의 리스크

l  표준정규분포: 평균 0, 표준편차 1

n  (+1)~(-1) 의 상대도수는 0.6 (70%) 데이터가 있음

n  (+2)~(-2) 의 상대도수는 0.9 (95%) 데이터가 있음

l  일반정규분포의 데이터 = a(일정한수의곱) * 표준정규분포의 데이터 + u(더하는일정한수)

l  일반정규분포 평균값=u, 표준편차=a

n  (u+1*a)~(u-1*a) 의 상대도수는 0.6 (70%) 데이터가 있음

n  (u+2*a)~(u-2*a) 의 상대도수는 0.9 (95%) 데이터가 있음

l  일반 -> 표준

n  z=(x-u)/a

표준정규분포 = (데이터-평균)/표준편차

l  연역 (전체 -> 부분)

l  귀납 (부분 -> 전체)

l  가설검증, 구간추정

반응형