본문 바로가기
도서

[도서] 세상에서 가장 쉬운 통계학 입문

by doo_ 2024. 2. 2.

 

[이 책은]

이 책의 특징 中 : 어느 한 부분이라도 내용을 뺀다면 더 이상 통계학이 아니라고 할 정도로 최소한의 필수적인 부분만을 다루어 쉽게 읽을 수 있는 아주 쉬운 입문서

(초보자들이 겪는 혼란의 원인들을 짚어가며 쉽게 설명하겠다는 작가의 열정이 보인다ㅋㅋ,, 작가의 어투가 왠지 재밌다)

이 책은 2부로 구성되어 통계학에서 가장 중요한 항목인 '검정'과 '구간추정'을 소개한다.

1부에서는 통계학이라는 것은 무엇이며, 어떠한 개념으로 실현되는지에 대해 알아가며, 2부에서는 1부의 내용에서 더 깊이 들어가 모집단에 관한 통계학적 추정 방법론을 배운다.

목표는 t분포를 사용한 소표본의 검정과 구간추정에 가장 효율적으로 도달하는 것이다.

 

"세부적인 내용에 연연하지 말고 반드시 전체적으로 쭉쭉 읽어 나가길 추천"

 

[느낀점]

> 위의 " ~ "말처럼 통계 공부하면서 느낀 건, 세부적이 내용에 연연해서 시간을 잡아먹기 보다는 차라리 전체적으로 쭉 읽어나가고 다시 되돌아가 읽어보거나 보충 자료를 찾아보는 것이 좋다고 느꼈다.

> 통계 기초를 쌓고자 이미 다른 책(통계101&데이터 분석)을 읽고 있어서 안 읽으려고 했었다. 하지만 혹시나 기초 공부를 하면서 놓친 부분이 있을까 싶어, 복습도 할겸 읽게 됐다.

>아무래도 겹치는 부분이 많기도 하고 어느정도 기초를 알고 있다보니 금방 읽을 수 있었다. 복습도 하고, 추가적으로 배워가는 부분들이 있어서 좋았다. 

- 만약 오랫동안 수학을 멀리했던 사람에게는 첫 입문서로 좋은 책인 것 같다.

- 어느정도 수학을 좋아하고 기본 바탕이 있다면 이 책보다는 좀 더 깊게 다룬 다른 책을 읽는 것도 좋겠다는 생각이 든다.

+) 강의를 듣거나 통계101을 읽으면서, 평균과 분산만 보고 데이터가 무엇을 의미하는지 직관적으로 알았으면 좋겠다 생각했었는데, 이 책을 읽으면서 그것을 어느정도 이해할 수 있게 된 것 같다. 평균, 표준편차, 신뢰구간

 

세상에서 가장 쉬운 통계학 입문 - 예스24

마케팅을 위한 데이터 분석, 금융상품의 리스크와 수익률 분석, 주식과 환율의 변동률 분석 등 쏟아지는 데이터에서 의미 있는 정보를 뽑아내기 위한 방법으로서의 통계를 소개하는 책이다. 이

www.yes24.com

[배운점 中]

더보기

> 데이터들은 다양한 수치로 분포되어 있다. 이는 불확실성때문에 나타난다. 하지만 그 불확실서 안에서 고유한 '특징'이나 반복되는 것이 있는데, 이를 분포의 특성이라 한다. 이 분포의 특성을 이끌어 내는 방법이 통계다. 나열된 데이터를 어떤 기준으로 정리정돈해서 의미있는 정보(수치가 집중되는 곳, 대칭성 등)만을 추출하는 것을 축약이라 한다. 축약의 방법으로는 숫자 하나로 데이터의 특징을 요약하고 대표하는 것(평균, 분산 등 통계량), 그래프로 만들어 그 특징을 파악하는 것이 있다(도수분포표, 히스토그램)

> 평균 구하는 방법

+) 산술평균 : 덧셈의 의미

+) 기하평균 : X*Y는 x와 y를 곱한 값이 어떤 수를 두 번 곱했을 때와 같도록 하는 수는 무엇인지 구할 때 ex. 성장률

+) 제곱평균 : 평균으로부터 데이터들이 얼마나 분산되어 있는지 파악

+) 조화평균 : 단위 1당 x값, 단위 1당 y값 이 둘의 평균을 구할 때 사용 1/x + 1/y ex. 속도와 시간

 

> 표준편차를 통해 알 수 있는 것

- 한 데이터 세트 중에 있는 어떤 데이터 하나의 수가 갖는 의미

ex. 내가 받은 점수가 잘 받은 점수인지 궁금할 때

- 여러 데이터 세트를 서로 비교해서 나타나는 차이

ex. 한 친구의 평균 성적과 표준편차, 한 친구의 평균 성적과 표준편차 비교할 때

- 표준편차 = 변동성

 

> 문제의 본질을 '통계학적'으로 바라보는 것

ex. 동전을 n번 던져서 10개가 앞면이 나올 확률 like n명의 사람 중에서 10명의 사람이 물건을 살 확률

 

> 통계적 검정은 결론을 소극적으로 밖에 평가할 수 없다.귀납법으로 부분에서 전체라는 형식으로 추론하기 때문에, 반드시 옳다고 말할 수 없는 추론법이기 때문이다. (사용하는 방법 나름이지만) '부정'에만 강하게 사용할 수 있다.(~가 일어날 확률이 희박하다_예언적중구간)

 

> 통계적 추정의 목표는 모집단 중에서 나오는 몇 가지의 데이터를 가지고 모집단 전체에 대해 어떠한 추측을 하는 일이다.

- 모집단 전체의 상태를 반영한 결과라면 부분으로 전체를 판단하는 것은 된장국을 맛보는 경우와 같다.

- 된장국 끓이면서 한 숟가락으로 맛 보는 일, 단 된장국이 잘 섞이지 않는다면 부분마다 다를 가능성이 있다.