본문 바로가기
책 리뷰

[독후감] 틀리지 않는 법 - 4부

by 째스터 2022. 8. 27.
728x90

14장
평균으로의 회귀: 우생학을 주장한 골턴이 주장한 이론.
극단적이나 이례적인 결과는 평균 방향으로 돌아오는 경향을 가진다는 개념.

시크리스트는 기업의 경쟁 활동에서 평범이 득세하는 경향이 있다고 주장한다.
하지만, 평균으로의 회귀는 다양한 외부 요인이 작용하는 경우(우연의 영향을 받는 경우)에서 거의 늘 발생하는 현상이다.

평균으로의 회귀가 시크리스트의 말처럼 경쟁에서 비롯된 자연스러운 결과라면, 
경쟁의 영향력이 미래로만이 아니라 과거로도 미쳐야 한다는 말이다.

15장
두 변량이 아무 관계가 없을 때 타원은 원이 되고(이심률 0) 산포도는 동그란 모양이 된다.
운이 전혀 개입하지 않는 경우 데이터는 직선을 따라 놓인다.
이 경우는 최대한 타원이 최대한 타원이 된 형태로 나타난다.

이변량 정규 분포 타원의 이심률(초첨 사이의 거리)이 큰 경우에 상관계수 1에 가깝다.
이심률이 0에 가까워질수록(원에 가까워질수록) 상관계수 0에 가까워진다.

벡터로도 상관관계를 판단할 수 있다.
상관관계는 벡터 사이의 각도의 코사인 값이다.

두 벡터의 각도가 0도일때는 상관관계 1
두 벡터의 각도가 180도일때는 상관관계 -1

삼차원 벡터의 각도를 구하는 법은 다음과 같다.
(오랜만에 보는 백터의 내적)

벡터의 내적은 한 벡터로 나머지 하나의 벡터를 정사영하는 개념인데 이전 장의 사영의 개념이 이어진다.

16장
벅슨의 오류
- 어느 마을의 총 인구 1000명
- 30%는 고혈압이고, 40%는 당뇨에 걸렸다.
- 고혈압, 당뇨는 독립적이라고 가정해서 당뇨 환자 400명 중 30%(120명)이 고혈압까지 동시에 앓는다.

이때 고혈압이나 당뇨를 앓고있는 모든 환자 580명이 입원한다고 하자.
당뇨 환자 400명 중 30%가 고혈압이 있다.
그런데 병원의 비당뇨 환자 중 180명 중 100%가 고혈압이 있다.

이때 병원의 당뇨 환자의 고혈압일 확률 30%가
비당뇨 환자의 고혈압일 확률 100%보다 낮으므로
당뇨는 고혈압을 막아준다! 라고 결론을 내리는 것을 벅슨의 오류라고 한다.

사실은 비당뇨 환자는 마을에 남아있는 420명을 포함해야 한다.
마을에 남은 사람들을 포함해서 정확하게 계산하면 600명 중에 180명이므로 30%로 똑같다.

전체 인구에서 무작위로 뽑은 표본이 아니라 병원에 오는 사람들만 측정했기 때문에 오류가 발생한다.


https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=74921141

 

틀리지 않는 법

신동 출신의 수학자로 유명한 위스콘신 주립대 수학과 교수 조던 엘렌버그의 첫 수학 대중서. 저자는 우리가 살아가는 데 왜 수학이 필요한지, 실제로 어디에 어떻게 써먹을 수 있을지를 치밀하

www.aladin.co.kr

728x90

댓글