처음 처음 | 이전 이전 | 1 | 2 |다음 다음 | 마지막 마지막
질병의 탄생 - 우리는 왜, 어떻게 질병에 걸리는가
홍윤철 지음 / 사이 / 2014년 1월
평점 :
장바구니담기


질병에 대한 거시적인 관점을 제공해준다과거에 인류 생존에 이득을 주는 방향으로 자연선택변화해 나갔던 유전적 특성이 정착생활농업혁명산업혁명을 짧은 시간에 경험하게 되면서 오히려 인간에게 질병을 가져다 주게 되었다는 주장을 여러 질환이나 요인을 통해 설명.제러드 다이아몬드의 < 비슷하다는 느낌을 받았는데 아니나 다를까  초반부터  책을 언급한다

 

상당히 흥미로운 책이지만 각각의 주제들을 하나의 책으로 써도 무방할 정도이기 때문에 개론서 수준을 벗어나지 못해서 나는  알고 있는이야기들이 많았고   깊게 들어갔으면 좋겠다 싶으면  챕터가 끝나 있다아무래도 일반인들을 대상으로 해야 책이  팔릴테니 그렇게   밖에 없었던 것이 아닐까 싶다교과서가 아니니까 어쩌면 당연한 건지도면허를 가지고 있는 의료인들이 읽기에는 깊이가  얕지만 일반인들이 읽기에는 충분히아주 훌륭한 교양서

특히나 후생유전 분야는 최근에 떠오르고 있는 이론인  같은데 중요성이 비해 너무 짧게 설명하고 지나간 느낌

 

 

< 만병의 황제의 역사> 암이라는 특정 질환을 통해 인간이 질병에 대해 어떻게 인식하고 질병의 원인을 어떻게 찾아갔는가를 보여준다

 책은 반대로 일반론 전체를 보여주는 책이다질병이란 유전자의 잘못이 아니라 환경의 변화에 유전자가 적응하지 못한 것이라는 관점을 가지고 있다특히 < 만병의 황제의 역사 최종 결론으로 개개 암의 유전자 특성에 맞춰서  맞춤 치료제가 등장하는 방향으로 암의학이 변화할 것이라고 말하고 있는데  책은 유전자가 질병을 일으키는데 관여하는 원인은 5% 정도 밖에 되지 않는다고 말한다암을 발현시키는 것이 최종적으로는 유전자이라 할지라도 기본적으로는 환경적 요인이   것이라는 주장이다 <질병의 탄생>  < 만병의황제의 역사둘을  이어서 보는것은 상당히 흥미롭다.

 

 

<1 질병은 어떻게 탄생되었나>


[1
 질병의 원인은 두가지 아니 한가지다]
(32) 
유전자와 관련된 연구들이 최근에 활발하게 진행되면서 새로운 사실들이 밝혀지기 시작했다그것은 유전자 변이 만이 아니라 유전자발현을 조절하는 프로그램까지 다음 세대에 전달될  있다는 사실이다유전자 구조의 변화는 없다 하더라도 환경조건에 의해 유전자가나타내는 기능이 변할  있으며 이렇게 변한 기능이 다음 세대로 전달될  있다는 것이다
(33) 
후생유전이란 다음 세대에 전달되어 나타나는 변화가 유전자 코드의 서열 변화 때문에 생기는 것이 아니라 세포 안에서 유전자 발현이 달라지면서 초래되는 현상을 말한다이런 시스템이 존재하는 이유는 유전자를 보호하면서 특정 유전자는 발현되고 다른 유전자들은 발현되지 않게끔 조절하기 위해서다유전자 코드는 같아도 유전자 발현을 조절하는 상태가 서로 다르게 전달되면서 다음 세대에서 기능이나구조에 변화가 초래되는 것이다
따라서 환경과 유전자가 서로 주고 받으면서 인체에 영향을 미치는 방법 중에는 유전자 변이에 기초한 자연선택뿐만 아니라 이렇게 유전자발현을 다르게 함으로써 영향을 주는 후생유전학적 방법 있다
휴생유전학적인 기전  메틸화 방법을 예로 들어보자새로운 환경 노출에 따라 DNA  메틸화 되는 정도가 변할  있는데이렇게 변한메틸화 상태가 안정적으로 유지되어 다음 세대에까지 전달될  있다는 것이다그렇게 되면 같은 유전자를 물려받은 다음 세대 중에 메틸화 상태에 따라서 나타나는 영향이 달라질  있다따라서 후생유전학은 주어진 환경에 보다  적응할  있는 유전자 변이가 선택되어서다음 세대로 전달될 확률이 높다는 자연선택 이론에 중대한 도전장을 내미는 이다
(34) 
사실 같은 유전자라 하더라도 환경에 의해 조절되면서 전혀 다른 표현형으로 나타난다는 것은 이미 인체  조직의 세포 분화를 통해 알려져 있다. (중략 환경적인 영향으로 사람의 유전자 발현에 차이가 나타나고  차이를 내는 유전자 조절 프로그램이 다음 세대로전달될  있다는 것이 최근 여러 연구를 통해 밝혀지고 있다
(35) 
유전자 변이는 무작위적으로 발생된 이후에  중에서 유리한 유전자가 선택되는 자연 선택 과정을 거친다다시 말하면 ★★★환경이 주도하여 유전자 변이를 초래하지는 않는다이에 비해 후생유전학적 변화는 환경에  적응된 획득형질이 유전되는 것이기 때문에 처음부터 환경에 대한 적응성을 갖게 된다하지만 후생 유전학적 변화는 유전자 변이에 비해 안정성이 떨어지는 측면이 있다유전자는 매우안정적인 분자이지만 유전자 발현 조절 프로그램은 그리 안정적이라고   없기 때문이다

그렇다면 질병을 일으키는 요인은 무엇인가?
(39-40) 
많은 연구자들이 만성질환을 일으키는 유전자 변이를 찾으려고 노력을 기울여 왔다그러나  결과는 대부분의 사람들의 예상과달리 만족스럽지 못했다. (중략유전자가 만성질환의 표현형에 미치는 영향은 과거에 생각했던 것보다 매우 미미하다는 것이 보고되고 있다이는 환경을 배제한 상태에서 유전자 변이가 독립적으로 만성질환과 관련되어 있다는 가설을 갖고 유전자의 영향을 평가하려 한다면성공하기 어렵다는 것을 보여주는 것이다

 

[4 유전자 억울한 누명을 쓰다]
(74) 
과거에 수질이 좋지 못해 음용수로 적절한 물을 찾기 어려웠던 지역에서는 포도주  알코올 소비가 높을  밖에 없었고 따라서 알코올을 대사해서 독성이 적은 물질로 만드는 대립유전자의 빈도도 높아져서 알코올에 과민하게 반응하는 사람을 찾기가 어렵다반면에 한국이나 일본과 같이 수질이 좋고 음용수가 풍부했던 지역에서는 알코올이 생존에 영향을  만큼 중요하지 않았다그래서 알코올을 비독성물질로 대사하는 대립유전자의 빈도가 상대적으로 낮아지게 되었으며  결과 오늘날 한국이나 일본 등에서는 알코올에 과민한 사람들을흔히   있게  것이다
(77) 
유전자의 변화는 환경의 변화보다 나중에 일어난다고   있지만 자연 선택의 힘이 강력할 때는 비교적 짧은 기간 예를 들어  천년 정도의 시간 안에 일부 유전자는 환경의 변화에 조응하여 상당한 변화를 초래할  있다
(
중략환경적인 변화에 대한 자연선택의 압력이 상당히 크다면 환경 적응에 유리한 대립유전자가 새롭게 발생되어  인구잡단의 상당수에 이르는  걸리는 시간은   년이면 가능하다. (중략인종 간에 유전적 차이가 있다고 이야기할   차이는 원래부터 갖고 있었던것이 아니다
(80) 유전자 전체를 이용한 관련성 연구의 기본적인 논리는 특정 인구 집단에서 흔한 질환은  집단에 비교적 흔한 유전자 변이의 영향을받을 것이라는 것이다여러 대규모 연구가 흥분과 기대속에서 이루어졌는데 많은 사람들이 예상했던 것과는 달리 대부분의 흔한 유전자변이도  자체가 질병 발생을 일으킬 확률은 적을  아니라 이러한 변이들 전체를 갖고 질병 발생을 설명할  있는 부분 또한 매우 적다는 것이 밝혀졌다예를 들어 만성질환과 연관되어 있는 1200 이상의 유전자 변이를 찾았지만 이러한 변이로 설명할  있는 질병 영향은 고작  퍼센트 밖에 되지 않는 것으 나타났다
(82-3) 
인간의 유전자는 아무런 이유없이 스스로 변화되어  것이 아니며 자연선택의 압력에 의해 환경에  적응된 유전자만이 살아남아오늘날 인간의 유전체를 이루고 있다. (중략 질병이란환경조건이 바뀌었는데 이에 대한 유전자의 적응이 이루어지지 않았을  생기는 것이지유전자 자체에 질병을 일으키는 특성 혹은 프로그램이 있어서 질병을 일으키는 것이라고 보기는 어렵다
인간의 유전자는 오랜 세월에 걸쳐서 인류의 조상이 겪어온 생활환경에 적응하는 과정을 거쳤는데 문제는 과거의 생활환경과 오늘날의 생활환경은 상당히 다르다는 것이다
(84) 
새로운 환경을 만드는  걸리는 시간이 짧아진 현대에는 유전자가 적응을  만큼의 시간적 여유가 없기 떄문에 부적응이 생기고 부적응은 질병으로 나타나게 된다최근에는 여러 의학기술의 발전 등으로 자연선택의 압력이  이상  효력을 발휘하지 못하고 있어서상대적으로 부적응 상태는 자연선택으로 해소될  없다또한 화학물질대기오염식품첨가물들의 물질에 최근에 노출되기 시작했다
(
중략특히 과거와 달리 자연선택의 압력이 크지 않은 현대에는 유전자의 변이에 의해 새로운 환경에 적응하는 데에는 상당히 오랜 시간이필요할  모른다. (중략만일 후생유전학적 변화를 통해 새로운 환경에 적응을 하게 된다면 유전자 변이에 의한 적응보다  빠른시기에적응할 수도 있어서  세대 지나면서 현재의 질병은 줄어드는 양상을 보일지도 모른다


나머지 내용은 http://blog.naver.com/julcho/40208134401

여기서


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
암 : 만병의 황제의 역사
싯다르타 무케르지 지음, 이한음 옮김 / 까치 / 2011년 7월
평점 :
장바구니담기


암이라는 질환이 어떻게 여기까지 왔나 의사학적생물학적정치적 분석이다이 책은 큰 틀에서 보자면 어떻게 암치료와 암치료법 연구가 경험적인 전략에서 기전을 이해하고 특정 기전을 컨트롤하는 단계로 넘어오게 되었는가 하는 과정을 설명하고 있다암이라는 소재를 빌렸지만 결국 현대의학이 질병을 다루는 방식과 치료전략을 어떤 식으로 변화시켰는가에 대한 역사이다그 흐름을 파악하는 것이 암에 대한 세부적 지식을 얻는 것보다 중요하다는 생각이 든다이 책에서 얻을 수 있는 통찰은 바로 그런 것이다

 

그렇다면 이 책을 읽고 가장 먼저 떠올려야 하는 질문은 바로 한의약 임상과 임상연구도 암이 걸어간 전철을 밟을 것인가하는 점이다.

암 연구가 경험적인 치료약의 투약에서 근본 매커니즘으로 방향을 틀면서 좋은 결과를 얻어냈듯이경험의학인 한의학도 인체 생리병리에 기초하여 본초학방제학을 다시 쓰게 될 것인가

무작정 효과있는 처방을 찾아 탐구하기 보다는 매커니즘에 근거하여.효과가 있을 법한 처방을 찾아낼 것인가? .사실 지금도 수많은 자칭 재야고수라 칭하는 임상의들이 하고 있는 일이기도 하다.

 

통계의 역사를 다룬책을 직전에 읽은 다음에 암의 역사를 다룬 책을 접하면서 네이만과 이곤피어슨에 의한 통계의 발전이 근치수술이 국소수술보다 낫지 않다는 것을 입증하기 위한 통계적 방법론을 제공했다는 것을 보면서 참 흥미로웠다서로 맞물려 발전하는 학문들학문의 발전은 그 학문 하나로 뚝 떨어져 이루어지지 않는 다는 것한의학 발전도 통계학영상진단해부학 등의 발전을 토대로 이제 도약의 시기가 온 것이 아닐까 하는 희망섞인 전망이 하나 

그리고 의학공부를 함에 있어서 의사학을 반드시 숙지하고 있어야 한다는 사실을 새삼 인식하게 되었다

 

아마 곧 과학혁명의 구조와 질병의 탄생을 보게 될 텐데 거기서는 또 어떤 흥미로운 사실을 접하게 될까

 

중간에 재미있는 구절이 몇개  있다

 

(67-8) 베살리우스는 아무리 몸을 끈기있게 샅샅이 파헤쳐도 갈레노스의 검은 담즙을 찾아낼 수 없엇다스스로 보는 법을 터득하자 베살리우스는 더이상 갈레노스의 신비주의적 관점을 자신의 관점에 억지로 끼워맞출 수 없었다검은담즙 - 갈레노스가 말한 암과 우울증을 일으키는 스며나오는 체액 - 은 어디에서도 찾을 수 없었다
베살리우스는 자신이 묘한 입장에 서 있다는 것을 알았다그는 갈레노스 학파로 이어지는 전통에 속해 있었다그는 갈레노스의 책들을 연구하고 편집하고 재출간했다그러나 검은 답즙 - 갈레노스 생리학의 보석같은 핵심 - 은 어디에서도 찾을 수 없었다그는 자신의 발견을 애매모호하게 얼버무렸다죄책감으로 그는 오래전에 사망한 갈레노스를 찬미하는 말을 더욱 더 쏟아냈다그러나 뼛속까지 경험주의자였단 그는 자신이 본대로 그림으로써그것을 보고 남들이 스스로 결론을 이끌어 내도록 했다검은 담즙은 결코 없었다베살리우스는 갈레노스의 이론을 구하기 위해서 자신의 해부학 계획을 시작했지만결국 그 이론을 슬그머니 매장해 버렸다
(
중략갈레노스의 보이지 않는 체액망이 존재한다면그것은 종양의 바깥병리학적 세계의 외부정상적인 해부학 탐구의 경계 너머에 있었다즉 의학 너머에 있었다베살리우스와 마찬가지로 베일리도 자신이 본대로 해부구조와 암을 그렸다수세기동안 의사와 환자의 마음을 사로잡았던 종양속의 체액검은 담즙이 흐르는 생생한 통로는 마침내 전면에서 사라졌다 

=> 아마도 한의학 임상연구를 하는 사람들아니 현대 한의학에 대해서 조금이라도 고민해봤던 사람들은 결국은 베살리우스의 길을 따라갈 수 밖에 없을 것이다음양오행으로 대표되는 사변적 한의학 이론을 슬그머니 매장해 버리지 않고서는 출구가 보이지 않을 것이다
갈레노스의 검은 담즙처럼 담음어혈은 우리에게 어떤 의미일까동양의학에서도 시간이 흘러 해부를 하고 인체 내부를 들여다보게 될 기회가 많았다면 기존의 동양의학 질병 개념을 폐기했을까
한의사들은 담음어혈을 실체라고 생각하는가 아니면 단순한 기능적 문제에 대한 개념이라고 보는가담음증 으로 분류되는 사람이 있는 것은 확실하다그것은 진단연구를 통해 밝혀진 바이다하지만 담음증이 존재하고 담음증으로 분류되는 사람들이 있다는 것과 그것이 실제적으로 몸안에 존재하는 물질이라는 것은 다른 차원의 이야기이다
만약 어혈이 혈관에 낀 죽종 같은 것을 의미한다면 지금에 있어서 어혈이란 개념이 있어야 할 이유는 무엇일까혹은 현대과학의 생리병리진단 기술을 받아들여 현대의학에서 점점 더 질환의 개념이 세분화 되듯이 혈관성 어혈부인과적 어혈 등등으로 더 세분화 해야 할까?아니면 현대의학적 동맥경화라 하더라도 어혈증후군이 있고 없고에 따라 병리치료예후가 다르기 때문에 의미를 갖는다고 생각할 수도 있을까?

 

(177) 췌장암과 림프종을 같은 암이라고 부르는 것은 뇌경색뇌출혈간질을 모두 중풍이라는 말로 묶었던 중세의 관습처럼 시대착오적인 느낌을 줄 정도였다

 

=> 예전에 송하섭 선생님이 비슷한 말을 한 적이 있다중풍문에 있는 병이 다 똑같은 병일까라는 질문을 던진 적이 있었는데 적절한 지적이라는 생각이 든다위병에 ALS  AIDP 가 섞여있었겠지만 같은 치료법을 사용할까흔히들 한의사들은 의학은 질병에 따라 다른 치료법을 사용하고 사람간의 차이는 고려하지 않고 한의학은 같은 질환이어도 다른 약을 쓰는 경우도 있고 다른 질환이어도 같은 약을 쓰는 경우도 있다고 한다그런데 그 때 그 같은 질환은 정말 같은 질환이었을까같은 증상을 나타냈다 라는 서술 정도는 이해할 수 있지만 진정 같은 질환이었을까하는 의문이 든다

 

(227) 피셔는 한 글에서 이렇게 썼다. "임상의는 경험이 제아무리 많다고 할지라도 그것을 과학적 타당성의 민감한 지표로 삼을 수는 없다는 것을 받아들여야 한다그는 신성한 지혜라면 기꺼이 믿었겠지만홀스테드의 것은 신성한 지혜가 아니었다그는 한 기자에게 퉁명스럽게 말했다 "신이라면 그냥 믿겠지만 그 밖의 모든 것은 자료가 있어야 합니다"

 

=> 이 또한 한의사들이 항상 명심해야 할 구절거의 종교적 믿음에 가까웠던 근치수술에 대한 믿음에 서양의학계가 몇십년에 걸쳐 겨우 그것이 잘못된 것임을 알아차렸다한의사들은 경전에 대한 종교적 믿음을 타파하는데 역시 몇십년이 걸려야 하나아쉽게도 우리에겐 허비할 몇 십년이 남아 있지 않은 듯하다자기가 많은 사람을 치료했다면서 그것을 가지고 자신의 주장이 타당하다고 근거를 삼는 경우가 있는데 홀스테드의 근치절제술 몇십년의 역사는 경험이 과학적 타당성을 담보하지 않는다는 것을 보여준다 

 

나를 가장 슬프게 했던 구절은 "웃음짓는 종양학자는 환자가 토하는지 여부조차 알지 못한다"

최근에 내가 병원에 입원을 하면서 느꼈던 것이 그것이다그때 그 의사는 날 생명력이 충만한 30대 남성으로 보지 않았다덩어리치료해야 할 질환없애야 할 조직으로 봤을 뿐이다그의 관심은 진단과 치료에 있었지 그 이후에 내가 겪어야 할 후유증과 절망감과 불편함과 예후에 대해선 관심이 없다하지만 내가 정말 궁금하건 후유증과 예후삶의 질이었다그래서 이 구절이 머리가 아니라 피부에서 이해가 된다

 

나머지는 여기서 확인

http://blog.naver.com/julcho/40207778666



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
신약개발에 필요한 의학통계학 - 임상시험 통계분석, 2판
강승호 지음 / 자유아카데미 / 2013년 2월
평점 :
구판절판


결국 이책은 bias  어떻게 최소하 하느냐를 위한 

 

임상연구에 있어서  많은 행정적이론적 내용은 결국 어떻게 bias  줄여서 신뢰할  있는 자료를 얻어서 유효성을 보고하고 피험자의안전성을 확보할  있느냐 라는 관점 가지고 공부해 나가면  편하지 않을까.  

 

특히 기억에 남는 구절 하나가 "무작위배정이란 매우 간단한 개념이라 많은 사람들이  중요성을 간과하지만무작위배정이야말로 임상시험  과학적으로 타당한 결과를 이끌어 내게 해주는 대단히 중요한 도구인 것이다

 

[1 신약개발과 임상시험에 대한 개요

 

(12) 먼저 계획을 세우지 않고 대충 자료를 얻은  온갖 가설과 모형을 적합시켜 보는 일은 모두 잘못된 것인가?

이런 분석을 단지 탐색적 결과로만 해석한다면 잘못되었다고 보기 어렵다 결과에 확증적 의미를 부여하지 않는다는 뜻이다

 

 (13-4) Statistical Analysis Plan (SAP)  Blind Review
예를 들어 원래는 t검정을 하려고 했는데 정규성이 가정이 적절하지 않아서 윌콕슨 순위합 검정을 하는게 적절하다고 판단되면 어떻게 해야 하나?

맹검을 해제하기 전에 SAP 확정해야 한다. SAP 임상시험계획서에  내용보다   자세한 통계적 내용을 기술하도록 되어 있다

Blind Review  맹검을 해제하기 전에 치료제를 표시하는 변수가 아예 없는 상태의 자료를 검토하는 것이다. (왜냐하면 A,B 등으로 표시하면 약효나 부작용으로 추정가능

SAP Blind review  자료를  모으고 통계분석 방법을 수정할 마지막 기회 준다 . 최종 수정된 SAP 명시된 통계방법으로 분석된결과만 확증적 결과로 인증받고 나머지는 탐색적결과나 민감도 분석 정도로만 이용

 

 (16) 나중에  나은 통계방법을 알았다면 변경이 가능한가?

 나은 통계방법을 알게  시점이 핵심적인 요소

맹검 해제전 :  가능 / 맹검 해제 후에는 원칙적으로 불가심사기관이 판단생동성 시험의 추가시험의 경우에는 허락해준다. Blind review에서 SAP 철저히 검토할 

 

 (18) 통계분석에 관련된 최종책임은 통계전문가에게 있다 

 (20) Crossover design 

복제약 허가시의 생동성 시험에 많이 사용

장점 : 자신이 대조군이라서 효율적으로 치료제 효과 차이를   있고 검정력이 커져서 표본크기를 줄일  있다

단점 : 잔류효과  /  질병이 만성적이고 안정적이어야 한다 /  치료제에서 결측치가 발생하면 분석 복잡

 

 (20) Factorial Design

복합제 개발을 위한 임상시험에 많이 사용

치료제 A  B 교호작용(Interaction) 조사 가능

교호작용이 없으면 평행설계(parallel)보다 절반의 표본크기 가능 

 

 (22-3) 임상적 유의성과 risk - benefit analysis(위험/편익 분석)

임상적 유의성은 시험약의 약효의 크기를 평가하는데 통계학적으로는 약효의 크기에 대한 점추정치와 95% CI 구하게 된다 

임상적 유의성이 특정 약효에 대한 개념이라면 위험편익분석은    개념특정 피험자에게  약이 사용되어서는 안되며일부에서는용량을 조절해야 하는지 등에 대해 고려한다전혀 수량적이지 않고 주관적인 판단을 하게 된다

 

 (25) 우위성 검정(superiority test)

 (26) 동등성 검정 (Equivalence test)

생동성 시험에서는 90% 신뢰구간 사용된다 

 

 (26) 비열등성 검정(non - inferiority test)

주평가 변수는 대조약과 비슷하지만 독성이 덜하거나 싸거나 순응도가 높거나 하는 장점이 있는 약물에 대한 연구

하지만 비열등성 검정을 하는 가장 중요한 이유는 ★★★ 심시기관으로부터 시험약의 시판허가를 위해 실시하는 경우다과거 다른 임상시험을 통해 이미 약효가 증명된 활성대조약이 있고 위약을 쓰는 것은 윤리적으로 허용이 안되는 경우이미 위약보다 효과가 우월함이 입증된 활성대조약에 비해 신약이 효과가 열등하지 않음을 입증해서 시험약과 가상의 위약을 간접적으로 비교하여시험약이 가상의 위약보다약효가 우월함을 보이고자 하는 

 

만약 단측 신뢰구간을 사용한다면 97.5% 신뢰구간을 사용해야 한다.

 

  (30) 신약의 범위

새로운 적응증 / 새로운 제형 / 복합제 /새로운 용법새로운 용량새로운 인구집단

으로 indication  늘린 경우도 해당 (이런 경우에는 자료제출의약품에 해당)  

 

 (31)  이렇게 통계분석 방법이 복잡한가?

위약이 아닌 활성대조군 - 비열등성 시험 

결측치 분석방법

질병의 성격에 따라 : 항암제는 활성대조군을 쓰며 위약효과가 거의 없다 / 우울증은 신약활성대조약위약 이렇게 3군으로 설계 / 천식 -교차설계 / 복합제 - 요인설계

 검정력이 높은 통계방법 사용 ( 피험자수가 줄어서 시간과 비용을 절약) : 공분산분석을 통해 검정력을 높인다 

다중검정 - Bonferroni 방법을 사용하면  해결이 되지만  높은 검정력을 위해서 집단 축차디자인이나 adaptive design  존재 

주평가변수가 연속형(공분산), 이분형(로지스틱회귀) , 생존기간(생존분석 다양하기 때문 

 

 (33) 심사기관의 첫번재 목표는  1 오류를 유의수준 이하로 통제하는 


심사기관에는 1종오류가 중요한 문제

검정력이 낮은 것은 제약회사에게 치명적이지만 검정력이 낮은 연구를 시행하는 것은 사회적으로 손실이긴 하다

 


나머지는 내 블로그에서 확인

http://blog.naver.com/julcho/40207295594




댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
통계학의 피카소는 누구일까 - 20세기 과학혁명을 이끈 통계학 영웅들의 이야기
데이비드 살스버그 지음, 박중양 옮김 / 자유아카데미 / 2011년 2월
평점 :
품절


http://blog.naver.com/julcho/40206339251


수학 과학에는 딱히 흥미가 없고 고등학교 가서는 절대로 카이스트에는 가지 않겠어 라고 결심하고 한의대에 들어와서 수학과 과학과는 완전히 이별했다고 쾌재를 불렀었던  내가 십여년이 지나서 통계학의 피카소는 누구인가 같은 책을 읽고 피셔에게 찬란한 경외와 깊은 열패감을 느끼고 있다니 ...10년전에는 상상하지 못했던 풍경.  

 

 통계를 배우면 처음에는 어떤 경우에 무슨 통계법을 써야 하는지 혹은 SPSS  어떻게 써야 하는지에만 관심을가지다가 조금씩 수식이 나온 복잡한 책들을 기웃거리게 된다하지만 정작 통계학자들이 무슨 생각을 가지고 이런 통계분석법을 만들어냈는지   있는 책은 없었다두꺼운 통계학  몇권은 보고 나서야 던지게 되었을 근본적인 질문들 이런 통계법이 생겼을까이런 통계분석 방법은 만들지 않을  없게 했던 문제점은 뭐가 있었을까그리고그건 어떻게 해결되었을까 하는 질문들에 대해  책은 작가가 통계학의 발전사를 처음부터 훑으면서  질문을 제기하고 해답을 찾아간 과정을 보여준다.그래서 이책을  읽고 나니 통계책들에 쓰여져 있는 분석 방법이 너무나 감사하고 친근하게 느껴진달까마치 한글이 있다는 것에 감사하고 한글을 만든세종대왕에게 감사하듯이?

 

특히나 이책은 한의사들은  한번은 읽어봐야 하는 책이 아닐까 싶다통계혁명이 일어나서 가설 검정과 같이 요즘들어 보고 있는 통계책들에 쓰여진 기본개념이 개발된지 이제 100여년그것은 갈릴레이의 지동설처럼 연구에 있어서의 통계'혁명이었던  같다.  지금에 와서야 너무나 당연한 개념들이지만   당시에는 진실에 접근하기 위한 새로운 길들이 열렸던 것이다

역자후기에도 그런 말이 나온다 "통계혁명으로 인한 세계관의 변화와 과학의 발전은 ...(중략나는 독자들이 통계혁명과 동반된 세계관의 변화를 이해하고이것이 독자의 세계관과 연결되기를 기대한다. "

 

 전에는 아무리 한의사들이 객관적으로 치료 효과를 검증하려고해도 가설 검증이라는 개념이 없었기 때문에 고전적의 의서의 형태 지금으로써는 케이스 시리즈의 형태 외에는 방법이 없었다의학에서 통계혁명의 수혜를 누렸듯이 한의학에서도 이제는  이상 미룰  없는 때가 오고 있다. '

중간에 토머스 쿤의 <과학혁명의 구조내용을 정리한 구절이 있다. (308) '쿤은 저서에서 현실은 너무 복잡하기 때문에 하나의 체계적인 과학적 모형으로 표현할  없다고 주장했다 과학은 현재 가지고 있는 자료를  설명하고 미래를 예측하는데 유용한 모형을 만들어  뿐이다어떤 모형도 완벽하지 않으며새로운 자료를 수집하는 순간 기존모형을 수정할 준비를 해야 한다예외적 상황을 고려하기 위해 직관적으로도 어색하게 기존모형을 확장함에 따라 기존모형은 계속 복잡해지고  유용성을 잃게 된다이때 독창적인 사고를 가진 사람들이 완전히 다른 새로운 모형을 제시하게 되는데  새로운 모형이 과학혁명이라는 것이다. ' 라는 내용이다

음양오행으로 대표되는 한의학에서의 패러다임이 송대 교정의서국 이후 형이상학적인 이론에 매몰되면서 실제적 치료효과보다 사변적으로 변화하게 되었고시간이 지나면서 점점 복잡해지고 유용성을 잃게 된것이 아닌가 싶다최근까지는 음양오행이 한의학을 관통하는 절대적인 패러다임이라 믿어 의심치 않았던 것에 비해 90년대 후반 학번의 한의사들에게는 그것이 의심의 대상이 되고 납득하기 어려운 패러다임이 된다 이후 세대의 한의사들은 점점 현대한의학으로의 패러다임을 전환하고 있다.

그리고   패러다임의 전환을 기존의 임상의들은 자신에 대한 공격으로 받아들인다입증할수도 없고 서로 절대로 양보하지도 않을 음양오행이 옳고 그르고에 대한 논쟁을 벌이는 것보다 이전의 세대에게 통계혁명으로 인한 세계관의 변화를 이해시킨다면 나와 나의 스승이 치료했던 결과가 의학적 결과의 전부가 아님을 받아들이게 되지 않을까이전세대와 이후세대의 소통은 통계혁명으로 인한 세계관의 변화에 대해 이해하는 것에서부터 시작하지 않을까이제는 통계혁명의 과실을 받아들여 무엇이 되고무엇이 안되는지 바닥부터 다시 확인해 나가야  "한의학혁명 일어날 시간이 아닐까?

 하는 생각이 들게 하던 책이다.  

 

 피어슨이 피셔의 논문들을 보고 했던 행동들도  공감이 갔던 부분이다이해할  조차 없는 천재가 나타나서 지금까지 자기가 이룬 모든 것들이

보잘 것없는 발자취가 될것에 대한 두려움에 어떻게든 그를 깎아내리고자신의 저널에 논문을 게재해주지 않고 , 게재해주더라도 자신의 논문에 부록같은 보잘것 없는 발견으로 보이게 하는 행동들에서 거대한 천재 앞에서 그가 느꼈을 두려움과 열패감이 이해가 된다

(65) 피셔는 5년간 로뎀스테드의 통계부서를 눈부시게 발전시켰으며예이츠 같은 공동연구자들을 채용했다예이츠는 피셔의 도움을 받아 통계분석의이론과 응용 모두에서 뛰어난 업적을 남기게 된다예외가 없는 것은 아니지만  피어슨의 대부분의 제자들은 그저 그렇게 있다가 사라졌다골튼 생물통계연구소에서 연구한 그들은 단지  피어슨의 연장선상에 불과했기 때문이다하지만 대부분의 피셔의 제자들은 피겨의 격려속에서 독자적인 자신의 길을 개척했다

하지만  피셔가 나중에 네이만에게 똑같은 짓을 하는건 아이러니

 

 

 책의 마지막은 이렇다 1947 피셔의 BBC 강의이다.

 

"과학연구는 어떤 면에서 독특합니다과학연구의 목적은 자연에 대한 지식을 증진하는데 있습니다하지만 이런 지식의 증진이 요령 있게 일어나는 것이아니기 때문에 감정적으로 상처를 입기도 합니다왜냐하면 지금까지 옳다고 생각했던 것들이  이상 유효하지 않게 되거나 심지어 틀린 것이 되는 것을피할수 없기 때문입니다내가 생각하기에 대부분의 사람들은 이를  알고 있으며십년 이상 가르쳐  것을 수정하는 것도 감수합니다하지만 어떤 사람들은 이런 것을 자존심에 상처를 입히거나 자신들의 영역을 침범하는 것으로 받아들이고자신의 영역을 침범당한 울새나 되새처럼 강하게 반발해야 한다고 생각합니다하지만 그래보았다  뾰족한 수는 없습니다왜냐하면 과학연구의 본질이 본래 그런 것이기 떄문입니다젊은 과학자들은 명심하십시오인류의 번영에 도움이 되는 것을 제시하더라도 누군가가 자신을 매도할 것이라는 것을 " 

 

마지막 장을 읽고 나서 부끄럽게도 이미 한참 전에 읽었어야 할 책 <과학혁명의 구조> 주문했다그리고 이제  생명과학 연구를 위한 통계적 방법을 읽을 때가 왔다

 

[2 기운분포]

(35)  피어슨이 일으킨 혁명에서 지금까지 남아있는 것은 과학연구의 대상은 관찰하는 실체가 아니고 관찰결과의 분포라는 아이디어다

오늘날 의학자들은 어떤 의학적 치료가 생존율에 미치는 영향을 알아보기 위해 분포를 포함하는 수학적 모형을 사용한다양자역학을 연구하는 물리학자들은 입자를 분포로 나타내고 있다과학의 어떤 분야도  혁명을 비켜가지 못했다확률분포를 사용하는 것은 임시방편이며 종국에는 19세기적 결정론적 세계관으로 돌아갈 것이라고 주장하는 과학자가 없는 것은 아니다신은 우주를 관장하기 위해 주사위를 던지지 않는다는 아이슈타인의 유명한 말은 이런 시각을 보여주는 한가지 예이다하지만 대부분의 사람들은 임의성이 자연의 본질이며 유일한 실체는 분포라고 믿고 있다근본 철학이 무엇이든 분포와 모수에 관한 피어슨의 혁명적 아이디어는 20세기 과학을 지배하게 되었고 21세기에 접어든 지금도 여전히 그러하다는 것은 부정할  없는 사실이다

 

[3 친애하는 고셋선생]

student t-test 에서의 student  가명이라는 이야기는 익히 들어 알고 있었지만 student  유래에 대해서   있었음

고셋이라는 수학자이자 화학자가 기네스 맥주 회사에 취직했고 표본으로 채취한 배양약에  효모의 수가 포아송 분포를 따른다는 것을 알아냈지만 회사방침상 회사기밀에 대한 논문을 투고하는 것이 금지되어 있어서 [바이오메트리카] student 라는 익명으로 투고하게 되었다

 

(42-3) 자료가 나온  분포의 평균과 표준편차가 무엇이든 (심지어 정규분포 하지 않더라도)  평균과 표준편차의 추정값의 비가 특정한 분포 ( t-분포) 한다는 사실을 발견했다

이것을 student t 분포인데  발견이 없었다면 통계분석은 무한히 반복되었을 것이다이것은  통계분석이  단계로 종료한다는 위대한 발견

 

[7 피셔의 승리]

(79-81) 피어슨은 분포를 그가 분석하고자 하는 실제자료를 나타내는 것이라고 생각했다하지만 피셔는 분포는 추상적인 수식이며 자료는  분포의 모수를 추정하기 위해 사용될 뿐이라고 생각했다피셔의 관점에 따르면 모든 추정값은 오류를 가질 수밖에 없다따라서 피셔는  오류를 최소화하여 참값에 가까운 추정값을 구하는 방법을 개발해야 했다. 1930년대에는 피셔적 관점이  논란에서 이기는 듯했지만, 1970년대가 되면서 피어슨적 관점이 부활하게 된다.  (중략이글을 쓰는 현재 통계학계는 이문제로 분열되어 있다피어슨적 관점에 내재된 혼란의 잔재를 제거한 것은 피셔의 명확한 수학적 관점이었다

 

피어슨은 측정값의 분포를 실체라고 생각했다그의 연구에는 항상 규모가 크긴 하지만 유한한 자료의 전체집합이 상정된다가능하다면 과학자들은 전체집합에 속하는 모든 자료를 모아서 분포의 모수를 계산한다만약 모든 자료를  수집할  없다면 전체집합을  대표하는 크기가  표본자료를 수집한다전체집합을  대표하는 대규모의 표본자료에서 계산한 모수는 전체집합에서 계산한 모수와 일치할 것이다그리고 전체자료에서 모수를 계산하는 방법과 같은 방법으로 표본자료에서 계산하면 오차가 거의 없을것이라는 것이  피어슨의 관점이다

 

피셔는 수집된 측정값은 모든 가능한 측정값의 집합에서 임의로 추출한 것이라고 생각했다따라서 임의로 추출한 자료에서 계산한 모수의 추정값도 임의성을 가지며 확률분포를 가진다모수와 추정값을 구별하기 위해 피셔는 추정값을 통계량이라 불렀다현대 통계학에서는 추정량이라 부른다예를 들어학생들이 얼마나 많은 지식을 쌓았는지(모수) 판단하기 위해 여러번 시험을 치르고 (측정),  시험점수의 평균(통계량) 계산하는 경우를 생각해보자. (중략통계량이 임의성을 가지기 때문에 통계량의  하나가 얼마나 정확한가를 판단하는 것은 무의미하다이것은  한번 측정해서  측정이 얼마나 정확한지 판단할  없는 것과 마찬가지다대신 통계량의 분포에 기반을  기준이 필요하다이는 집단을 구성하는 개개측정값이 아니라 측정값의 분포로집단을 평가해야 한다는  피어슨의 생각과 다르지 않다

 

(80) 피셔가 제시한 좋은 통계량이 갖춰야  조건

일치성 - 자료를 많이 수집하면 할수록 통계량이 모수에 가까워질 확률이  커진다

비편향성 - 여러 표본자료에서 구한 통계량의 값의 평균을 구하면 모수와 가깝다

효율성 - 통계량의 값들이 모수와 일치하지는 않지만 여러번 계산한 통계량의 값을 전체적으로 보면 모수와 많이 다르지 않다

 

(82) 최대가능도 추정량

피셔는 피어슨이 모수를 추정하기 위해 사용한 통계량이 일치성이 결여되거나 편향된 경우가 있고 그보다  효율적인 통계량이 존재한다는 것을 알게 되었다편향성을 보장하지는 않지만 일치성과 효율성을 만족하는 통계량으로 피셔는 최대가능도추정량을 제안

피셔는 정칙조건을 만족하기만 하면최대가능도 추정량은 항상 일치성 기준을 만족할  아니라 가장 효율적이라는 것을 증명 

최대가능도추정량이 편향을 가지면 편향의 정도를 계산할  있을  아니라 편향이 없도록 최대가능도추정량을 수정할수 있다는 것도 증명

 

 결과 세가지 기준을 모두 만족하는 추정량을 얻을수 있게 되었고 짧은 시간에 가장 중요한 모수추정법 되었다

 

하지만 최대가능도추정량을 구하기 위해 풀어야할 수학적 문제가 만만치 않았으며 (중략) 피셔가 분산분석과 공분산분석을 위해 개발한 알고리즘은 정말놀라운 수학적 성과

 

 와중에 등장한 컴퓨터는 "반복 알고리즘으로 쉽게 최대가능도 추정량을 구할수 있게 했다

 

[8 치사량]

블리스의 프로빗 분석 - 가장 중요한 모수는 LD50. 50% 정도가 사망하는 용량

불확실성을 추가하여 파라켈수스의 원리(무엇이든 용량에 따라 독이  수도 아닐 수도 있다) 구현한 최초의 통계모형  

 

[9 종모양곡선]

(98-99) 중심극한정리 - 자료가 어디에서 나왔든지 평균의 분포가 정규분포로 근사된다는 정규분포는 라플라스의 오차함수와 동일한 분포인데 때로는 가우스 분포라고 불린다. 18세기 후반 드무아브르가 도박에서 수집한 자료에 중심국한정리가 성립한다는 것을 증명한 이후 150년간 진척이 없었다

1930년대 초만해도 증명된 것이 아니었지만 누구도 의심하지 않는 그런 

정규분포는 칼피어슨의 네개의 모수 중에 평균과 표준편차를 모수로 갖고 대칭도와 첨도를 나타내는 모수는 0이다

평균과 표준편차만 알면 정규분포의 모든 것을 알게 되는 

피셔는 자료에서 구한 평균과 표준편차가 모수 평균과 표준편차의 추정값이며 충분성을 갖추고 있다는 것을 증명했다

이는  자료가 모수에 관해 가지고 있는 모든 정보를   추정값이 가지고 있으므로 자료에 관해서   추정값을 구하고 나면 자료를  이상 보관하지 않아도 된다는 것을 의미한다그리고   평균과 표준편차  모수를 정밀하게 추정할 정도의 자료만 수집하면  이상의 자료를 수집할 필요도 없다 것이다예를 들어 정규분포의  모수를 소수점 아래 두자리까지 정밀하게 추정하고자 한다면  50 정도의 자료만 수집하면 된다

 

(103) 1934 정규분포를 사용하려면 통계량이 린드버그 - 레비 조건을 만족해야 한다는 것을 밝혀내었고 1948 호에프딩은 다시 그것이 U-통계량인지만 확인하면 되는 것을 밝혀내었다 호에프딩의 조건을 만족하는지 확인하는 것은 어렵지 않다.

(107) 운용연구 - 화이자에 근무할 때도 나는 약학 연구방법을 개선하고 신약의 효능을 검증하는 여러 프로젝트에 참여했다이런 프로젝트에서 무엇보다필요한 것은 조건이 만족되는지를 보고 정규분포를 사용하는 이었다.  

 

[10 적합도검증]

(110) 통계혁명이 일어나기 전에는 과학혁명이 연구하는 실체는 수집된 자료나  자료를 생성한 물리적 사건이라고 생각했다. 통계혁명으로 인해 자료의 분포와  모수가 과학연구의 대상이 되었다정밀한 측정이 가능해지면 연구대상인 물리적 실체를    이해할  있게  것이라는 것이 결정론적관점이다하지만 통계적 관점에서 모수는 반드시 어떤 물리적 실체에 대응할 필요가 없으며 아무리 정밀한 측정도구를 사용하더라도 모수의 측정에는 오차가 동반될 수밖에 없다.  

예를 들어 결정론적 관점에서 물체가 낙하할때 중력상수라는 고정된 값이 개입하지만통계적 관점에서 중력상수는 상수가 아니다중력상수는 측정시마다 다른 값이 얻어지며  다른 값들의 분포가 바로 지상으로 낙하하는 물체를 이해하기 위해 필요한 것이다

(112) 혼돈이론을 이런식으로 응용한다면 곧바로 혼돈이론의 약점이 드러나고 만다실제 자료에서 나온 패턴과 자신들이 찾았다는 방정식에서 나온 패턴이 얼마나  들어맞는지 평가할 측도가 없기 떄문이다그들이  것이라곤 독자들에게  그래프를 보여준  뿐이다통계분석에서 시각적 비교가 틀리기 쉽다는 것은  알려진 사실이다

(112-3) 카이제곱검정 -  피어슨의 적합도 검정

자료에서 관찰된 것과 이론에서 예측된 것을 비교하여 적합도를 검증할  있는 통계량. 가설검증이라는 분야에서 선구적인 연구이다가설 검증은 과학자가 실세계에 대한 서로 다른 두개의 수학적 모형을 염두에   있게 해주며자료를 바탕으로   하나를 기각할  있게 해준다

기운분포의 일부분인 카이군에 속해서 그리스문자 카이를 이름으로 사용했으며 카이군에 속하는 분포를 하는 변수를 제곱한 것과 비슷한 특성을 가져서카이제곱이란 이름을 붙임

카이제곱 통계량의 분포는  개의 모수를 가지고 있는데  모수를 피셔는 자유도라고 부름

(114) 중요한 것은   가설검정은 가설을 기각하는 도구라는 가설검증은 가설을 받아들이기 위한 것이 아니다따라서 가설과 관련된 확률이 크게 나왔다고 하더라도  가설을 옳다고  수는 없다

(114-6) 유의성의 의미

유의적이라는 단어는 19세기 후반에 사용된 영어로 본래 "계산결과가 뭔가 의미 있는 것을 보여준다라는 뜻이었지만 20세기에 접어들면서 "매우 중요하다라는 새로운 의미를 갖게 되었다요즘 통계분석에는 현재적 의미의 유의하다라는 용어를 사용하는 경우가 많다

 

20번에 한번 정도 우연히 일어나는 결과를 유의적이라고 하는 것이 통상적인 관례다  그렇다고 실험을 20 할때마다 한번은 현혹당하겠다는 것을의미하지는 않는다유의성 검정은 어느 것을 무시할 것인가를 알려준다. 말하자면 유의적 결과가 나오지 않은 시험은 무시해도 좋다 것이다연구자는유의적인 실험결과가 나오도록 실험을 설계할  있을 때만 자기가 보여주고자 하는 것을 실험으로 보여주었다고 주장할  있다   따라서 유의적인결과라 하더라도 같은 결과가 다시 나오도록   없다면 이결과는  연구해야 하는 미결상태 것이다

피셔가 생각하는 유의성 검정의 핵심은 특정처리의 효과를 규명하기 위해 한번이 아니라 일련의 실험을 실시할  의미를 가진다는 것이 피셔의 견해 

피셔는 P 값이 아주 작으면 보통 0.01 보다 작으면 효과가 드러났다는 결론을, P값이 크면 (보통 0.2보다 크면효과가 있더라도 이정도 규모의 실험으로는 발견할  없을정도로 효과가 작다고 결론을 내린다만약 P 값이  중간이면 다음 실험을 어떻게 하면 효과를    알아낼수 있을까에 대해 생각한다

 

[11 가설검증

(124) 단지 가설이 자료와 배치되지 않는다고 해서  가설이 사실임을 증명했다고 하는 것은 과학적 논리로 보나 통계적 논리로 보나 분명한 논리적 오류다유의성 검증은 가설이 자료와 배치될   가설을 기각할 수는 있지만 가설이 옳다는 것을 확인할 수는 없다이런 사실을 이해한다면 유의성 검증을제대로 보는 이다

 

자료는 정규분포를 따르는가?

(125)   피어슨은 때때로 자료가 특정 분포를 따른다는 것을 증명하기 위해서 카이제곱적합도 검증을 사용했다피셔는  방법을 그대로 받아들이지 않았다 (중략어떤 모수를 추정해야 할지 그리고  모수가 과학적 문제와 어떤 관계를 가지고 있는지 알기 위해서는 자료에 특정 분포가  적합된다는 가정이 필요하기 때문이다이런 경우 통계학자들은 유의성 검증을 사용하고픈 유혹 느끼게 된다

(125) 가설 검증과 관련한 네이만의 가장큰 업적은 적어도 두개의 가설이 있어야만 유의성 검증이 의미를 가진다 것을 발견한 것이다자료에 정규분포가 적합한지 검증하기 위해서는 자료에 적합할 것이라고 생각되는 다른 분포가 있어야 한다는 것이다

 

# (126) p-value  검증력

값은 귀무가설을 검증하기 위해 계산하지만 검증력은 대립가설이 참일  p값이 어떻게 되는가를 나타낸다

네이만은 두가지 결론을 내리게 된다

1)  검증법의 검증력은  검증법이 얼마나 좋은가에 대한 측도이며 검증력이  검증법이  좋은 검증법이라는 것이다

2) 대립가설이 너무  집합이면 안된다는 것이다예를 들어 자료가 정규분포에서 나왔는지귀무가설아니면 정규분포가 아닌 분포에서 나왔는지(대립가설검증하기는 쉽지 않다왜냐면 대립가설에 해당하는 가설들이 너무 많아서  모든 가설에 대해 높은 검증력을 보이는 검증법이 존재하기 어렵기 때문이다

 

확률의 빈도론적 정의

(129) 네이만이 허수아비 귀무가설을 검증하기 위해서는  정의된 대립가설을 설정해야 한다는 것을 발견한 것이다

피셔는 가설검증에 대한 네이만의 관점을 제대로 이해하지 못했다그는 유의수준에만 관심을 가졌고 훨씬 중요한 검증력과 대립가설이라는 개념을 간과하고 말았다

(130) 네이만은  자신의 가설검증법이 과학연구에 고정관념처럼 자리잡는데 전혀 관여하지 않았다. 1935 프랑스수학회보에 최적 가설검증법을 찾지못할지도 모른다는 회의적인 시각을 토로했으며   발표된 논문에서는 가설검증을 거의 사용하지 않았다 

네이만과 이곤 피어슨이 정립한 가설검정법의 철학을 받아들이고 발전시킨 사람들은 다른 사람들이었다왈트는 통계적 의사결정이라는 분야를 개척했고레만은 검증법을 평가하는 새로운 기준을 소개했으며 1959 가설검증을 집대성한 훌륭한 책을 출판했다 책은 네이만과 이곤 피어슨이 정립한 거설검증법에 관한 최고의 책으로 평가받고 있다

 

[12 신뢰수준이란 속임수]

(139-140) 신뢰구간과 관련된 확률의 의미는 무엇인가?

네이만은 후속논문에서 신뢰구간은 계산된 하나하나의 신뢰구간이 아니라 이들을 구하는 하나의 과정으로 보아야 한다고 말했다.

95% 신뢰구간을 정기적으로 계속해서 구하면 계산한 신뢰구간의 95% 모수를 포함할 이라는 것이다.

네이만의 설명에 따르면 신뢰구간과 관련한 확률은  신뢰구간이 옳을 확률이 아니라 신뢰구간을 장기적으로 많이 구할  옳은 결과를 얻게되는 빈도인것이다구간추정이 얼마나 정확하냐 하는 것과도 전혀 상관이 없다.

(중략과학연구에 신뢰구간이 널리사용되면서 잘못된 생각을 갖는 사람들이 많아졌다. 95% 신뢰구간을 구하고서는  구간 내에 모수가 있을 것이라는것을 95% 확신한다고 말하는 사람들이다.  

 

[13 베이즈 정리에 기반을  이단적 통계학]

(144-5) 베이즈가 발견한 것은 후사건이 일어났다는 조건하에서 전사건의 확률을 계산하는 수식이었다시간에 따른 발생순서를 보면 전혀 이치에 닿지않는다 환자에게서 폐암이 발생했을   환자가 흡연자였을 확률을 계산하는 것과 같다베이즈는  수식을 별로 중요하게 생각하지 않았다

(중략라이증후군과 같이 희귀한 질병의 원인을 규명하고자   대부분의 경우 환자 - 대조군 연구를 한다대조군에 속하는 환자에게서 질병이 발생할 (번역에 문제가 있는 ?)  환자가 어떤 조건에 있었을 확률이나 어떤 처리를 받았을 확률을 계산하는 것이다흡연이 심장병과 폐암에 영향을 끼친다는 것도 이와같은 방법으로 알아낸 것이다탈리도마이드가 기형아 출산에 영향을 준다는 것도 환자 - 대조군 연구를 통해서 알아낸 것이다

 

베이즈 정리는 후사건을 조건으로 전사건의 확률을 계산할 때보다 모수를 추정할   중요한 역할을 한다분포의 모수가 고정된 값이 아니고 임의성을내포하고 있다고 보는 시각도 있다이런 시각하에서는 모수와 관련한 확률을 계산해야 한다예를 들어 두가지 암치료법을 비교해서 A치료법 5 생존률이 B치료법 5 생존률보다  크다는 것을 95% 확신한다고 말하고 싶을  베이즈 정리를 적용할  있다

 

[14 수학의 모차르트]

(160) 콜모고로프 - 당시 통계학자들은 통계적방법을 적용하기 위해 모든 자료가 독립이라고 가정하고 있었다하지만 대부분의 자료는 그렇지 않다시간에 걸쳐 측정함으로써 이전 자료와 연관을 갖는 그런 자료를 확률과정이라 불렀다콜모고로프의 빛나는 연구 덕분에 시간에 걸쳐 수집한 자료를 분석할 있게  것이다사람들은 확률과정을 이용해 캘리포니아 해변에 부서지는 파도로부터 인도양에서 발생한 태풍의 위치를 찾으려 시도했다지진계에기록된 지진파가 지진에 의한 것인지 지하핵실험에 의한 것인지 식별할  있게 되었다오늘날의 공학계 학술지는 콜모고로프의 확률과정 연구에서 기원한 여러방법을 이용한 논문으로 가득하다 

 

# (161) 실세계에서 확률은 무엇인가?

 문제가 해결되지 않으면 과학연구를 위한 모든 통계적 방법은 자체의 비일관성으로 인해 무너질지도 모른다.  

확률이 실세계에서 갖는 의미를 찾는 것은 매우 중요한 문제이다왜냐하면 통계분석결과의 해석이 확률에 의존하기 때문이다

(162) 예를 들어 새로운 에이즈 치료제의 효과를 알아보기 위한 임상시험에서 기존 치료제와  치료제의 효과 차이가 유의적이라는 결과가 나왔다고 하자 결과는  치료제가 다른 환자에게도 효과가 있을 것임을 의료계가 확신할  있게 해주는가아니면 일정부분의 환자에서만  치료제의 효과가나타날 것이라는 것을 뜻하는가아니면 실험 대상이었던 환자들에게만  치료제의 효과가 나타났다는 것을 의미하는가?

 

 

[16 모수없애기]
(178) 윌콕슨은 t-통계량과 분산분석공식 들을 검토한 결과 이상값들이 결과에  영향을 준다는 것을 알아냈다이상값이 있으면 통계량의 값이 작아지는 것이었다. (일반적으로 통계량의 값이   작은 유의확률이 얻어진다 ) 이럴때면 이상값을  나머지 자료로만 검증하고 싶은 유혹 느꼈다하지만이상값을 빼고 검증하는 것은 가설검정에 새로운 문제를 제기할 것이다 관찰값이 이상값이라는 것은 어떻게 판단할  있는가? 이상값을 제거했을 때도 기존 확률분포표를 이용해서 유의확률을 계산할  있는가?
(180) 윌콕슨과  - 휘트니 검증은 밀접하게 연관되어 있을  아니라 동일한 유의확률을 산출한다는 것이 밝혀졌다윌콕슨의 논문이 발표되기 전까지모든 검증은 모수의 추정값에 기반을 두어야 한다고 생각했다하지만 윌콕슨 검정과  - 휘트니 검정은 어떤 모수도 추정하지 않는 방법이었다  검증은 관찰된 자료의 분포와 임의적 상황에서 얻어지는 자료의 분포를 비교하는 비모수적 검증법이었던 것이다이제 통계혁명은  피어슨의 생각을 뛰어넘는 발전을 이루게 된것이다 모수를 도입하지 않고도 분포를 다룰  있게  이다
윌콕슨과 그리고 휘트니는 순위의 본질에 대한 관심 이끌어 냄으로써 새로운 통계적 연구분야를 등장시켰다
(중략체르노프와 세비지는 윌콕슨 검증통계량이 순서통계량의 평균이라는 것을 발견했으며  결과 모수를 추정하지 않고도 여러 분포를 비교할  있도록 비모수적 검증법을 확장할  있었다. 1960년대까지 비모수적 검증(현재는 분포무관검증이라고 부른다 엄청난 관심을 받았다 

# (181-2) 해결되지 않은 문제들
1) 자료가 정규분포와 같은 분포를 따를  비모수적 방법을 사용하면  결과가 얼마나 틀릴  있는가?
2) 자료가 모수적 모형에 어느 정도 적합하지 않을  비모수적 방법이 모수적 방법보다  좋은 결과를 주는가?

(183-4) 피트만이 발견한 사실은 놀랍게도 비모수적 검증이 모수적 검증과 비모수적검증이 거의 같은 정도로 좋다 것이었다적절한 모수모형을 아는경우 비모수적 검증을 사용하면 얼마나 나쁜 결과를 얻는지 그리고  경우 반드시 모수적 검증을 사용해야 하는가 하는 질문에 피트만이 얻은 답은 전혀그렇지 않다 것이었다

두번쨰 질문에 대한 답은 더더욱 놀라운 것이었다피트만은 모수모형과 자료가 조금만 차이가 나더라도 비모수적 방법이 모수적 방법보다  좋다는 결과를 얻었던 이었다

피트만의 연구결과는 모든 가설검증은 비모수적이어야 한다는 것을 시사했다. (중략윌콕슨과  그리고 휘트니는 그들의 단순한 방법 깊숙한 곳에 자료의 분포를 가정하고 있었던 이다

(중략비모수적 방법에 처음으로 충격을 가한 사람은 바하두르와 쌔비지이다
바하두르와 쌔비지가 발견한 문제는 윌콕슨으로 하여금 비모수적 방법을 생각하게  바로  문제 이상값 문제였다만약 이상값이  나타나지 않을뿐아니라 완전히 잘못된 관찰값이면 비모수적 방법은 이상값이 분석에 미치는 영향을 감소시킬  있다하지만 이상값이 자료의 오염으로부터 나타난 것이라면 비모수적 방법은 상황을  악화시킬 뿐이다 (번역 문제?)

[17 부분이 전체보다  나은 경우]
(187-8) 모집단을  대표하는 표본추출하기
1) 판단표본 : 모집단에 관한 정보를 바탕으로 모집단을 여러 소집단으로 나누고  소집단을 대표하는 표본을 추출하는 방법판단표본을 사용하는 대표적인 사례가 닐슨 시청률
전체가구를 사회경제적 지위거주지역에 따라 여러 소집단으로 분류하고  소집단에서 몇몇 가구를 표본으로 추출하여 조사
일견 모집단을  대표하는 표본처럼 보이지만 두가지 문제가 있다
첫번쨰는 모집단을 소집단으로 분류할 만큼 모집단을  알고 있을 때만 판단표본이 좋은 표본이 된다하지만 모집단에 대해  정도로  알고 있다면 굳이 표본을 추출할 필요가 있겠는가소집단으로 분류할  필요한 정보에 대해서는 더더욱 그렇다
두번째는  곤혹스러운 문제인데 판단표본에서 얻은 결과가 틀릴 경우 어느 정도 틀린지 알아낼 방도가 없다는 이다. 2000 여름에 실시된 닐슨 시청률 조사는 판단표본에 스페인계 가구가 충분히 포함되지 않아 스페인계 티비 프로그램 시청률이 과소하게 추정되었다는 비판을 받았다

(188) 2) 임의표본
마할라노비스가 제시한 해결책은 임의표본이었다. 임의 표본에서 구한 결과도 참값과 차이를 보이겠지만 장기적으로는 참값에 가까운 결과를 얻을  있다는 통계이론을 적용할  있다뿐만 아니라 임의 표본에서 구한 결과의 확률분포를 수학적으로 구할  있으며 이로부터 참값에 대한 신뢰구간 구할수도 있다

(191) 한센의 주도하에 일련의 연구를 실시하였으며  결과 소규모의 표본조사가 이전에 사용된 판단표본보다 훨씬  정확하다는 결론 내렸다미국노동통계국과 상무부 인구조사국은 임의표집이라는 새로운 세계로 가는 길을 선택했다

[18 흡연이 암을 일으키는가?]
# (202-3) 실질적 함의
코흐는  병원균이 특정질병을 일으킨다는 결론을 내리기 위해서는 다음 조건을 만족해야 한다고 하였다 
1.  병원균을 배양할 때마다 특정 질병이 나타난다
2. 특정 질병이 없는 곳에서는  병원균이 발견되지 않는다
3.  병원균을 제거하면 특정질병이 사라진다

코흐는 실질적 함의를 기술하고 있다하지만 흡연과 폐암의 관계를 논할  코흐의 조건은 아무소용이 없다 (중략코흐의 조건이나 러셀의 실질적 함의를만족하는 질병은 혈액이나 분비물에서 병원균을 배양할  있어야 한다는 조건을 만족하는 것에 국한된다심장병당뇨병천식관절염각종 암은 이런조건을 만족하지 못한다

(206) 콘필드의  연구논문은 역학연구에서 인과관계를 밝히는 전형적인 사례가 되었다비록 각연구가 조금씩의 결함이 있더라도 후속 연구들이 동일한 결과를 보이면 증거는 계속 누적되는 것이다

# (207) 피셔가 제시한 해결책
피셔도 인과관계에 대해서는 러셀의 영향을 받았으며 실질적 함의가 대부분의 과학연구에 적절하지 않다는 것을 알고 있었다. (중략실험설계 원칙을 준수한다면 연구결과에 기반을 두고 인과관계에 대한 결론을 내리는 것이 가능하다고 주장했다

 

 

[21 가난한 이민자 가정에서 태어난 천재]
(241-2) 사영추적

환자가 병원을 열번 방문하고 병원을 방문할 때마다  500가지를 측정한다면 5000개의 측정값이 얻어진다만약 2만명의 환자가 실험에 참가했다면 자료는 차원이 5000 공간에 흩어진 20,000 개의 점으로 표현된다통계분석에서 5,000 정도의 차원은 흔한 일이다차원이 증가할수록 모수에 대한좋은 추정값을 구하기 어렵다 . 디아코니스가 소속한 스탠퍼드 그룹은 차원이 5,000이나 되는 실제 자료도 실상 그렇게 혼란스럽게 흩어져 있지 않고 저차원에 모이는 경향이 있다는 것을 알아냈다왜냐면 이들  상당수는 서로 상관이 있기 때문이다. (프린스턴 대학과  연구소에서 연구한 튜키는 의학분야 자료의 차원은 5 넘지 않는다고 말한 바가 있다)

이런 안목을 가진 스탠퍼드 그룹은 컴퓨터를 이용하여 자료에 내재하는 차원을 찾아내는 기법을 연구하였다그중에서 가장 널리 사용되는 방법이 바로 사영추적이다

 

[22 통계학의 피카소 (튜키)]
(247) 거대한 자료는 어떻게 분석하고 어떻게 자료를 구조화해야 하는가?
컴퓨터는 모든 통계이론을 소용없게 만들  다른 면을 가지고 있다그것은 대량의 자료를 저장하고 분석할  있는 능력이다
1960-70년대 벨전화연구소에서 거대자료분석법이 개발되기 시작했다전화선을 모니터하면서 발생하는 각종 문제와 오류를 기록하면 수백만개의 자료가 얻어진다행성 탐사선이 보내는 자료 또한 엄청난 양이다
이렇게 거대한 자료는 어떻게 분석해야 하는가 이런 자료를 분석하려면 어떻게 자료를 구조화해야 하는가?

 피어슨이 했듯이 확률분포의 모수를 추정할  있다하지만  방법은 피어슨 시스템과 같은 특정 분포군에 속한다든지 특정분포를 따른 다는 가정을필요로 한다. 분포를 가정하지 않고 자료로부터만 뭔가를 알아내는 방법은 없을까? 어떤 의미에서 이것은 훌륭한 과학자들이 해왔던 것이다멘델은 일련의 식물교배실험결과를 분석하여 점진적으로 우성유전자와 열성유전자에 대한 이론을 도출했다
대부분의 과학연구는 자료를 수집하고  자료에 사전에 예상해둔 분포를 적합하지만분포를 적합하는 것보다 뭔가 특이한 사항이 있는지 알아보는 것이중요할 때가 있다 

(248-9) 수학자 벨이 "숫자가 거짓말을 하지는 않지만속일 의도와 함께 진실을 말하는 경향이 있다 " 라고 지적했듯이 인간은 패턴을 찾는 경향이 있어서 임의적인 잡음에서조차 패턴을 찾아낸다 
=>  오행이 만들어졌고 오행이 문제인가 라는 질문에 대한 이유가 될까?

(중략특정분포를 가정하지 않고도 자료의 분포를 검토할  있음을 인식한 튜키는  문제에 관한 여러편의 논문을 발표하였으며 마침내는 탐색적 자료분석이라는 새로운 분야의 책을 출판했다
(중략도수가 높은 것만 쳐다보게 하는 히스토그램의 문제점을 개선하기 위해 도수의 제곱근을 나타내는 루트그램을 만들었다자료의 중심부분을 상자로 표시하고 극단값은  상자에서 뻗어나오는 직선으로 표현하는 상자그림도 제안했다그가 제안한 상자그림이나 줄기와 잎그림 등은 표준적인 분석도구가 되어 통계패키지에 포함되었다그가 만든 두개의 신조어는 공식적 영어단어로 인정받았다이진수를 의미하는 비트와 컴퓨터 프로그램을 의미하는소프트웨어라는 단어를 만든 사람이 바로 튜키이다

[23 오염문제]
(252-3) 만약 통계분석가의 눈에 옳게 보이는 자료만 선택해서 분석하면 심각한 오류에 빠지게 된다. 1980년대초 스티글러는 18,19세기 위대한 과학자들의 연구노트를 살펴봤다스티글러는 대부분의 과학자들이 분석하기 전에 일부 자료를 버렸다는 것을 발견했다케플러조차 일부를 버리고 분석했다 하지만 현대과학자들은 뭔가 잘못된 것처럼 보인다고 해서 자료를 버리는 일은 더이상 하지 않는다과학자들은  이상 자료를 버려서는 안된다고 교육받는다 
하지만 몇몇 자료가 분명하게 잘못된 것이라면?
(ex)  궤양치료법을 비교하기 위한 쥐실험효과가 낮을 것으로 예상되는 집단에 속하는 두마리 쥐에서 나온 자료 때문에 차이가 없었다 두마리 쥐에서는 궤양이 발생하지도 않았을  아니라 다른 처리를 받은 어떤 쥐보다도 좋은 결과를 보였다이런 문제를 해결하기 위해 개발된 것이 비모수적 방법이지만 경우 두개의 자료가 완전히 다른 쪽에 위치해서 비모수적 방법으로도 유의한 결과를 얻지 못햇다. 100 전이라면  약물학자는 두개의 자료를제외한 나머지 자료만으로 분석하였을 것이고 누구도 뭐라 그러지 않았을 것이다
(중략) <위치에 대한 로버스트 추정 : 개관과 발전이라는 책에 바로  문제의 답이 있었다

# (257-9)로버스트(robust) ?
피셔의 사위인 박스가 처음으로 사용한 용어 
박스의 업적  하나가 바로 로버스트라는 용어를 만든 박스는 많은 통계적 방법이 수학적 이론에 기반을 두고 있으며 이들 수학적 이론들은 분포에 대해 어떤 가정을 하고 있다는 사실에 관심을 갖게 된다문제는 분포에 대한 가정이 틀릴  있다는 것이다가정이 성립하지 않을 때도  유용성이 유지되는 그런 통계적 방법은 없는가
박스는 그런 통계적 방법을 로버스트 하다고 했다
로버스트라는 개념이 모호하기는 했지만 박스는  개념을 너무 구체화하지 않는 것이 좋다고 생각했다왜냐면 통계적 기법을 선택할  기준이 모호한것이  나을때가 있다고 생각했기 떄문이다예를 들어 가설검증의 로버스트 성은 오류를 범할 확률로 정의된다

튜키와 그의 동료들은 명백히 틀린 자료가 있을  어떻게 해야 하는가 하는 문제에 도전하게 된다 연구결과는 1972 <프린스턴 로버스트성 연구>라는 책으로 출판되었다 연구의 근저에는 오염분포가 자리하고 있다 자료의 대부분은 모수를 추정하고자 하는 분포에서 나왔지만 몇몇 자료는 다른 분포  오염시키는 분포에서 나왔다고 가정하는 것이다
ex) 미국해군의 새로운 광학거리측정기 사례 - 수백명의 수병들에게 특정 목표물 거리 측정하도록 지시하지만 인간의 20% 약시이고 약시자는 입체이미지를 인식하지 못하므로 측정치의 20% 잘못된 것이 분명하지만 어떤것이 약시 수병이 측정한 것인지  도리가 없었다
(중략그들은 분포의 중심을 추정하는 방법을 연구하다가 가장 자주 사용하는 평균이 오염된 자료에 대해서는 나쁜 추정값이라는 것을 알게 되었다. 10년전에 예일대학을 졸업한 졸업생들의 평균소득을 추정한 1950년대 연구가 전형적인 이다
(중략통상적으로 사용하는 평균은 오염시키는 분포로부터 나온  하나의 이상값으로부터도 많은 영향을 받는다.
(중략만약극단값들이 잘못된 값들이 아니거나극단값들이 오염시키는 분포가 아니라 우리가 알아보고자 하는 분포에서 나온 값들이라면 값들을분석에서 제외하는 것은 편향된 결과를  것이다

그래서 프린스턴 연구팀은 다음 두가지를 만족하는 해결책을 제시했다 
1. 오염시키는 분포에서 나온 측정값이 있을 경우 그들의 영향력을 감소시킨다
2. 오염시키는 분포에서 나온 측정값이 없을 경우에는 올바른 결과를 준다

[참고잔차 : 남아있는 오차라는 의미오차라는 단어에 대한 거부감에서 비롯된 단어(253)

[24 산업계를 개조한 사나이 (데밍)]

# (267) 품질관리의 본질

자동차피스톤을 둥글게 제작해야 한다는 말은 특정 피스톤이 둥근지 아닌지를 측정하는 방법이 없는  아무 의미가 없다품질을 개선하기 위해서는 품질을 측정할  있어야 하고 , 품질을 측정하기 위해서는 먼저 품질과 관련한 특성을 정의해야 한다품질특성은 본질적으로 변동을 가지기 때문에 제조공정은 품질특성의 분포와 관련한 모수에 초점을 맞춰야 한다 피어슨이 모수의 변화로부터 진화의 증거를 찾으려 했던 것처럼 경영자들은 품질특성의 분포와 관련한 모수를 모니터하여야 하며 품질이 개선되도록 제조공정을 수정할 책임이 있다

 

# (268) 호손효과 

호손공장에서 두가지 경영기법의 차이를 규명하기 위한 연구실패로 돌아감근로자가 누군가 자신을 관찰하고 있다는 사실을 알고 전력을 다하게 .

 이후 호손효과는 단지 실험이 진행되고 있는 것만으로도 상황이 개선되는 현상을 나타내는 용어로 사용임상시험에서 임상시험에 참여하는  자체만으로 환자들의 상태가 기존 치료법에 의한 과거 치료효과보다 호전된 결과를 보이는 

 

# (269) 가설검증에 대한 데밍의 관점

네이만과 이곤 피어슨이 개발한 가설검증법에 대해 데밍은 가설검증이 이렇게 광범위하게 사용되는 것을 불만스러워 했다왜냐면 가설검증은 잘못된 질문에 초점을 맞추고 있기 때문이다그는 "현실에서의 문제는  처리의 차이가 유의적인가 아닌가를 알아보는 것이 아니다 처리의 차이가 아무리 작더라도 실험을 많이 하면  작은 차이도 유의적으로 나타날 것이다라고 지적했다유의적인 차이가 있는 것은 아무런의미가 없다중요한 것은 차이의정도이며 실험에서 구한 차이의 정도가 다른 실험에서 구한 정도와 다를  있다 생각했다데밍은 통계적 방법이 문제를 해결하는 방도로 사용되어서는  된다고 생각했다통계적 방법의 이런 한계는 매우 중요하다 "통계학자들은 문제에 흥미를 가져야 하며통계적으로 추론하는 방법  아니라 방법의 한계까지도 가르쳐야 한다통계적 추론의 한계를   이해해야만 통계적 추론을 유용하게 사용할  있다 " 


[25 검은옷을 입은 여인이  교훈]

(275) 컨리프는 농업실험현장에서 보내오는 자료를 책상에 앉아 분석이나 하고 있을 사람이 아니었다자신이 직접 현장에 나가 어떤 일이 벌어지고 있는지 확인해야 하는 그런 성품의 소유자였다 .이제  통계학자의 길에 들어선 사람은 그녀의 이런 자세를 본받아야 한다여러 계층의 사람을 거치면서 실험설계와 현장에서 벌어지고 있는 일이 얼마나 다른가를 보면 놀랄 것이다. 

 

(277) 연구부서에서 일하던 연구원들의 능력을 비난하는 것은 결코 아니지만 , 내가 오랫동안 더불어 일했던 귀무가설을 세우는 실험설계표집법세밀한 통계분석결과에 대한 엄격한 평가원리들이 사회학 분야에서는 제대로 적용되지 않거나 아예 받아들여지지 않는 것에 놀라지 않을  없었습니다

=> 한의학은 자연과학 분야에서 마지막으로 통계학이 접목되는 분야가 아닐까 싶다

 

(279) 통계학자들은 정밀한 수학적 훈련을 받지만 초보자들에게 뭔가를 설명하는데는 무척 서툽니다전혀 이해하지 못하는 사람에게 ,p 값이 0.001 보다 작다고 말한다고 해서 그들을 설득할 수는 없을 겁니다우리 통계학자들은 우리가 찾아낸 사실을 그들의 언어로 설명해야 하며 그들을 설득할 능력을키워야 합니다

=> 한의학 임상연구를 하는 사람들은 의사들을 설득시키는 것보다 한의 임상의들을 설득시키는   애를 먹을지도 모른다의사들에게는 좋은 연구방법론을 적용한 명확한 결과만 제시하면 되지만 어떤 한의 임상의들은 '그것은 한의학이 아니다라고 말할지도 모른다대체 당신이 말하는 한의학은 무엇인가하지만 임상연구가 의미를 가지려면 그것이 임상현장을 변화시키고 의료정책을 변화시켜야 의미가 있는데 임상의들을 설득시키지 못하면 목적을달성할  없다의사를 대상으로 p값이 어쩌고 하는 것보다 임상 한의사들에게 임상연구를 이해할  있고 임상에 적용이   있으며 그것이 치료율을올리고 궁극적으로 '이득 될것이라는 것을 이해시키는 과정이 분명히 필요하다연구동향팀 활동은 그러한 논문을 소개하고자 하는 목적한의학 위키는 이러한 것이 중요함을 알리려는 목적에 시작한 이제는 그러한 논문을 만들어 내는 일에 직접 뛰어들 

 

[26 마팅게일의 등장]

# (285-6) 마팅게일?

1. 측정값이 무한히 크거나 작아지지 않도록 변동의 크기가 유한해야 한다

2. 다음에 생성될 난수의 최적 추정값은 마지막에 생성된 난수이다

 

 두가지 조건을 만족하는 난수의 수열을 마팅게일이라고 한다임상실험에서 시간에 걸쳐 수집한 환자의 반응이 마팅게일 이라는 것을 발견하게 된다

 

입원한 환자를 연구대상에서 제외했다고 퇴원하면 다시 연구대상에 포함하고 반복해서 일어나는 입원을 새로운 사건으로 간주하였다

오늘날 마팅게일은 만성병에 관한 장기간의 실험자료를 분석하는 표준분석법이 되었다

 

[27 치료의도 분석]

(292-3) # 페토의 치료의도분석법

어떤 치료법을 권장하는 의료정책의 전반적인 효과에 관심이 있다고 하자그렇더라도 환자에게  적합할 것이라고 생각되는 치료법으로 전환할 자유가의사에게 주어져야 한다 경우 ★★★ 권장치료법으로 치료를 시작하는 것이 좋은 정책인지 치료의도분석법으로 분석할  있다이처럼 치료의도 분석법은 공공정책의 유효성을 판단하기 위해 정부가 지원하는 대규모의 연구에 적합한 방법이다

 불행히도 기반이 되는 수학적 이론을 모르면서 통계적 방법을 사용하는 과학자들이 있다임상연구도 예외가 아니다. 페토는 자신의 분석법이 가진 한계를 분명히 했다하지만 많은 대학의 연구자들은 치료의도분석법을 의학연구의 비급 또는 임상실험을 분석하는 유일한 통계적 방법으로 여기고 있다

(중략많은 임상실험의 목적은  치료법이 현재의 치료법과 동일하면서 부작용이나 비용이 적고 순응도가 높은지를 검증한다 ,치료효과의 동등성(비열등성) 검증하는 것이다. 치료의도 분석은 처리효과의 차이를 찾아내는 것이며 차이가 없다는 결과를 얻었다고 해서 그것이 효과가 동등하다는 것이아님을 명심해야 한다

(중략올바른 방법을 사용해야 한다는 의학자들의 강박증이 가설검증을 극도로 엄격하게 적용토록 했다고 생각한다예를 들어 어떤 통계적 방법을 사용하던 간에 사전에 유의수준을 정하고 이를 그대로 유지하게 해야 한다든지 하는 것이다이것은 피셔가 네이만과 피어슨의 가설검증법에 반대한 한가지 이유이기도 하다피셔는 유의확률과 유의성검증이 그토록 엄격하게 사용되어야 하는 것이 아니라고 생각했다피셔는 사전에 잘못할 확률을 정해놓고 유의확률이 이보다 작을 경우 어떤 조처를 취하는 것에도 반대했다그는 유의확률이 유의적인가 하는 결정은 상황에 따라 판단해야 한다고 암시했다피셔는유의확률을 어떻게 사용해야 하는지에 대해서는 명확히 언급한 적이 없고 단지 예제만 제시했을 뿐이기 때문에 "암시라고 표현했다

 

# (295) 박스의 진화적 공정

진화적 공정의  단계에서 얻은 결과는  단계의 결과와 비교된다 과정은 계속 반복되므로 최종적인 올바른 결론이란 존재하지 않는다실험을 반복하고 실험에서 얻은 자료를 반복해서 분석하는 과학연구는 끝이 없다는 것이 박스의 관점이다이는 과학에는 궁극적 진리가 없다 의미이기도 하다.  

=> 의학 임상연구에서 이것은 너무나 명확하다특히나 치료법에 관해서 용량 등은 언제고 뒤바뀔  있는 

 

# (295) 데밍의 관점

데밍을 비롯한 일부 통계학자들은 노골적으로 가설검증을 배척한다그들은 피셔가 주창한 추정이야말로 모든 통계분석의 기반이라고 주장한다관련한분포의 모수를 추정하는 것이 핵심이며유의확률이나 자의적 가설을 통해 간접적으로 모수를 다루는 것은 이치에 맞지 않는다 것이다

(중략그들은 네이만과 이곤 피어슨의 가설검증은 통계학사의 유물정도로 여긴다네이만도 자신의 논문에서 유의확률이나 가설검증을 거의 사용하지 않았다는 사실은 시사하는 바가 있다

 

# (296) 코크란의 관찰연구

볼티모어 시당국은 영세민에게 공공주택을 제공하는 것이 그들의 태도를 변화시키고 사회적으로 성공하는데 효과가 있는지 확인하고 싶어했다 

코크란은 무작위 배정 실험대신 공공주택을 공급받은 세대와 공급받지 못한 세대를 추적조사하는 관찰연구를 제안했다하지만 이들은 여러 요인측면에서 서로 다르기 때문에 코크란은 관찰연구에서 사용할  있는 분석법을 개발했다

연령교육수준종교 같은 요인들의 효과가 포함된 수학적 모형을 세우고  모형에 포함된 모수를 추정하면 연령교육종교 같은 요인이 설명하지 못한부분을 구할  있다 나머지 부분이 공공주택의 효과를 추정하는데 사용되는 것이다

(중략의학사회학정치학천문학 같이 임의로 처리에 배정하는 것이 불가능하거나 비윤리적인 분야  영향을 끼쳤다

 

 

(298) 모든 통계분석법은 연속선 상에 놓여 있다고 생각할  있다한쪽 끝에는 루빈이나 코크란의 방법과 같이 모형에 매우 민감한 방법이 위치하고다른 한쪽 끝에는 가장 일반적으로 자료를 분석하는 비모수적 방법이 위치해 있다컴퓨터 혁명이 모형에 민감한 통계적 방법을 사용할  있게 해준 것처럼다른쪽 끝에 위치한 비모수적 방법에도 유사한 혁명이 일어났다수학적 모형이 거의 필요없고어떤 모형에 구속받지 않고 자료 스스로 자신에 관한 이야기를 하게 하는 비모수적 방법에서도 말이다비모수적 방법에서 일어난 컴퓨터 혁명은 부트스트랩이라고 불린다

 

[28 스스로 작동하는 컴퓨터 (부트스트랩)]

(302-3) 글리벤코칸텔리 보조정리는 만약자료를 생성하는 분포에 대해 전혀 아는바가 없다면 자료로부터 비모수적 분포를 만들어   있다는 것이 보조정리의 핵심이렇게 찾아낸 비모수적 분포를 경험적 분포함수라고 한다 경험적 분포함수는 수학적 성질이 좋지도 않고연속함수도 아니며,수학적으로 우아하지도 않다그럼에도 불구하고 칸텔리는 측정한 자료의 수가 증가할  경험적 분포함수가 진정한 분포함수에 수렴한다는 것을 증명.경험적 분포함수를 구하기 위해서는 별생각없이 단순히 개수세기를 반복하면 된다초당 수백만 번의 연산이 가능한 계산기를 이용하여  자료에서 경험적 분포함수를 구하고 이를 바탕으로 모수를 추정할  있는데 1980년대 컴퓨터의 개발로 인해 이것이 가능해졌다.  부트스트랩은 글리벤코 - 칸텔리 보조정리를 단순히 두번 적용한 것으로 생각할  있다

에프론은 자료가 자기 스스로 일을 하게 하는 방법이라는 의미로 부트스트랩이라는 이름을 붙였다

# (305) 통계모형의 승리

 세기전  피어슨은 모든 관찰값은 분포에서 유래하고과학의 목적은  분포의 모수를 추정하는 이라 했다 이전의 과학자들은  우주가 뉴턴의운동법칙과 같은 법칙에 따라 작동하는 기계 같은 것이며 법칙에서 벗어나는 것은 측정오류라고 생각했다시간이 감에 따라  피어슨의 관점이 지배적인 관점으로 자리잡았고과학 교육을 받은 사람이면 누구나  피어슨  관점을 당연하게 받아들이고 있다이러한 관점이 현대과학 교육에 너무나 깊이 침투했기 때문에 사람들은 그에 대해 깊이 생각하려 들지 않는다이러한 관점에 기반을  기법을 사용하는 과학자와 공학자조차 이러한 관점의 철학적 의미는 생각하지 않는다 과학의 연구대상이 확률분포라는 개념이 널리 퍼져가는 동안 철학자와 수학자들은 심각한 근본적인 문제를 들춰내고 있었다

 

[29 통계학의 불안정한 토대

(309-10)  정밀한 측정이 가능해져 갔는데 불구하고 측정값과 모형에 의한 예측값이 차이가  커져 갔고이로 인해 결정론적 과학관은 무너지고 말았다. (중략이런 시점에  피어슨이 모수가 포함된 분포를 들고 과학계에 등장한 것이다특정 유전자가 특정 단백질을 생성한다는 분자생물학적 결과가결정론적 과학관을 지지하는 것처럼 보이지만 실제로 수집된 자료에는 상당한 임의성이 내포되어 있다 수집된 자료를 나타내는 분포의 모수가 바로 유전자인 것이다

1-2 mg  섭취해도 혈압과 심리변화를 일으키는 약의 효과가 항상 일정하게 나타난다고 생각하겠지만 약학실험은 약의 효과가 확률분포를 가진다는 가정하에서 설계되며  분포의 모수를 약의 효과로 해석한다. (중략모든 과학의 시발점이 예측불가능한 측정값의 변화가 통계적 계산에 녹아 있으며 과학연구의 결과는 결코 관찰할  없는 모수로 기술되고 있다


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
일상진료에 바로 쓸 수 있는 임상통계학
노또 히로시 지음, 성윤경 외 옮김 / 대한의학서적 / 2009년 4월
평점 :
장바구니담기


책은 임상연구를 하기 전에 개념에 대해서 명확히 정리해주는 매뉴얼 같은 .’ 닥터배의 술술 임상통계 김지형씨의 한눈에 쏙쏙 의학통계 배우기같은 책들이 실제 연구시에 어떤 통계법을 먹어야 하는지 바로 적용하기 위한 책이라면 책은 그런 책들을  읽기 전에 통계의 기본개념과 용어정의에 대해서 숙지하기 위해 보다 먼저 읽어야 책이다. 통계학의 기본개념을 알고 다음에 실제로 의학통계에서 어떤 상황에 어떤 검정법들이 쓰이는지 아는 것이 맞는 순서이기 때문이다. 알고 있는 내용이라고 생각했지만 막상 조금씩 부정확하게 알던 개념들, 모호하던 개념들을 다시 한번 정리. 전형적인 일본식 매뉴얼 스타일의  
특히 최근에 EDX 에서 Fundamental of Clinical Trials 강의에서 나왔던 내용들을 다시 한번 말하는 것들이 많아서 도움이 되었던

 

 

마침 2 8-9 순천향대 SPSS 워크샵을 가게 되었는데 그러고 나면 통계 완전 기초서적은 안봐도 되지 싶다. 조금더 깊고 실제 써먹을 내용들을 다루는 책들을 봐야 . 본격적으로 신약개발에 필요한 의학통계학 2판을 오늘부터 보고 다음에 쭉쭉 통계학의 피카소는 누구인가, 한손에 잡히는 임상연구 3, 생명과학연구를 위한 통계적 방법으로 통계책을 달려보자.

 

[1] (16) 통계학적으로 유의한 차가 있는 결과라 해도 임상적으로 반드시 의미가 있다고 수는 없습니다. 임상연구의 결과는 사실이지만 그것이 진실이라고 수는 없다. 임상통계학에서는 오차, 불확실성을 객관적으로 평가한다

 (17) 임상연구를 평가할때는 치우침을 어떤 분석, 계산법으로 보정하고 있는지 음미하고 인과관계를 평가할 때는 confounding factor 검증도 필요 

 

[2] (18) 인간은 반드시 병태생리학적 이론대로 반응하지 않는다. 생물학적 지식은 어디까지나 가설에 지나지 않으며 임상연구에 의해 증명되어야 한다고 생각. 그와같은 사회적 요구에 대응해 50여년 전부터 역학적 사고방식을 임상의료에 적용하고자 하는 임상역학이 발달

이전까지의 병태생리학적(인과관계추구) 접근에서 현상(환자의 임상문제) 출발점으로 발상으로 전환

(19) 임상역학과 EBM 모두 불확실성에 대처하는 중요한 행동양식. 실증적 사실을 기초로 정량적으로 사물을 평가해 불확실함 속에서 가장 합리적인 결단을 내리고자 하는

EBM 임상적 능력을 대치하는 것이 아니라 기존의료의 결점을 보충하는

 

[3] EBM 최선의 의료를 제공하는 행동

(20) 1) 환자의 의향 2) 의사의 전문적 능력 3) 임상연구에 의한 실증보고 3가지를 통합해 판단을 내림으로써 최선의 의료를 제공하는 행동양식

=> 한의 임상에 대해 RCT내놓으라고 Evidence 없지 않냐고 무턱대고 비판하는 이들은 Evidene based medicine , 근거중심의학에 대해서 전혀 모르는 사람들이다

 

EBM 의사결정을 의료인의 임상적 능력이나 임상적 판단(=art) 신뢰할 있는 evidence (=science) 양면을 통합해 환자별로 최선의 치료를 하는 행동기존의 의학판단의 결점을 통합적으로 보충하고 개별화를 시한 의료실천.  

EBM 환자와 사회에 최선의 진료를 제공하는 것이 최대의 목적

 

[부록 1 EBM 총설] (186-188)

유명의학지에 실린 연구라고 해서 모두 신뢰할 있는 것은 아니다. 스스로 독해해서 신뢰도를 판단해야 한다. (critical appraisal) 

수량적 데이터는 환자의 가치관이나 QOL 정성적 속에 있어야 비로소 의미를 가지는 이다

정확한 임상진단을 내리기 위해서는 임상진단학의 능력이 반드시 필요하다. 기반이 되는 임상경험이나 환자가 안고 있는 문제를 진찰에 이끌 있는 능력 없이는 EBM 실천할 없다

EBM 의료의 옳고 그름을 판단하려는 것이 아니라 어디까지나 객관성을 부여하기 위한 행동양식 도구이다

 

 

[4] 임상연구의 목적은 가설을 현실세계에서 검증하는

(22) 임상연구는 모집단의 일부(표본) 대상으로 분석결과(사실) 로부터 모집단(보편, 진실) 특징을 추론합니다

 

[6] (26) 치료의 대상은 검사값이 아니라 환자입니다. 검사값이 개선되더라도 임상적으로 개선되지 않는다면 가치가 없습니다

질환의 Outcome 5D

Disease 질환의 발생 치유

Death  사망

Discomfort 정신 심리적 증상 불쾌감

Disability 신체적 증상

Dissatisfaction 불만족 

(27) Secondary Outcome 유의하다고 해도 어디까지나 primary outcome 아니라서 bias 많을 있다. 그래서 지표를 primary outcome 잡고 연구를 하면 유의하지 않은 경우가 많다.

 

[7]     (28)  질환 +        질환 -

 위험요인 +     a                 b

 위험요인 -      c                 d

 기여위험도 (AR, Attributable Risk)  a/(a+b) - c/(c+d)

 비교위험도 (RR, Relative Risk)   [a/(a+b)] / [c/(c+d)]

marker : 인과관계가 없고 단순히 관련성만 있는 위험요인을 표지자(marker) 라고 한다

 

 

[8] (30) 통계적 추론에는 추정(estimation) 검정(test) 있다

어떤 하나의 수치 점추정(point estomation) 아니라 불균일을 이룰 가능성을 고려하여 가능성이 있는 분포폭을 추정하는 것을 구간추정(interval estimation) 이라고 하며 구간추정으로부터 구하는 분포 폭을 신뢰구간이라고한다

95% 신뢰구간 :  조사연구를 100 되풀이한 경우 치우침이 없다면 모집단의 추정값이 95 존재하는 분포폭 말하며 양단을 신뢰한계라고 한다

 

결과는 유의확률(p) 신뢰구간으로 표시되지만 임상논문에서는 신뢰구간을 중요시

 

[9]

(32) Selection bias : 임상연구에 참여하는 사람의 경우 일반적으로 병에 대한 관심이 높아 순응도가 높아서 실제 임상현장에서보다 치료효과가 높게 나올 있다. 특히 의료종사자를 대상으로 연구는 일반화할수 없는 경우도 있다. 

 

[10]

(34) 관측값 = 진실값 + 오차

오차 = 치우침에 의한 오차 + 우연의 영향

우연에 의한 퍼짐을 반으로 줄이기 위해서는 샘플수가 4 필요

 

우연에 의한 퍼짐, 불확실성은 계산이 가능하기 때문에 표본의 대표값으로부터 진실값을 추정해 관측된 차이가 우연에 의해 발생했을 가능성을 검정에 의해 평가 있다. 하지만 치우침은 계산을 통한 보정 표준화는 가능해도 우연에 의한 오차처럼 예측치를 계산할 수는 없다

 

[11] 임상연구 정선집

참고 : 네이버 블로그 포스팅 http://blog.naver.com/julcho/40201240040

 

[16] (47) 위험요인, 예후 요인을 치료하고 교정하더라도 질환 발생률이 반드시 감소하지는 않는다

N of 1 trial - 개인 환자에 대해 복수의 치료를 하나씩 시험. 언뜻 비과학적으로 보이지만 정확한 치료방침을 세우고 객관적인 평가법을 도입한다면 그것으로도 얼마든지 과학적인 맞춤형 의료 

 

[18] (51) 코호트는 공통의 특징을 가지는 하나의 연구대상군 

환자 대조군 연구에서는 상대위험도는 근사적으로 구할 있지만(오즈비) 절대적인 위험도차(기여위험도) 이환율은 구할 없다

 

(52 코호트내 환자 대조군 연구 
-
녹차 섭취와 위암 발생의 조사를 목적으로 코호트 데이터를 사용해 헬리코박터 감염과 위암발생의 관련 조사 목적의 환자 - 대조군 연구를 나중에 재분석 가능. 장점은 검출력이 강한 가설 설정, 비용절약, 가설 검정에 필요한 표본수 최소화 

(54)
환자 대조군 연구에서는 상대위험도를 산출하지 않고 오즈비를 사용하는 것일까?
코호트 연구는 증상이 발생하지 않은 사람 전원을 추적하기 때문에 발생한 사람의 수로부터 사건 발생률을 계산할 있다. 하지만 환자 대조군 연구는 발생 후에 단순히 환자와 대조군을 비교하는 것으로 사건 발생률은 계산할 없다

(55)
기술통계학은 제한된 표본 전체의 데이터를 사실 자체로 기술하는 것으로서 추측의 여지는 없다, 예를 들어 어떤 학교 1학년의 신장분석

(56-9)
표준편차와 표준오차
표준편차(Standard deviation) 한정된 표본집단 내에서 측정값의 분포정도를 표기하는
표준편차는 정규분포의 경우에는 평균값 상하 2표준편차 범위 안에 전체 데이터의 95% 분포하는 특성이 있다

표준오차(standard error) 표본의 평균값 혹은 비율로부터 모집단(진실) 특성을 추측(신뢰구간의 추정과 검색) 사용하는  
표본수가 많을수록 표준오차는 작아지고 표본의 평균값은 진실된 평균값에 가까워진다. 표준오차를 절반으로 줄이려면 표본이 4배가 필요 

(58)
변동계수 (Coefficient of Variation) : 동일한 개체나 검체를 반복측정 경우의 측정값의 표준편차를 평균값으로 나눈 . 변수가 작을수록 검사의 신뢰도 재현성이 높아짐
intra assay -
동일검체를 분할해 동일한 기기로 측정
inter assay -
동일인의 검체를 다른 재측정

(62)
이상값
이상값이라고 해서 그것이 병적이라고는 없다
새로운 검사/치료법의 개발로 기준이 변할 수도 있으며 임상적으로 정상범위가 치료목표가 아닐 수도 있다. 치료의 대상은 환자이며 검사값 자체가 아니다. (치료에 대한 부작용으로 사망률이 반대로 증가하는 경우도 있다. 예를 들어 당뇨환자의 경우 한번에 치료목표값을 정상범위로 설정하면 저혈당의 위험이 늘어난다
분포가 치우쳐져 있는 경우에는 퍼센타일을 사용하는 것이 현실적이기도 하다
또한 이상값에는 위음성과 위양성값도 포함되어 있다

분포에서 벗어난 값은 정밀검사를 해야 하는 값일지 모르지만 빈도만을 기초로 이싱값을 정의하는 것은 통계학적으로나 임상적으로나 부적절 경우가 많다

(64)
(rate) 단위시간 내에 사건이 발생하는 또는 비율. 사건 발생속도. 율은 본래 속도를 의미. 단위는 /   /  %/ 등이 사용됨

유병률(prevalnece) 어떠한 시점에서의 비율이고 발생률(incidence) 관찰기간을 고려한 지표이다

 

발생밀도( incidence density) 기간 발생한 환자수 / 사람별 증상 미발생 기간의 총합 (인년수) 1년당 확률이나 발생속도로 일컬어지기도 한다

여기서 인년은 개인의 증상 발생까지의 추적기간(미증상 발생기간) 총합으로 연구시작시의 총인구 * (연구) 추적기간 이랑은 다르다

 

누적발생률(cumulative incidence) 기간 발생한 환자수 / 연구 시작시의 인구   . 사건 발생속도는 고려하지 않는다

 

유병률 (%) = 발생률(발생밀도) * 평균유병기간 

평균유병기간 = 유병률 / 발생률 (발생밀도

 

(66) 가능도비 : 민감도와 특이도를 하나로 합친  양성가능도비 = 민감도 / (1-특이도) . 검사 자체의 고유한 값이므로 검사전확률(유병률) 영향을 받지 않는다. 

검사전 확률은 병력및 신체소견으로 부터 예상되는 질환의 확률

검사후 확률은 검사가 양성일 질환일 확률 (양성예측도)

 

검사후 확률은 검사전 확률에 좌우된다( 베이즈 정리) . 아무리 민감도 특이도 가능도비가 높아도 유병률(검사전 확률) 낮으면 위양성이 증가해 검사후 확률이 떨어진다

 

(70) ROC 곡선(Receiver characteristics operating Curve)에서 좌측 구석에 가장 가까운 점을 Cut - off value 설정하면 민감도 특이도가 이론적으로 최적이 된다

민감도가 높은 검사 진단을 하지 못하고 지나칠 확률을 줄이고 싶을 선택 : 암의 조기진단시 치료가 가능한 경우

특이도가 높은 검사는 과잉진단을 하면 침습적인 치료나 추가적 검사로 사회적, 정신적, 금전적 신체적 비용을 유발할 확정진단 시에도 특이도가 높은 검사를 선택 . 유병률이 매우 낮을 때에도 검사후 확률을 높이기 위해 (위양성을 줄이기 위해) 특이도가 높은 검사를 선택

 

ROC 커브는 세로에 민감도, 가로에 위양성률을 위치시킨 검사의 진단특성곡선

 

AUC (Area Under Cureve) 넓을 수록 우월한 검사지만 면적에만 매몰되면 민감도, 특이도, 가능도비등의 검사특성을 잊게 된다

 

민감도, 특이도 가능도비의 95% 신뢰구간 구하기 

 

 

 

(74-5) 검사후 확률을 높이기 위해서는 1) 면담 진찰을 통해 환자의 배경인자, 증상, 병력, 진찰소견 문헌 정보를 참고로 실제 환자에서 가능성이 높은 감별진단으로 추려가면서 가능성을 산출해서 검사전 확률을 높이거나, 2) 가능도비가 높은 검사를 선택 검사후 확률을 높이는 것이 중요하다. 일반적으로 가능도비가 5 넘으면 유용한 검사로 간주된다. 마찬가지로 음성가능도비 0.2 이하이면 유용한것으로 간주

질환의 가능성을 생각하지 않은 막연히 검사를 하면 임상적 판단이 어려워진다

 

검사전 확률(유병률) 으로 부터 검사전 오즈를 구할 있다

검사후 오즈 = 검사전 오즈 * 가능도비

검사후 오즈로부터 검사후 '확률' 구할 있다 

O = P / (1-P) 이다 여기서 거꾸로 확률 P = O / (1+O) 라는 것을 알수 있다. 따라서 검사후 확률 =  검사후 오즈 / (검사 오즈 +1)

 

[예시] 관상동맥질환에서 운동부하 심전도의 민감도는 61% 특이도는 70%라고 가정해보자. 어떤 65 여성이 흉통을 호소하며 병원을 찾아와 진찰한 결과 관상동맥질환일 검사전 확률이 50% 예측되었다고 생각해보자

양성가능도비는 0.61/(1-0.70) = 2.03

검사전 오즈는 0.5 / 0.5 = 1

따라서 검사후 오즈는 1* 2.03 = 2.03

검사후 확률은 2.03 /3.03 = 0.67

검사 결과 양성이라면 검사후에 질환이 양성일 확률은 67% 상승하였다.

 

Fagan' s nomogram 이용하는 경우도 있다.

Medcalc 등의 통계프로그램에서도 계산 가능

 

(82) 임상적 유익성

아무리 위음성, 위양성이 적다 하더라도 검사 결과에 따라 예후나 치료방침이 변하지 않는다면 임상적 유익성이 없을 뿐더러 불필요한 추가검사나 비용증가를 초래. 만약을 위해, 혹은 검사부터 하자 정당화 없다. 스크리닝의 목적은 조기발견 조기치료에 의해 예후를 개선하고자 하는


(89)
위약의 필요성
평균으로의 회귀라는 통계학적 현상에 의해 언뜻 효과가 있는 보이는 경우 있다

(90) 
ITT
분석
Worst case scenario -
중도탈락자를 이벤트 발생으로 처리하는
On treatment
해석 - 실제 치료내용을 기초로 해석. 약효자체를 평가할 때는 적당하지만 ITT해석은 현실의 복용상태까지 반영해 치료의 부정적 효과와 작용도 평가할 있기 때문에 임상에서의 치료행위 자체의 효과 유효성 검토 가능

Effectiveness - ITT .
순응도등 현실을 반영
efficacy - on treatment

(94)
예후요인과 임상요인은 일치하지는 않는다
카플란 마이어 법을 이용한 그래프는 가상 그래프로서 실제수를 그대로 반영하지 않으므로 주의가 필요

(95)
사망률 치사율
사망률 : 사망자수 / (사망자 + 완치자 + 현재 이환중인 환자)
치사율 : 사망자수 / (사망자 + 완치자)

(98)
임상연구는 무엇을 규명하고 싶은지 가설로 설정, 명문화 하는 것으로부터 시작된다

문득 생각이 나서, 아무 계획없이 실시하는 데이터수집은 바이어스로 인해 방향성을 잃을 아니라 통계적 유의성이 없다면 정말로 차이가 없는 것인지 아니면 디자인 표본수 문제로 차이를 검출할 없었던 것인지 구별할 없게 된다. 통계적 유의성이 있어도 우연인지, 편견이나 교란변수 때문인지 알수 없게 된다. 따라서 적절한 평가를 위해서는 연구 시작전에 미리 연구가설을 세우고 그것을 기초로 프로토콜 작성

# EBM
순서
1)
임상문제의 도식화 - 임상연구의 가설구성과 비슷
2)
문헌검색 - 가설검정이 올바르지 않은 문헌 제외 
3) Critical Appraisal :
결과의 타당도와 중요성의 검정
4)
임상판단 : 실제 환자에 대한 적용

#
가설 검정형 연구와 가설제시형 연구
학회수준의 발표나 증례보고는 가설제시의 수준으로 가설을 사전에 설정하는 것이 아니라
데이터 분석후 사후에 가설을 제시
결정적이지 않아서 에비던스로의 수준은 낮지만 무의미하지는 않다 

가설검정형 연구는 endpoint 숫자가 적지만 가설제시형 연구는 많다
가설 검정형 연구는 기존에 가설을 입증할 만한 연구들이 존재한다

(101,118)
통계학적으로 유의한 차이가 있다는 것과 임상적인 의미가 있다는 것은 별개이다
논문의 결론은 어디까지나 저자의 해석일 뿐이다

애시당초 가설단계에서 임상적 의의가 없다면 굳이 검정을 필요도 없다 

얼마 안되는 미미한 차이라도 표본수를 늘리면 유의차가 발생할 있다. p값이나 신뢰구간으로만 판단하지 말고 임상적 의의 특히 절대위험도나 NNT 합쳐서 평가해 필요가 있다

[
참고] 골다공증에서 T값은 30세의 평균값을 기준 Z값은 같은 연령, 성별을 기준으로

(102)
내적타당도 - 연구 결과 자체는 사실일지 몰라도 그것이 진실은 아닐수도 있다. 우연이나 바이어스가 있을수도 있다

(104)
귀무가설과 검정
임상연구는 표본을 분석하는 것이고 검정은 표본분석결과를 바탕으로 모집단(진실) 추정값을 평가하는  

검정 : 검정이라는 것은 표본의 분석결과(사실) 바탕으로 진실값의 확률적 판단을 하는
일단 무엇이든 검정한다는 식의 발상은 버릴
BIAS
없거나 보정될 있다면 우연의 영향에 의한 오차 (random error) 통계학상 계산이 가능하여 지정 평가도 가능. 이러한 통계학적 검정에 의해 확률을 기초로 객관적 평가가 가능해짐
많은 검정법이 정규분포를 가정해서 실시되지만 일단은 데이터 분포형을 확인해 그에 맞는 가설검정법을 선택해야 하마 

귀무가설 : 군과의 차를 증명하는 검정에서 '차이가 있다' 것은 주관적으로 완전히 실증하기에는 어려움이 따른다. 그래서 '차이가 없다' 것을 가정(귀무가설) 한다. 우연의 영향은 끊임없이 존재하므로 '차이가 없다' 것도 사실 실증하기는 불가능하다
따라서 실제로 나온 차이가 우연의 영향으로 발생한 (본래는 차이가 없는데 어쩌다가 발생한) 확률을 계산해 확률이 작다면 차가 우연히 발생한 것으로 생각하기 힘들기 때문에 귀무가설을 기각하고 유의한 차이가 있음으로 판정 
-
검정을 위한 통계학 상의 가설로 임상연구 자체의 본래의 가설 (연구가설 혹은 작업가설) 아니다 


(108)
단측검정을 실시하는 경우
이미 선행연구가 진행되서 치료군이 대조군에 비해 열등하지 않다는 방향성을 가진 연구가설인경우에는 단측검정 실시


(109,118) P-value
p-value
작을 수록 차이가 있다는 것이 '확실해진다' 라는 뜻이지 차이가 '크다' 라는 의미는 아니다 
유의확률은 귀무가설을 잘못해 기각하고 가능성(위험성) 뜻한다 
하지만 유의수준 0.05 라는 것은 관습 합의를 기초로 것으로 임상적 과학적 근거는 없다. 그래서 P 수치를 직접 표현하기도 한다 

 

.(119) 증례 보고는 가설의 제창에 지나지 않는다 연구 전에 가설이 세워지지 않은 것은 한계점이다


(123) ebm
대전제가 되는 것은 임상능력과 의사소통 능력 - 무조건적인 검사 중심주의를 탈피해 병력과 신체소견을 중시하는 기초진단학을 원점부터 공부필요 
근거를 기초로 의학이지 에비던스 지상주의가 아니다 

비판적 읽기는 임상경험이 없어도 가능하지만 ebm 실천은 임상능력이 있어야 가능

(125)
시점에서 신뢰할 있는 최상의 근거를 이용
하지만 에비던스로 임상적 결단을 내리라는 것은 아니다 최종판단은 환자를 가장 이해하고 있는 주치의를 중심으로 판단
목적별로 적합한 연구
진단 - 이환 가능성 높은 환자 대상의 단면적 연구 / 예후 - 초기부터 추적관찰하는 코호트연구 / 치료 예방 - rct / 병인 위험요인 - 코호트, 환자 대조군 연구 / 부작용 - 모든 디자인 

(127)
가이드라인
근거가 되는 임상연구의 수준과 참고문헌을 명기하지 않으면 이용할 필요 없다

(129)
임상통계학은 경험을 부정하거나 대체하려는 것이 아니다
임상통계학은 이론 임상능력 경험으로 처리할 없는 회색영역에서 힘을 발한다 

유병률은 역학적 조사로 알수 있지만 검사전 확률은 주차의의 경험이 가장 중요

(유병률은 집단에 대해서 검사전 확률은 개인에 대해서 이용

(130)
일반적으로 상대위험도의 감소는 인종이나 위험인자에 관계없이 보편적이나 절대위험도는 다르다

(132)
상관 - 직선 이외의 관계는 상관계수로 불분명하므로 산포도를 확인할 필요
로지스틱 회귀분석에서 본래 오즈비는 환자 대조군 연구에서 사용하는 것이지만 표본수가 많으면 상대위험도에 가까워지므로 코호트 연구에서도 사용가능

(134)
일반적으로 추적률이 80% 밑도는 경우에는 타당도와 정밀도가 저하 
[
인과관계 판단조건]
관련의 시간성 - 사건발생전에 폭로되었나
관련의 견고성 - 반응 관계가 성립되는가
관련의 특이성 - 질환이 있는 곳이 요인이 존재하고 요인이 있으면 질환이 존재하는가?
관련의 일치성 - 관련의 보편성 (사람 장소 시간) 나타내는 연구가 있는가
관련의 적합성 - 기존지식과 모순되지 않는가

(136)
신뢰도와 타당도
타당도 - 정말로 목적으로 것을 측정하고 있는가 유효성 / 우연의 영향에 의한 분산(random variation)
신뢰도 - 재현성 정밀도 / 관찰자 간의 일치성

연속값은 타당도(치우침 진실에서의 어긋남) 신뢰도(변동계수)
범주형은 타당도 (골든 스탠다드를 기준으로 민감도 특이도) 신뢰도(신뢰구간)

(144)
진단의 과정과 증상, 신체소견 / 스크리닝

임상진단은 환자의 주소에서 시작되어 병력, 신체검사 소견등의 단계를 밟아나가서 감별진단을 좁혀가다가 최종적으로 특이도 높은 검사로 진단을 추려낸다 (참고 SPPIN) 

따라서 병력청취나 진찰은 막연히 하는 것이 아니라 항상 감별진단을 염두에 두면서 전개한다. 그렇게 함으로써 중점을 둬야 병력상의 포인트나 진찰해야 신체소견이 명확해진다

 

국내 진단학 교육에서는 환자면담이나 진찰을 형식적으로 가르칠 실제 임상에서는 즉시 검사로 건너뛰어 이상검사값을 찾아내는 것이 현실이다. 하지만 그러면 검사전 확률이 낮아지므로 위양성만 증가해 검사의 유용성이 떨어진다. 절대적인 확정적 검사는 없기 때문에 결과적으로 불필요한 검사만 늘어나 버린다

 

★★★ 임상소견도 검사이다 -

증상, 신체소견 등의 임상소견은 민감도, 특이도, 가능도비를 갖춘 훌륭한 검사이.

임상소견으로 감별진단의 확률을 크게 변화시킬 있으므로 ★★★  대부분의 질환은 환자면담과 진찰만으로 진단이 가능하다. 진단을 한다는 것은 유병률에서 시작해 다양한 정보를 기초로 질환 확률을 높여나가는

 

참고문헌 ) The Rational Clinical Examination (JAMA) 

 

# ★★★ 검사를 하기 전에 검사 결과에 따라 진단의 확실성이나 치료방침이 변하는지 검토하는 것이 중요하다 

언제 검사나 치료를 것인가?  - 

검사전 확률이 낮고 검사에 따라서 검사후 확률이 높아질 확률이 높아질 가능성까지 낮다면 굳이 검사나 치료를 필요는 없다 

반대로 검사전 확률이 높다면 검사를 해도 검사후 확률이 많이 높아지지 않기 때문에 검사 없이 그대로 치료단계로 넘어간다

사이에 속하는 회색영역에서 유효한 검사를 추가해 검사후 확률을 높인 후에 치료에 들어간다. 이경우 진단 과정 속에서 질환 확률이 치료역치를 넘은 시점에서 치료를 시작한다치료 역치는 검사전 확률(유병률) 치료에서 얻어지는 편익에 의해 결정되며, 의사의 경험이나 환자의 의향에 따라 좌우된다(검사후 확률과 질환을 치료해야 질환확률 치료역치를 비교해 검사를 하는 것이 의미가 있는지 결정한다는 의미) , 치료법의 유효성이 증명되어 있어야 한다.   진단 확실성이나 치료방침이 변하지 않는 검사라면 오진, 비용, 위해가 늘어날

물론 긴급성이 높은 질환은 치료를 우선 

의학적으로 증상을 설명할 없는 경우에는 어떤 검사를 해도 진단으로 이어지지는 않는다 

=> 한의학적 치료범주에 해당할 있다

 

# 임상방침의 결정과정

1) 질환의 특성( 중증도, 긴급도, 예후) 평가

2) 유병률 검사전 확률 산정

3) 치료 역치의 평가

4) 검사를 하는 의미 확인 ( 검사후 확률이 높아질 가능성이 있는가?)

5) 검사후 확률 산정

6) 치료법의 효용, 위해, 비용 평가

 

(151) 스크리닝 검사 

타당도(민감도, 특이도) 높은가? 신뢰도(재현성, 정밀도) 높은가 확인

아무리 정확하고 안전한 검사라고 해도 수진률이 낮거나 진단된 환자의 후의 치료에 대한 순응도가 낮으면 검진으로서의 의의가 떨어진다

너무 희귀한 질환이나 중증도가 낮은 질환이라면 스크리닝 검사를 가치는 아무래도 줄어든다

 

(151) 새로운검사

새로운 검사가 등장하면 1) 결과를 어떻게 해석할 것인가? (타당도는 확립되어 있는가?) 2) 치료방침이 변하는가? 3) 예후가 개선되는가? 4) 비용과 편익의 균형은 이루어지고 있는가? 먼저 고려하는 것이 중요

 

 (156) NNT

NNT 100명이라면 100명에게 약을 처방해야 비로소 사람의 사건 발생이 줄어드는 것이므로 언뜻 효과가 작은 보일지 모릅니다. 그러나 ★★★ 전국적인 규모로 생각하면 예를 들어 고지혈증과 같이 환자의 수가 100만명이나 되는 질환에서는 투약에 의해 1만명의 심근경색을 예방할 있게 되므로 의의는 결코 작지 않다. 이는 사회적 영향이 감염병에 대해서도 같다

 

NNT = 1/ARR = 1/ (PEER * RRR) 

PEER 대조군의 사건 발생률. 절대위험도 감소를 계산하지 않아도 구할 있다

 

[그림2 ] NNT 산출하는 계산도표 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(153) 오즈비, 상대위험도, 상대위험도 감소의 표준오차와 신뢰구간의 산출방법

P. 153 그림 참조

 

 

(158) 생존곡선

생사불명의 탈락한 증례의 추적을 중단(Censor)으로 하고 관측구간에서 실제로 생사를 확인할 있는 대상자의 수를 분모, 생존수를 분자로 비율을 기초로 생존곡선을 순차적으로 그려나간다 . 따라서 생존 곡선은 연구 시작시의 대상자 전체에서 차지하는 시점의 생존자의 실제비율이 아니라 추적시간마다 분모가 달라지는 가상계산값이 된다

탈락이 되는 사례는 추적을 종료하기 직전에는 생존하고 있지만 종료 어느 정도나 생존하는지는 불분명하다.Kaplan - Meier 해석법은 도중에 중단된 증례를 관찰할 없었던 부분은 이상 장기에 걸쳐 관측된 증례의 생존률에 따른다는 가정을 기초(단위 측정시간마다의 사건 발생률로부터 누적 사건 발생률의 추이를 추측) 하고 있다

사건 발생곡선이나 생존곡선을 읽을 때에는 표시되는 것이 실제 사건수인지, 추정에 의한 것인지 주의 

 

(163) 샘플수의 산정

임상연구 표본수를 산정할 예비 연구등을 기초로 산출하지 않고 적당히 계산하면 유의하지 않은 결과가 나왔을 정말로 연구의 결과 가치가 없는 것인지 혹은 표본수가 적어 유의하지 않은 것인지 구별할 수가 없다

대규모 연구는 반대로 표본수가 많이 통계학상 유의차가 나온 것일 임상적 의의가 적은 경우도 있으므로 표본수 만으로 임상연구의 가치를 결정해서는 안된다

드문 질환을 확실하게 검출해 내려면 관측대상 수는 발생률의 역수의 3 이상이 필요하다 

신뢰구간이 넓다고 해서 타당도가 낮은 것은 아니다

 

[Critical Appraisal 사례1 172-175]

연구를 통해서 

hs-CRP 자체가 원인물질인지, 단순한 마커인지는 완전하게 구명되어 있지 않다

hs-CRP 콜레스테롤 보다 영향도가 크다는 결과가 나왔다고 하더라도 그것이 위험요인으로 LDL 콜레스테롤을 대신할 있다는 뜻은 아니다

 

[Critical Appraisal 사례2 176-180]

연구는 검사의 진단특성을 해석하는 것이 목적이므로 생명예후에 대한 영향은 불분명하며 피폭량도 무시할 없을지 모른다

고도의 의료기관에서 숙련된 의사에 의한 삼차원 CT 진단은  타당도가 높았다. 하지만 미소병변의 민감도 특이도가 낮다.

폴립을 모두 절제하거나 대정내시경으로 확인해 결정한다면 처음부터 대장내시경을 하는 쪽이 유효성이 높을 것이다

평탄형 폴립은 CT 검출이 불가능 하며 일반의료시설에서는 민감도 특이도가 낮아서 CT 대장내시경을 대신하는 것은 연구가 발표된 시점에서는 결론 내리기 불가

 

[Critical Appraisal 사례3 181-184]

여성호르몬 심혈관 위험. 여성은 여성호르몬의 영향으로 심혈관 위험이 적은것으로 알려져 있다. 하지만, 이론을 기초로 장기간에 걸쳐 실시된 치료가 임상시험의 보고에 따라 중지, 변경되는 예시. 병태생리학이라는 이론이나 경험에는 한계가 있다

또한 관찰연구(Nurse's health study) 결과를 RCT(WHI 연구) 뒤집었다

하지만 당시 연구로 최종판결을 내릴수 없었다. 그러나 당시 시점에서 입수가능한 최선의 실증이라는 임상적인 의의를 가졌던 연구

복약순응도가 40% 낮았다는 것도 고려사항 

 

 

[부록3 추천도서]

http://blog.naver.com/julcho/40185683486

여기에 추가 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
처음 처음 | 이전 이전 | 1 | 2 |다음 다음 | 마지막 마지막