서로 모순되는 연구결과들이 양산되고 있다

Open data 사이트들이 활발히 사용되고, data mining 기법들이 발달하면서 데이터 분석이 한결 쉬워졌다.   그래서 그런지 다양한 연구결과들이 최근 많이 발표되고 있는데, 그런 가운데에서 서로 상충되는 연구 결과들도 많이 나타나고 있다.   예를 들면,  아스피린이 심장을 보호하는 긍정적인 역할을 한다는 연구 결과가 있지만 내부 출혈을 유발하는 부정적인 역할을 한다는 연구 결과도 있다.    커피의 경우에도 몸에 좋다는 연구 결과와 함께 삼가야 한다는 연구 결과가 발표되었다.    왜 이런 현상이 벌어지고 있을까?

이는 주어진 data에서 다양한 분석들이 쉽게 수행되면서 유의 수준 5% 미만에서 발생하는 통계적 오류 역시 발생할 가능성이 크게 증가했기 때문이라고 할 수 있다.       

Source:  The Dangers of Too Much Data 

관련 Post:

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중