지역별로 질병 발생 정도를 추정하는데 활용되는 Google Trends

Google Trends는 Google 사용자가 사용하는 검색어를 통해 미래를 예측하는 데 활용되고 있다.   대표적인 예로 flu (독감) 환자가 지역별로 얼마나 발생하고 있는지를 추정하는데에 사용되는 Google Flu Trends를 들 수 있다.  

전세계적으로 수백만명이 매주 온라인 상에서 건강과 관련된 정보를 검색하고 있다.    독감이 발생하는 시즌이 되면 독감과 관련된 검색이, 엘러지 시즌이 되면 엘러지와 관련된 검색이, 그리고 여름에는 sun-burn 관련 검색이 증가한다.    Google Trends를 이용하면 어떤 검색이 얼마만큼 빈번하게 수행되고 있는지 알 수 있다.   

아래 그림은 2004년부터 현재까지 5년 동안 중부 Atlantic 지역의 Google Flu관련 검색어 빈도수 (Google Flu Trends) 와 실제 그 지역에서 발생한 Flu 환자수 (CDC data) 를 함께 보여주고 있다.   두 자료간에 매우 높은 상관관계가 있음을 알 수 있다.   따라서 Google의 질병 관련 검색어 빈도수를 보면 실제 환자 발생수를 정확하게 예측할 수 있다고 할 수 있다.  

CDC는 미국에서 질병 발생 상태를 파악하기 위해 매주 수 많은 의료기관으로부터 질병 발생 관련 자료를 수집하고 있다.   자료를 수집하는데에는 1-2주가 소요된다.   자료 수집에 많은 노력과 시간이 소요된다.   하지만 Google Trends를 사용하면 실시간으로 그리고 자동적으로 flu 발생을 정확하게 추정할 수 있다.   Google Trends 의 진정한 가치를 알 수 있다.   Google Trends는 질병 뿐만 아니라 앞으로 다양한 분야의 추정과 예측에 활용될 수 있을 것이다.

  annual_cdc_comparison

2 Responses to 지역별로 질병 발생 정도를 추정하는데 활용되는 Google Trends

  1. Google 의 검색어들이 마치 Data Mining 기법을 이용해 다양한 분야를 추정하고 예측하는데 이용된다는 점이 흥미롭네요. 국내에서도 이런 검색어들을 활용할 분야들이 무궁무진할 것 같습니다.

  2. 세상에…검색시장이 왜 무궁무진하다는지 짐작하게 해주네요~

댓글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. Log Out / 변경 )

Twitter picture

Twitter의 계정을 사용하여 댓글을 남깁니다. Log Out / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. Log Out / 변경 )

%s에 연결하는 중