Google Trends는 Google 사용자가 사용하는 검색어를 통해 미래를 예측하는 데 활용되고 있다. 대표적인 예로 flu (독감) 환자가 지역별로 얼마나 발생하고 있는지를 추정하는데에 사용되는 Google Flu Trends를 들 수 있다.
전세계적으로 수백만명이 매주 온라인 상에서 건강과 관련된 정보를 검색하고 있다. 독감이 발생하는 시즌이 되면 독감과 관련된 검색이, 엘러지 시즌이 되면 엘러지와 관련된 검색이, 그리고 여름에는 sun-burn 관련 검색이 증가한다. Google Trends를 이용하면 어떤 검색이 얼마만큼 빈번하게 수행되고 있는지 알 수 있다.
아래 그림은 2004년부터 현재까지 5년 동안 중부 Atlantic 지역의 Google Flu관련 검색어 빈도수 (Google Flu Trends) 와 실제 그 지역에서 발생한 Flu 환자수 (CDC data) 를 함께 보여주고 있다. 두 자료간에 매우 높은 상관관계가 있음을 알 수 있다. 따라서 Google의 질병 관련 검색어 빈도수를 보면 실제 환자 발생수를 정확하게 예측할 수 있다고 할 수 있다.
CDC는 미국에서 질병 발생 상태를 파악하기 위해 매주 수 많은 의료기관으로부터 질병 발생 관련 자료를 수집하고 있다. 자료를 수집하는데에는 1-2주가 소요된다. 자료 수집에 많은 노력과 시간이 소요된다. 하지만 Google Trends를 사용하면 실시간으로 그리고 자동적으로 flu 발생을 정확하게 추정할 수 있다. Google Trends 의 진정한 가치를 알 수 있다. Google Trends는 질병 뿐만 아니라 앞으로 다양한 분야의 추정과 예측에 활용될 수 있을 것이다.










Google 의 검색어들이 마치 Data Mining 기법을 이용해 다양한 분야를 추정하고 예측하는데 이용된다는 점이 흥미롭네요. 국내에서도 이런 검색어들을 활용할 분야들이 무궁무진할 것 같습니다.
세상에…검색시장이 왜 무궁무진하다는지 짐작하게 해주네요~