2007 대선 득표수와 구글검색결과의 관계

선형회귀식: {득표수} = 1.257 × {구글검색결과} - 634445

  • 구글검색결과와 실제 득표수의 Pearson 상관관계: 0.98796
  • 동아일보 마지막 여론조사와 실제 득표수의 Pearson 상관관계: 0.98598
  • 네이버검색결과와 실제 득표수의 Pearson 상관관계: 0.95919

댓글 13 개 | 트랙백 2 개 (보낼곳) | 태그 life


트랙백
2008-01-14 12-29
2007 대선 득표수와 구글검색결과의 관계 (perky)

설명이 필요없을 정도로 리니어.

2008-01-14 12-29
2007 대선 득표수와 구글검색결과의 관계

과연 놀랍군요. 특히 마지막 세 줄의 상관 관계를 볼 때 네이버랑은 비교도 안될 정도로 구글이 정확하네요. 네이버의 검색 결과가 더 왜곡을 많이 받는다는 반증일까요.. (이 쪽은 상관관계에서 소수점 이하 몇자리의 1만큼 차이나도 엄청나게 많이 다르죠)

구글검색결과와 실제 득표수의 Pearson 상관관계: 0.98796
동아일보 마지막 여론조사와 실제 득표수의 Pearson 상관관계: 0....


댓글
이정민  ▒
구글신께서 차기 대통령을 점찍어 두고 계셨던것이군요!!
2007-12-21 16:47
오호; 이런 상관관계가!! 멋진데요? ㅎㅎ
오른쪽으로 치우쳐있으면 실제보다 인터넷에서 더 유명한 거군요 +_+a
2007-12-21 18:39
yong27  ▒
2007-12-21 19:42
놀랍네요!
2007-12-22 16:07
참고로 말씀드리면, 네이버가 구글보다 심하게 떨어지는 상관관계가 나온 건 전관 후보 검색 내용에서 "전관예우"나 "삼성전관"같은 것들이 같이 걸려 나와서 그런 영향이 큽니다. 그렇지만, 전관 후보를 빼더라도 구글보다 네이버가 상관관계가 많이 낮긴합니다.
2007-12-23 02:21
김창준  ▒
"구글검색결과"는 언제 시점으로?
2007-12-23 11:44
금요일 오전에 검색했었는데요, 결과를 봐서는 아직 당선 이후의 문서들이 크게 반영되지 않은 것 같더군요. 원래 구글이 일부 블로그 글들을 빼고는 한국어 사이트들 업데이트가 좀 느리니까
2007-12-23 13:13
실례인지 모르겠습니다만 출처나 경로를 알 수 있을까요? 네이버와의 대조라던가 '지지율'이 아니라 '검색 횟수'를 토대로 한 결과가 이 정도로 나오는 것은 흥미롭습니다만, 인과관계상 구글에 많이 검색된 후보가 당선이 된 것이 아니라 이 경우엔 그저 구글이 또다른 여론조사의 기능을 수행한 것이 아닌가 싶습니다.
2007-12-24 04:23
예. 저도 그런 생각도 들고 해석에 대해서는 성급히 단정지을 수 없을 것 같아서, 일부러 사실만을 제시하고 글 안에서는 제 의견을 쓰지는 않았습니다.

자료는 제가 직접 검색창에 쳐서 받아온 결과입니다. 수치자료는 <a href="http://spreadsheets.google.com/pub?key=pWRBaY2ZM7mQxHfvYg6n6Vw">여기에 올려뒀습니다</a>.
2007-12-24 13:13
오~ 플로팅패키지가 뭔가요?
슬쩍보면 matplotlib같은데...
한글이 되는군요!! :)
2007-12-26 11:33
matplotlib으로 한글을 쓰려니까 tex에서 한글 패키지를 깔아야하더군요;
그래서 한참 포트를 만들다가 갑자기 귀찮아져서 그냥 뽑아낸 다음에 gimp로 편집해서 한글을 넣었습니다. _-_;;;
2007-12-26 16:23
lshlj  ▒
안녕하세요. 재미있는 결과네요.

학생들끼리 하는 모 학회에서 하게 될 포스터 발표에서 이 결과를 인용해도 될까요? :)
2008-01-14 11:54
예 얼마든지 인용하셔도 괜찮습니다. 다만 제가 이 글에서 뭔가를 주장하지는 않는 점을 주지해 주시면 좋겠습니다. :)
2008-01-14 12:29

글이 올라온 지 30일이 지나 새 댓글은 쓸 수 없습니다.

누구?

장혜식 (Hye-Shik Chang)
내일을 사랑하는 소년(!)

최근 댓글