대략 100년 전 미국에서 “폴리애나”라는 동화가 출간됐다. 주인공인 “폴리애나”는 오랫동안 미국 문화에서 초낙천적인 성격의 대명사로 사랑받았다고 한다. 고아가 되어 이모 집에서 살게 된 폴리애나가 “모든 일에는 좋은 면이 있으니 그것을 찾아보자”하는 태도로 이모의 구박을 이겨내고 행복하게 살면서 주변 사람들한테도 그런 태도를 퍼뜨린다는 이야기다.
1969년 미국의 두 심리학자는 여러 문화권 언어들을 비교해 보고, 어떤 언어이건 긍정적인 뜻인 단어가 종류도 많고, 더 자주 사용되고, 다양한 문맥에서 사용된다고 “폴리애나 가설”을 세웠다. 이 가설을 검증하는 연구는 많이 있어서 특별히 새로울 것은 없지만, 며칠 전 새로 나온 이 논문에는 재미있는 점이 두 개 있다.
첫 번째, 10가지 언어에 대한 말뭉치에서 뽑은 단어를 모국어 사용자들에게 알바로 긍정-부정 지표를 매기게 시켜서 그 정도를 비교해 보니까 스페인어가 긍정적 단어가 가장 많이 사용되고, 중국어가 가장 덜 긍정적이었다. (한국어도 중국어와 비슷하다.) — 다만 이 부분은 말뭉치가 너무 작고 텍스트의 종류도 달라서 그냥 재미로 해 본 정도로 볼 수 있겠다.
두 번째, 이 논문 figure 4가 아주 멋진데, 소설 3권 (모비딕, 죄와 벌, 몬테크리스토 백작)을 놓고 소설의 진행 순서에 따라서 긍정적 단어와 부정적 단어의 빈도 변화를 딱 그렸더니만, 기승전결과 갈등구조가 똭! 하고 보이는 것! 이런 분석을 이용하면 스토리 구조가 비슷한 책을 보여준다거나, 하이라이트 부분을 자동으로 찍어서 그 부분을 보여줄 수도 있겠다. 다른 책도 찾아볼 수 있게 사이트도 만들었다. 해리포터를 보니까 그럴 듯 하다. ㅎㅎ;