[알림] 이 글의 전개에 사용된 자료의 일부는 주관적 판단에서 도출된 것이므로, 전체적인
논리와 결론, 설명 등이 과학적으로 부정확할 수 있으니, 너무 진지하게 받아들이거나 정확한
결론으로 오인하지는 마시길 부탁드립니다.
KBS에서 오랫동안 방송하고 있는 미녀들의 수다를
작년부터 심심할 때 재미있게 보고 있었습니다. 여기서는 외국인 여성들이 4×4격자로 한 회에 16명씩
출연하는데.. (벌써 숫자부터가 심상치가 않습니다;; 2비트씩 총 4비트 어드레싱!)
항상 같은 사람이 나오는 게 아니라 일정 출연자 풀을 두고 약간씩 바뀌다보니 제작진이 때에 따라
자리를 배치합니다. 시청자들도 물론 어느 정도 패턴을 파악했겠지만, 작년 11월에 방영된
50회에서 출연자인 “따루”가 “뒷 줄보세요. 노처녀들 맨날 다 여기 앉았잖아요. 앞에 어리고 이쁜
애들 다 앉고~” 라고 얘기하면서 물위로 “꿍꿍이”가 떠올랐는데요. 그래서 그 때 과연 꿍꿍이가
어느 정도 수준인가 구체적으로 분석해보면 재미있을 것 같아서 이 분석을 하게 됐습니다. -ㅇ-;
우선 자리 배치를 어떻게든 데이터로 갖고 있어야하는데, 검색해 봐도 자리 배치가 데이터베이스화
되어 있는 곳은 따로 없어서 직접 방송 전 회를 다 확인해서
데이터베이스로 만들었습니다. ;;
(혹시 더 분석해 보실 분들을 위해 공개합니다;;;;)
1회에서 63회까지 중에 13회와 23회를 뺀 총 61회분인데, 각각 설날특집, 개편기념 특집이라
자리 배치가 4×4가 아니다보니 이질적인 데이터라서 뺐습니다.
그래서 확인해 볼 가설들은 다음 것으로 정했습니다.
- “어리고 이쁜 애들”이 정말로 집중적으로 앞에 앉는 경향이 있는가?
- 제작진이 주장하는 해당 회차의 주제에서 재미있게 말할 수 있는가가 정말로 자리에 반영되는가?
- 어느 줄이 진짜로 좋은 줄인가?
- 세로줄 말고 가로줄은 영향이 없는가? 그리고, 세로줄과 가로줄의 상관관계가 있는가?
- 52회 이후 따루가 아랫줄로 내려왔을 때 다른 사람들도 영향을 받았는가?
먼저 대부분 가설들이 “어리고 이쁜 애들”과 관련되어 있기 때문에, 어떻게든 정량적 통계를 적용하려면
그 정도를 정량화를 해야하는데, 사람마다 취향이 다르고 정량화를 하는 것도 여러 모로 문제가 많을
수 있기 때문에, 직접적으로 “어리고 이쁜” 정도를 정량화 하지는 않고, 시청자가 선호하는 정도에서
언어와 관련된 부분을 따로 떼서 나머지 부분을 “선호도”라는 주관적 기준으로 적용했습니다.
즉, 제가 마음대로 숫자를 줬다는 얘기죠 –;; 이 데이터는 인격권과 여러 가지 문제가 다분히 있을
수 있기 때문에, 통계에서도 직접적으로 노출되는 부분에는 사용하지 않고 데이터도 공개하지
않았습니다. 그리고 나머지 “해당 주제를 재미있게 말할 수 있는” 정도를 또한 제가 마음대로 정량화
해서 데이터를 만들어서 이 두 가지와 자리의 상관관계를 먼저 조사했습니다.
뭔가 의도에 맞춰 자리가 배치되었는가?
이 그래프는 카메라에서 보는 위치와 출연자의 선호도 평균값을 나타냅니다. 원 안의 색깔은
언어외선호가 낮을 수록 붉은색, 클 수록 밝은 초록색 (평균은 검은색)으로 나타납니다.
그리고 원의 크기는 해당 위치 출연자 데이터의 표준편차입니다. 대충 경향을 뚜렷히 눈으로
볼 수 있듯이, MC와 가장 가까운 왼쪽 맨 아랫줄 자리가 역시 가장 선호가 높은 자리로 볼 수 있고,
위로 갈 수록 낮아지는게 예측과 일치합니다. 그런데, 하나 예상과 다르게 나타난 것은 경향이
줄마다 있는게 아니라 약간 왼쪽으로 경사가 30도 정도 있습니다!
그 경향을 조사하기 위해서 몇 도를 회전하고 선형회귀를 했을 때 가장 목표값(선호도)과 상관관계가
높은지 보면, 25.8도를 회전했을 때 가장 높게 나타나는데 그 r값이 -0.974가 나옵니다.
물론 주관이 개입되었으므로 자주 보는 사람이 선호가 높은 등의 여러 문제가 있을 수도 있지만,
0.97이라면 그런대로 높은 상관관계라고 볼 수 있겠습니다. 그런데, 왜 25.8도를 회전해야 결과가
나왔는지를 조사해보자면, 패널 자리의 왼쪽은 MC와 방청객이 있기 때문에 카메라가 주로 오른쪽에서
접근하게 되는데, 대략 패널에 접근하는 카메라의 각도가 평균이 그 정도 되는 게 영향을 주지 않았나
생각됩니다.
그런데, 분산은 맨 아랫줄 2번째 자리와 2번째 줄 맨 오른쪽 자리가 분산이 상당히 적게 나왔고 다른 부분은
비슷한데요, 이 자리 둘에 대해서는 은연 중에라도 진짜 일관된 기준으로 배치한 것 같습니다.
그래서, 왼쪽 맨 아랫줄을 기준으로 잡아서 회전한 가로축에서의 거리를 “중심거리”로 정의해서
이를 자리가 제작진이 얼마나 별도의 기준에 따라서 배치하는가에 대해 아래에서 좀 더 조사를 했습니다.
반면에, 각 패널이 얼마나 한국어에 능숙한지를 가지고 관계를 보면 윗 그래프와 같이 전혀 다른 결과가
나옵니다. 언어에 능숙할 수록 뒤로 가는 경향이 있고, 왼쪽 맨 아래 자리만 유독 한국어에 미숙한
패널이 고정적으로 출연하는 자리로 잡힙니다. 그런데, 이 경우에는 경향이 있기는 해도 앞의 그래프만큼
뚜렷한 상관관계까지는 아닌 것으로 보입니다. 역시 “꿍꿍이”의 실체는 “어리고 이쁜 애들”에 훨씬
치우쳐져 있음을 알 수 있습니다.
각 자리들끼리 비슷한 패널이 앉는 자리가 있나?
어느 자리가 좋은지를 주관적인 데이터로 결론을 도출했기 때문에, 좀 더 객관적인 데이터로 경향을
참고해 볼 필요가 있어서 각 자리별로 해당 자리의 출연자와 다른 자리 출연자의 구성이 얼마나
비슷한가를 조사했습니다. 여기서는 1~2회만 출연한 사람들은 비교가 큰 의미가 없기 때문에,
10번 이상 출연한 31명에 대해서만 비교하였습니다.
밝은 초록색은 강한 상관관계, 붉은색은 아주 약한 상관관계, 검은색은 평균입니다.
11은 맨 앞줄의 맨 왼쪽을 의미하는데, 11과 3번째 줄 이후로는 다른 자리들보다 특별히 다른 것을 알 수
있습니다. 비슷한 부분을 보면, 맨 뒷줄의 왼쪽 3자리가 서로 굉장히 비슷하고, 맨 앞줄 중간 2자리와
그 다음 줄 중간 2자리가 서로 비슷합니다. 맨 오른쪽 자리들은 옆 자리들과 유사도가 좀 따로 노는데요,
이건 아무래도 맨 오른쪽 줄에 주로 키가 큰 패널들을 주로 배치하는 경향이 있어서가 아닌가 싶네요.
시간이 지나면서 꿍꿍이가 강화되거나 약화되었는가?
처음엔 의도가 없다가 중간에 생기거나, 패널 풀이 커지면서 다양성이 확보가 되었는지 등의 경향을
보기 위해 각 패널의 주변 5회에서 “중심거리”가 얼마나 변하는지 조사해 봤습니다.
윗쪽 그래프는 각 회별 주변 5회에서 연속 5회 모두 또는 4번 이상 출연한 패널이 얼마나 되는지를
나타내는데요, 처음에는 5번 모두 출연한 패널이 10~12명까지 되다가 점점 떨어지는 경향을 보면
패널이 다양화되는 경향이 좀 있는 걸 알 수 있습니다. 17회, 33회, 41회 같이 파란색, 빨간색이 위 아래로
피크가 반대로 떨어지는 곳을 보면, 둘이 따로 놀지 못하는게 역시 바뀌어 봐야 그 사람이 그 사람이란
걸 알 수 있구요.
아랫쪽 그래프를 보면, 처음엔 편차가 높다가 점차 뚝뚝 떨어지고 있는데요. 처음엔 자리잡기 전이라
좀 자리를 자주 여기저기 옮겨보다가 안정화 되고 나서 의도를 가진 꿍꿍이 배치가 시작된 것 같군요.
19회 ~25회 사이를 보면, 연속출연자는 상당히 많은데도 중심거리 표준편차가 뚝 떨어진게, 사람은
안 바뀌고 자리는 고정되고, 한참 식상하다는 소리를 집중적으로 듣던 시절이라는 걸 반영하고 있습니다.
패널들이 개인별로 시간이 지나면서 자리가 변하는가?
전체적인 평균 위치 말고, 개인별로도 시간에 따라 변할 수도 있을 것 같아서, 조사를 해 봤습니다.
전체 패널이 60명이 넘어서 다 그릴 수가 없다보니 자리가 특색이 있는 몇 명을 추렸습니다.
의도를 가지고 배치되는 중심 위치에서의 거리의 변화 (맨 윗 그래프)를 보면 1회부터 최근회까지
각각의 자리가 어떻게 변해왔는지를 보이고 있습니다. 굳이 따로 해석을 안 해도 그래프 자체가
추세를 보이고 있지만, 전체적으로 출연 초기에는 앞쪽에 있다가 점점 뒤로 밀려나가는 경향이
보입니다. 도미니크는 약간 좀 다른데, 앞뒤로 왔다갔다를 반복하고 있는데 주기가 빨라지고 있군요.
아래의 두 그래프는 그냥 데이터에서 바로 나온 세로줄과 가로줄 위치에 따른 것인데, 세로 줄은
대략 비슷하지만, 가로줄은 개인적인 추세만 봐도 전부 중간으로 몰려가는게 평균치로 수렴해버리는
게 그다지 의도적인 배치가 없다고 볼 수 있구요. 가로줄에서의 경향은 역시 한국어를 잘 못하는
자리에 고정배치된 엘리자베타와 키 큰 패널들만 집중적으로 앉히는 오른쪽 끝자리의 라리사의
경향을 파악할 수 있습니다.
어느 자리에 앉는 사람이 오래가는가?
패널들 중에서 50회를 넘게 출연하는 패널도 있는 반면에 1~2회만 출연한 패널들도 상당히 많습니다.
그래서, 어느 자리에 앉으면 장기 출연이 가능할까! 명당자리를 한 번 뽑아 봤습니다. 물론, 출연 하기도
전부터 제작진이 나름대로 판단한 것이 영향을 좀 미칠지도 모르겠네요.
붉은색은 해당 위치에 앉은 패널들이 출연횟수가 적고, 초록색은 많고, 검은색은 평균임을 뜻합니다.
(원의 크기도 클 수록 출연횟수가 많습니다.) 여기서 보면 한국어 초보자 좌석인 왼쪽 맨 아랫자리가
역시 출연횟수가 두드러지게 적고 (24.27번), 오른쪽 윗줄은 오랫동안 꾸준히 출연하는 사람들의 자리(32.75번)입니다.
의외로 맨 뒷줄 왼쪽자리와 앞줄 3번째 자리가 출연횟수가 낮은데, 보통 새로 출연하는 패널들의
자리로 이 두 자리가 많이 활용되는 것 같군요.
결론!
미수다의 자리배치에는 뭔가 뚜렷한 경향이 있음을 알 수 있을 것 같고요, 제작진이 의도를 하건
안 하건 생각보다 다양한 요소들이 꾸준히 개입하고 있다는 것을 보았습니다. 좀 더 객관적인
자료를 위해서 방송에 나온 시간이나 방청객들의 반응 등을 모두 측정하여 사용했으면 더
좋은 자료를 만들 수 있었을 것 같은데, 좀 아쉽네요. (;;;;)
오오… 새로운 퍼키식 분석! -o-;;
퍼키옹은 선호도 데이터를 공개하라~ 공개하라~ 공개하라~ =3=33
우훗. 공개할 수 없습니다! =3
혜식이 요즘 시험기간인가 보구나.
전형이 이걸 만들었다는것보다; 하나하나 보면서 데이터베이스화했다는게 더 놀라와요;;
hanrss를 타고 왔습니다.
대단하십니다. 이런 분석을 하려면 어떤 공부를 해야 하나요? ㅜㅜ;
요즘 바쁜 일 생기셨어요? ^^
‘퍼키의 일상생활’ 분류라는 것. 흠좀무.
저도 축구게임을 가지고 regression analysis 를 하는 어이없는 짓을 해본 적이 있습니다만, 퍼키님만큼 자세하게 분석(?)해 볼 생각은 못했었는데요. 정말 대단하십니다 +_+
직접 방송 전 회를 다 확인해서 데이터베이스로 만들었습니다. -_-
와우~
진정한 근성가이!!
존경합니다 _(__)_
시험 기간은 아니고 써야하는 보고서가 있는데 쓰기가 영 귀찮네요;;;; -ㅇ-;;;
Alphons님: 이 분석은 사실 기본적인 p검사 같은 것도 안 했기 때문에, 통계적인 기술은 따로 필요 없구요. 그냥 지나다님 말씀같이 “근성”과 그래프 그리는 프로그램만 알아두시면 됩니다. ^^;
비누인형님: 오우. 축구게임.. 저도 예전에 축구는 아니고 뭐였는지 기억은 잘 안 나는데 아주 단순한 야구 게임에서 선수들 설정값을 알려고 linear programming했던 적이 있어요;;;;
R쓰셨나요 아님 matplot( python)쓰셨나요 그냥 궁금해서.
대부분 matplotlib이고, 중간에 있는 distance matrix만 orange로 그렸습니다.
퍼키군님 대단.. _
항상 글이 재밌어요^^
대단하십니다…..^^