2015년 1월 27일 개정 1판 안내
처음 공개된 분석과 글에 있었던 여러 오류를 바로 잡았습니다. 다음 문제점들을 수정하였습니다. 코멘트 주신 분들께 감사드립니다. ^^
- 사각형 cartogram 지역 재배치
- 서울시 노원구, 도봉구 위치 바로 잡음. (오유 자리****범 님)
- 강원도 춘천, 홍천 위치 바로 잡음. (오유 모* 님)
- 서울시 구로구, 금천구 위치 바로 잡음.
- 1월 26일 기준 데이터로 업데이트. (맥도날드와 롯데리아 매장이 많이 추가되었습니다.)
- KFC 석촌역점이 처리 도중에 누락됐던 문제 바로 잡음.
- 상관계수 분석을 잘못 뭉뚱그려 설명한 부분을 수정하여 구체적인 것으로 교체. (트위터 for*********er 님)
- 인구밀도-버거지수 스캐터 차트에서 분포가 좀 더 잘 보이게 LOESS 트렌드선 추가.
- 그림에서 일관성이 떨어지거나 부정확한 용어들이 섞여있던 것 수정.
그리고, 한 가지 덧붙이고 싶은 말은, 이 글은 진지한 어조와 형식으로 되어 있긴 하지만, 유머 또는 광고(IPython/pandas) 분류를 의도하고 쓴 글입니다. 결과에 대해 경영/사회 측면에서 심각하게 고민하실 정도의 정밀한 연구가 아니니, 구체적인 것은 해당 분야 전문가들이 제대로 분석하신 뒤에 보셔야 합니다. ^_^;;
읍내 버스터미널에 가면 롯데리아가 언제나 반갑게 맞이한다. 그렇게 보기 쉽던 롯데리아가 희한하게도 강남이나 신촌 같은 곳에서는 뜻밖에 찾아보기 힘들다. 작년 가을, 트위터 @RioterOfMiku 님은 이 현상을 한 눈에 이해되는 아주 강렬한 도시 발전 지수로 정리했다.
누구든 대략 듣자마자 “그래? 그런 것 같네~” 정도론 동의하게 되는 간단하면서도 정보가 있는 지수인데. 어느 날 연구실에서 오랜만에 햄버거를 시켜 먹다가 문득 생각나서 “진짜 그럴까!?” 생각에 좀 더 구석구석 뒤져보기로 했다.
구체적인 것은 분석 과정을 담은 IPython 노트북을 올려두었으니 관심있는 분들은 여기를 좀 더 보도록 합시다. ^_^
전국 시군구 버거지수
우선, 전국 시군구에 대한 버거지수를 진짜로 계산해 본 적은 없으니 실제로 계산해 보자. 각각 롯데리아, 버거킹, 맥도날드, KFC 홈페이지에서 2015년 1월 26일 기준 데이터를 긁어서 계산했다.
정말 느끼는 대로 강남, 서초는 하늘을 찌르는 “버거지수”를 보여준다. 즉, 강남과 서초에는 롯데리아에 비해 버거킹, 맥도날드, KFC가 훨씬 많다. 다른 지역들은 이 비율이 대략 0.5를 넘는 곳도 드문 와중에, 4배를 넘어선다. 다른 지역에서도 주로 “시내”권인 중구 지역이 버거지수가 좀 더 높다. 하나 의외인 곳은 강원도 홍천군이 2.0점! 여기는 강남, 서초 다음으로 전국에서 3번째로 높은데… 매장 목록을 보면 대명비발디파크에 있는 버거킹 2개 때문이다.; 강원도 정선군은 색은 상당히 짙은 게 높아 보이지만, 롯데리아와 KFC가 1개 씩으로 롯데리아 수가 적어서 지수가 높게 나온 영향이다.
그렇다면 왜 이런 현상이 일어날까? 롯데리아가 시골을 좋아하는 걸까, 아니면 버거킹 등이 도심을 유난히 좋아하는 걸까? 아니면 또 다른 이유가 있을까? 좀 더 자세히 파 보자.
각 브랜드 별 매장 분포
우선 어느 버거 브랜드 매장이 어디에 있는지 수를 봐야한다.
역시 롯데리아 매장 수가 압도적으로 많다. 버거킹, KFC, 맥도날드 다 합쳐도 롯데리아 매장 수에 미치지 못한다. 단지 롯데리아 매장 수가 많기 때문에 좀 더 인구가 적은 지역까지 커버할 수 있다는 가설이 설득력이 생기는 차이다. 각 브랜드별 매장 분포를 좀 더 자세히 지역별로 살펴보자.
역시.. 롯데리아 색은 아주 예쁘게 고르게 분포한 반면에, 버거킹+맥도날드+KFC (줄여서 BMK) 모두 합쳐도 매장이 하나도 없는 곳이 많다. 롯데리아는 서울의 한 구보다 많은 곳이 지방에도 많은 반면에, BMK는 광역시 이상 도시보다 매장이 많은 지방이 거의 없다. 광역시 내에서도 다른 구들에 비해 “중구”에 쏠리는 현상이 BMK가 롯데리아보다 훨씬 뚜렷하다.
브랜드별로 각각 어느 브랜드가 어느 것과 비슷한지 좀 더 자세히 살펴보자.
피어슨 연관성 계수로 봤을 때, 의외의 결과! 맥도날드는 KFC나 버거킹보다 롯데리아에 더 가깝다. KFC와 버거킹은 서로 분포가 비슷하다. 맥도날드가 완전 도심보다 서울 안에서도 주로 주택가 상가에 많이 분포하는 걸 생각해보면 그럴 수도 있겠다 싶다. 버거지수 분자에서 맥도날드를 빼는게 더 원래 의도에 맞을 것 같다.
롯데리아 매장은 좀 더 인구가 적은 곳에서도 열 수 있는 것일까?
인구밀도와 버거지수의 관계
롯데리아가 인구밀도가 낮아도 먹고 살 수 있다면, 버거지수와 인구밀도가 어느 정도 상관관계가 있을 것이다. 비교해보면 진짜 그렇다! (다음 그림)
인구밀도가 높을 수록 (오른쪽으로 갈 수록), 버거지수가 높다. 켄달의 타오값도 0.618이나 된다. +_+ 원인은 분모 (롯데리아)에 있을 수도 있고 분자 (BMK)에 있을 수도 있겠다. 어느 것이 더 원인일까?
인구수에 정확하게 비례하는 모델로 매장을 흩어놓았을 때에 비해 얼마나 실제 매장이 많은지 (Y축)을 보면, 아주 강한 상관관계가 나오지는 않지만, 롯데리아는 어느 정도 이상 되면 인구밀도가 높을 수록 매장 수가 약간 줄어드는 경향이 있다. BMK의 경우에는 너무 흩어져 있어서 확실히 뭐라고 할 수는 없지만, 인구밀도가 낮은 지역에서 매장이 아예 없는 점이 상당히 많다. 전체 매장 수 자체가 적다보니 인구가 적은 지역을 커버하지 못하는 것으로도 볼 수 있겠다. 롯데리아가 인구밀도가 높을 수록 약간 줄어드는 것은 매장 간의 최소 거리를 고려하면 포화된 것으로도 해석할 수 있는데, 정확하게 보려면 좀 더 실제 데이터를 보고, 유동인구, 세대별 인구 같은 걸 봐야겠지만… 오바 같아서 그만 -ㅁ-;;
매장수 차이의 효과
마지막으로, 그냥 BMK가 각각 매장수가 적다보니 인구밀도가 적은 지역까지 진출하지 못한 효과가 버거지수를 만들 수 있는지 보기 위해, 각 시군구를 분할하면서 인구가 가장 많은 곳에 새로 매장을 만드는 식으로 시뮬레이션 했을 때 버거지수가 어떻게 나올지 확인해 보자. (자세한 것은 코드 확인.)
시뮬레이션에서 인구가 적어서 버거지수가 낮은 것으로 나온 곳은 실제 버거지수도 낮은 경향이 있었다. 하지만, 높게 예측된 곳 중에서는 인구가 큰 정보를 주지는 못했다. 특이한 점들을 몇 군데 보면, 다음 지역은 인구만 이용한 시뮬레이션에서 버거지수가 낮게 예측됐지만, 실제로는 매우 높은 점수가 나왔다. 과천시 빼고는 모두 인구에 비해 유동인구가 아주 많은 지역들이다.
시군구 | 롯데리아 | 버거킹 | 맥도날드 | KFC |
강원도 홍천군 | 1 | 2 | 0 | 0 |
인천광역시 중구 | 6 | 2 | 5 | 2 |
부산광역시 중구 | 4 | 1 | 1 | 3 |
경기도 과천시 | 3 | 1 | 1 | 1 |
강원도 정선군 | 1 | 0 | 0 | 1 |
대구광역시 중구 | 7 | 1 | 2 | 4 |
다음 지역들은 인구를 기반으로 한 시뮬레이션에서는 아주 낮지는 않은 버거지수가 나왔지만, 실제 버거지수는 매우 낮은 지역이다. BMK의 입지 조건에 맞는 곳이 없으려나..? 이유는 좀 더 살펴봐야겠다. -O-
시군구 | 롯데리아 | 버거킹 | 맥도날드 | KFC |
충청남도 보령시 | 3 | 0 | 0 | 0 |
경상북도 영천시 | 2 | 0 | 0 | 0 |
대구광역시 달성군 | 6 | 0 | 0 | 0 |
결론
롯데리아는 인구밀도가 많은 곳에서 오히려 인구 대비 매장수가 약간 적은 경향이 약간 있었고, BMK의 매장수가 전국을 덮을 수 있을 정도로 많지 않은 것이 또한 버거지수를 가르는 요인이었다. 다만, 이 글에서는 연관성에 집중했을 뿐, 이 현상의 원인에 대한 구체적인 인과관계를 알 수는 없으므로 해석은 좀 더 조심스러워야 한다. 또한, 시군구경계로 아주 단순화했고 유동인구나 인구 구조 등의 특징을 충분히 고려하지 못했기 때문에, 상권이나 구체적 인구 자료를 더 살펴봐야 할 것 같다. 이것은 소스와 데이터를 공개했으니 후행연구로 누군가… ㅎㅎ;