직장인 연간근로시간과 오픈소스 활동의 관계

애자일 이야기에 올라온 7월까지만 일한다면?이란 글을 읽다가, 인용한 그림을 보고 흠칫 놀랐습니다. 어디선가 많이 본 패턴이 보이는데, 으흠~~ 일을 적게하는 나라들에 유독 FreeBSD에서 굉장히 활동이 많은 국가들이 집중되어 있던 것입니다! 그래, 일을 적게 시켜야 뭘 하든 할 것이 아닌가 싶어서 과연 근무시간과 오픈소스 활동과의 상관 관계에 대해 조사를 해 봤습니다.
뭘 조사하느냐를 결정해야 하는데, 메일링리스트를 보는 것도 좋겠지만, 메일링 리스트는 언어의 제약이 굉장히 많이 작용할 것 같아서 FreeBSD의 PR 데이터베이스를 쓰기로 했습니다. 아무래도, 그냥 패치만 보내도 되고 비교적 짧게 적어도 되니까 꼭 올릴 사람들을 올릴 것 같아서~ 🙂

그래서, 모든 PR 자료를 cvsup으로 받은 다음에 로컬에서 간단하게 뒤져서 분석했습니다. 너무 오래된 자료들은 빼기 위해서 #40000이후만 넣었는데, 40000번이 올라온 것이 대략 2002년 6월 정도 됩니다. 그 이후에 올라온 69374개의 PR 중에서 Received헤더와 From헤더를 토대로 보낸 사람이 사는 국가를 추정했는데, 미국은 FreeBSD 서버들이 미국에 있어서 IP구별이 힘들어서 통계에서 제외하였고, 영국도 알 수 없는 이유로 GeoIP로 검출되지 않았습니다. 결국 남은 것은 총 100개 국가에서 모두 46304개의 PR이 나왔고, 얘네들을 대상으로 분석하기로 했습니다. (사용한 스크립트)


FreeBSD PR수와 근로시간

우선, 대충 생각해 봐도 인구와 활동양은 비례하는 관계가 어느 정도 있을 것이기 때문에, 활동량을 국가의 인구(위키백과에 올라가 있는 최근 자료를 사용)로 나눈 것과 작업량의 상관 관계를 계산했더니 -0.54가 나왔습니다. 아주 높은 것은 아니지만, 그래도 적당히 상관관계가 있다는 것을 암시하는 것 같은 느낌이 오네요~ (위 그래프에서 대충 경향이 약간 있는 것 같죠? ‘ㅇ’)

그 외에도 생각해 보면, 먹고 살기 힘들면 오픈소스 하기가 힘들테니, GDP하고도 어느 정도 관련있지 않을까 해서 계산해 보니까 0.52가 나오네요. 그래서, 한 번 얘네들을 묶어서 예측할 수 있도록 식을 만들어 봤습니다. 우선은 대충 기분으로 이렇게~


Pr=FreeBSD PR수, W=근로시간, G=GDP, Pop=인구

선형 최소자승법을 쓸 수 있게 약간 풀고 넘기고 하면,


Pr=FreeBSD PR수, W=근로시간, G=GDP, Pop=인구

그래서, 이놈을 스크립트를 짜서 분석해 보면, 각각의 계수가 k1=-1.51, k2=14.7, k3=3135.7, k4=-30172.4 정도 나옵니다. (사용한 스크립트) log G가 보통 10내외 인 것을 감안하면, W는 -로 100내외 정도 영향을 미치고, log(GDP)는 상당히 많은 영향을 미쳤군요. 흐흐 역시 샘플이 적어서 식이 좀 이상합니다. -ㅇ-; =3=3


인구1000만명당 FreeBSD PR수와시간의 관계, (붉은색은 예측 기대값)

그래도 대충 그래프 보면 뭔가 보이긴 하죠? ;; 빨간색은 위에서 근사식으로 만든 것을 다시 적용한 값인데, 마음대로 이름을 OBFI라고 붙여봅니다. -O-; 대충 1000만명당 PR 개수 순으로 정렬했을 때, 일하는 시간은 증가하는 경향을 보이고 OBFI는 감소하는 경향이 나타납니다. (상관계수는 0.618)

대충 빨간색보다 파란색이 위에 있는 나라는 환경에 비해 오픈소스 (여기서는 FreeBSD) 활동이 많고, 반대의 경우에는 환경에 비해 활동이 적다고 볼 수 있겠습니다. 일본이나 독일이 오픈소스에서 그렇게 활동을 많이 하는 것 처럼 보여도, 그래프에서는 별로 튀어 나오지 않는 것이 사실은 인구빨인 게 들통났군요~ 그리고, FreeBSD가 유난히 강세인 덴마크와 네덜란드가 역시 예측된 값과 엄청난 차이를 보여주고, 한국과 멕시코는 역시 약세입니다. 그런데, PR을 대상으로 해서 그런지, 아니면 주로 유럽이 대상이라 그런지 생각보다 언어는 그다지 문제가 안 되는 것 같네요. 영어를 주로 쓰는 호주나 뉴질랜드라고 다른 국가들에 비해 특별이 더 튀거나 그런 경향은 없는 것 같습니다. 러시아나 중국이 끼였으면 좀 더 분석이 좋았을텐데 OECD자료이다 보니, 없는게 아쉽네요.


일을 많이 시켜서 오픈소스 못하는 우리나라~

인구 순으로 하면 우리나라도 OECD에서 상당히 높은데, 앞으로 S모기업이나 L모기업 같은 곳을 비롯하여 사회 전반적으로 사원들이 젊은 시절에도 좀 여유롭고 즐겁고 발전하는 삶을 살게 근로시간을 줄여주면 오픈소스 뿐만 아니라, 인문학도 살고, 좋아지지 않을까 생각해 봅니다. 회사일 말고도 재미있는 것이 얼마나 많은데~

소수의 자료만 갖고 작업한 것이라 통계적으로 그다지 정확한 편은 아니지만 너그럽게 글자만 읽은 셈치고 잊어 주세요 =3=3 흐흐

일러두기 — 아일랜드와 아이슬란드도 인구가 너무 적어서 통계에서 제외했습니다.

11 thoughts on “직장인 연간근로시간과 오픈소스 활동의 관계”

  1. 와. 재밌게 읽었습니다. ^^
    군대에도 인터넷만 자유롭게 되면 오픈소스 활동 많이 할 수 있을텐데. 프로그램 받아서 버그 찾거나 해서 패치를 만들거나 하면 여기서만 쓰고 밖으로 못 올린답니다. -_-;…

  2. 살아있는 지식을 보여주는, 붓으로서의 컴퓨터(텔레비젼, 컴퓨터, 붓 중에서 비슷한 것 두개를 골라보면?)를 보여주는 좋은 글이다.

    근데, GDP는 뭘 썼는지 모르겠는데, gdp per capita (ppp)를 쓰는 것이 좋을 것 같고(환율의 변동의 문제를 제거), correlation coefficient를 계산했는데, gdp는 모르겠으나 annual work hour는 normal distribution이 아닌 것 같다.

  3. 일을 많이 시킨다고 생각할 수 도 있지만.. 그만큼 더 벌어야 하는(?) 입장도 무시할 수 없습니다. 국가가 노후를 보장해 주지 않는한은 지금 먹고 사는 것 외에도 더 벌어야 하는 이슈가 발생합니다. 그러니 더 받기 위해서라면 조금이라도 더 일을 해야 하는 거죠. (물론 더 받기 위해서 더 일을 해야 하는 구조이기 때문에 닭/달걀의 우선 순위로 귀결이 되겠지만..)

    저도 꾸준히 OSS 를 하려고 하지만, 제가 OSS 에 투자할 수 있는 시간은 새벽 1시 부터 5시 사이네요. 울 마누라는.. 가정파괴범이라고 부릅니다. –;

  4. 국가가 부유하지 못하니, 복지 체계가 부실하고, 따라서 그만큼 더 열심히 일해야 한다는 논리는 강한 자들의 논리가 되기 쉽지요.

    일단 GDP(PPP)와 년간 근로 시간을 비교해 보면, 특이점(outlier) 국가들이 몇 있습니다. 미국과 한국이 특히 그러한데, GDP 수준이 비슷한 다른 국가들에 비해 훨씬 더 일을 많이 하고 있습니다.

  5. 재밌는 통계입니다..

    이래서 수치해석을 배워야 하나 봅니다…(잘 배우진 못했지만)

    이걸로 논문 하번 써보시지요…

  6. 감사합니다. 흐흐.

    창준형: 옙. GDP는 ppp를 썼습니다~ nominal은 없는 국가가 몇개 있더군요;
    annual work hour는 log, sqrt, 안쪽에 상수를 빼서 sqrt 을 시도해 봤는데 그냥 linear가 fit한 뒤의 correlation이 가장 높게 나와서 그냥 linear로 썼어요~ 아무래도 자료가 좀 더 많아야 될 것 같고, 그냥 적은 데이터로 장난 친 정도죠 뭐 ^_^;

    SheeP님: 누군가 경제나 경영 전공하시는 분들이 좀 더 정확한 분석을 해 주시면 좋겠네요~ 🙂

  7. Pingback: Alphageek

Leave a Comment