과학저널 레몬펜으로 같이 읽기

돌아다니다가 레몬펜이라는 서비스가 있길래 보고 호오 신기하다 생각하던 중, 저널 사이트에 붙여놓고 온라인 저널클럽 하는 것 비슷하게도 되지 않을까 생각나서, 한 번 그리스몽키 스크립트를 만들어 봤습니다. 같이 읽으면서 메모도 쓰고 재미있을 것 같아서~

설치하시려면 그리스몽키를 먼저 설치하신 다음에 >>여기<<를 클릭하세요~

등록해 놓은 사이트는 다음과 같습니다.

  • Nature와 NPG 발행 저널 전체
  • Science
  • Cell, Structure, Molecular Cell
  • Elsevier (Science Direct) 발행 저널 전체
  • Bioinformatics, Protein Engineering, Nucleic Acids Research
  • PLoS Biology, PLoS Computational Biology, PLoS Genetics, PLoS Medicine
  • BMC 발행 저널 중 자체 도메인 쓰는 것 빼고 전체
  • Genome Research, RNA, Genes & Development
  • JBC, JMB, Proteins
  • PNAS

파이썬을 두루 이해하는 데 도움 되는(?) 퀴즈

얼마 전에 “사랑하지 않으면 떠나라”의 서평 제목으로는 좀 독특한 “당신은 자바 가상 머신을 죽일 수 있나요?”라는 글을 보고 떠올라서, 혹시 파이썬을 쓰다가 발생하는 문제를 얼마나 잽싸게 해결하고, 문제가 생길만한 코드를 짜지 않는 등 이해정도와 관련된 것을 시험해 볼 수 있는 문제를 한 번 내 봤습니다. -ㅇ-;; 물론 제가 냈기 때문에 제가 아는 한에서만 나온거라 좀 편향돼 있을 수도 있지만.. 그냥 재미로 한 번;;

“기계전자공학부”와 “바이오및뇌공학과”의 정체

저는 학부를 “기계전자공학부”에 다니고, 지금은 “바이오및뇌공학과”에 다니고 있는데요,
둘 다 전통적인 학과 이름이 아니라 마케팅용 과 이름이다보니까
본의아니게 “기계공학 전공하셨는데 컴퓨터는 어떻게 배우셨어요?” 질문도 엄청 자주 받는데다,
저희 가족들도 제가 무슨 과인지 아직도 모르는 뭐 그런 일이 있어서,
구체적으로 뭐 하는 과인지 약간 소개를 해 봅니다.

“기계전자공학부”는 교육부에서 한창 학부제 정책을 펼 때 학교에서
지원 받으려고 급조한 학부인데요, (마지막 학생운동이 있었던 바로 그) 1996년에 기계공학, 기계설계, 전기공학, 전자공학, 전파공학, 컴퓨터과학, 산업시스템공학 이렇게 7개가 합쳐서 기계공학, 전기전자공학, 정보산업공학 3개 전공으로
재편성한 광역학부입니다. 저는 정보산업공학(컴과+산시)으로 졸업했는데,
컴과과 산공을 약간씩 들어서 컴과라고 하기도 좀 그렇고 정보라고 하기도 좀 그렇고.. 애매하지만.. 기계과는 아닙니다. -ㅇ-;

이후에 2000년에 모집계열이 공대 전체로 통합되면서 3개 전공이
모두 별도 학부로 분리되면서 정보산업전공이 컴퓨터산업공학전공으로 바뀌고, 2004년에는 다시 2개로 원래대로 분리돼서 컴퓨터과학과와 정보산업공학과(원래는 산시)가 됐다가, 2007년에는 다시 공대의 비인기과를 모아서 공학부로 통합했다고 합니다. -ㅇ-;

“바이오및뇌공학과”는 사재기부와 정부의 매칭펀드로
마찬가지로 약간 독창적인(?) 방법으로 생겨난 학과인데,
처음에 이름은 “바이오시스템학과”였습니다. 학교 내에서 학부생을
모집하는 과 중에 유일하게 자연과학대나 공과대에 속하지
않은 과이기도 한데.. 좀 이상하죠; 원래 설립목적은
BT+IT였지만, 실제로는 BT+IT라고 보통 부르는 분야가 차지하는
비중은 그렇게 많지 않고, 공학을 도구로 해서 생물을 주제로
연구하는 여러 분야에 골고루 나뉘어 있습니다. 크게 나노나 MEMS, 뇌과학/신경공학, 계산생물학, 이미징/포토닉스 같은 것을
다루는 연구실들이 있습니다.

그러다가 2006년 말에 “바이오시스템”이 다른 학교에서
주로 농기계 관련 학과에서 많이 쓰인다는 얘기 때문에,
유학준비생들을 고려해서 미국에서 보통 많이 쓰는 이름인 “바이오메디컬공학과”로 개칭합니다.
그런데 관련된 타과의 극렬한 반대로 결국 학칙만 개정하고
공표는 못 하고 있다가, 결국 2007년에 정치적 타협으로
부르기도 이상하고 쓰기도 이상한 “바이오및뇌공학과”가 됩니다.
아직도 학교 안 다른 데서 과 이름 얘기하면 이상한 사람 취급합니다.
-O-; 세글자 약어는 공식적으로는 “바공과”지만, 실제로는 과 안에서도 누구나 “바뇌과”로 부르고.. ^.^

이상한 이름 과만 돌아다니는게, 뭔가 알게모르게 유행을 좇은 결과는 아닌지 깊이 반성해 봅니다. -.-;

WoC 눈 야영지에 대해서 추가 사항

엊그제 올렸던 WoC snow camp 얘기는 행사를 주최하는 곳에서 WoC참가 학생을 위한 행사라 장소가 좁아서 일반인은 참가할 수 없다고 알려왔습니다.

제가 미처 확인을 못 하고 알려드려서 죄송하네요~ “생활 속의 프로그래밍” 주제는 앞으로 많은 분들이 참여하실 수 있는 좋은 행사에서 준비가 되면 그 때 다시 알려드리겠습니다. 🙂

WoC 눈 야영지: “생활 속의 프로그래밍” 예고

이번 주 토요일(23일) 도곡동 IBM본사에서 WoC snow camp가 있습니다. 저는 “생활 속의 프로그래밍”을 주제로 발표할 예정인데, 아직 구체적인 시간은 결정되지 않은 것 같네요.

이번에는 일상생활 속에서 작은 프로그램들을 활용해서 재미나게 프로그래밍도 즐기고~ 삶도 재미있게 사는 방법을 여러 예를 통해서 보여드릴 예정입니다. 예제는 물론 뭐 긴급하게 새로 다 만들 수 없으니 제 블로그에 지난 몇 년간 올라왔던 글들이 재활용될 예정입니다;; 1시간 안에 제 블로그 전체(?)를 읽으시는 효과를 보실 수 있을지도! -ㅇ-; (뻥을 쳐 본다;)

발표자료는 발표 후에 공개하겠습니다. (참고로 저는 발표자료에는 중요한 내용은 안 적는 경향이 있으니 발표자료만 봐서는 알아보실 수 없을 수도 있습니다. =3)

미수다 첫째 줄은 의미가 있는가?


[알림] 이 글의 전개에 사용된 자료의 일부는 주관적 판단에서 도출된 것이므로, 전체적인
논리와 결론, 설명 등이 과학적으로 부정확할 수 있으니, 너무 진지하게 받아들이거나 정확한
결론으로 오인하지는 마시길 부탁드립니다.

KBS에서 오랫동안 방송하고 있는 미녀들의 수다
작년부터 심심할 때 재미있게 보고 있었습니다. 여기서는 외국인 여성들이 4×4격자로 한 회에 16명씩
출연하는데.. (벌써 숫자부터가 심상치가 않습니다;; 2비트씩 총 4비트 어드레싱!)
항상 같은 사람이 나오는 게 아니라 일정 출연자 풀을 두고 약간씩 바뀌다보니 제작진이 때에 따라
자리를 배치합니다. 시청자들도 물론 어느 정도 패턴을 파악했겠지만, 작년 11월에 방영된
50회에서 출연자인 “따루”가 “뒷 줄보세요. 노처녀들 맨날 다 여기 앉았잖아요. 앞에 어리고 이쁜
애들 다 앉고~” 라고 얘기하면서 물위로 “꿍꿍이”가 떠올랐는데요. 그래서 그 때 과연 꿍꿍이가
어느 정도 수준인가 구체적으로 분석해보면 재미있을 것 같아서 이 분석을 하게 됐습니다. -ㅇ-;

우선 자리 배치를 어떻게든 데이터로 갖고 있어야하는데, 검색해 봐도 자리 배치가 데이터베이스화
되어 있는 곳은 따로 없어서 직접 방송 전 회를 다 확인해서
데이터베이스로 만들었습니다. ;;
(혹시 더 분석해 보실 분들을 위해 공개합니다;;;;)
1회에서 63회까지 중에 13회와 23회를 뺀 총 61회분인데, 각각 설날특집, 개편기념 특집이라
자리 배치가 4×4가 아니다보니 이질적인 데이터라서 뺐습니다.

그래서 확인해 볼 가설들은 다음 것으로 정했습니다.

  • “어리고 이쁜 애들”이 정말로 집중적으로 앞에 앉는 경향이 있는가?
  • 제작진이 주장하는 해당 회차의 주제에서 재미있게 말할 수 있는가가 정말로 자리에 반영되는가?
  • 어느 줄이 진짜로 좋은 줄인가?
  • 세로줄 말고 가로줄은 영향이 없는가? 그리고, 세로줄과 가로줄의 상관관계가 있는가?
  • 52회 이후 따루가 아랫줄로 내려왔을 때 다른 사람들도 영향을 받았는가?

먼저 대부분 가설들이 “어리고 이쁜 애들”과 관련되어 있기 때문에, 어떻게든 정량적 통계를 적용하려면
그 정도를 정량화를 해야하는데, 사람마다 취향이 다르고 정량화를 하는 것도 여러 모로 문제가 많을
수 있기 때문에, 직접적으로 “어리고 이쁜” 정도를 정량화 하지는 않고, 시청자가 선호하는 정도에서
언어와 관련된 부분을 따로 떼서 나머지 부분을 “선호도”라는 주관적 기준으로 적용했습니다.
즉, 제가 마음대로 숫자를 줬다는 얘기죠 –;; 이 데이터는 인격권과 여러 가지 문제가 다분히 있을
수 있기 때문에, 통계에서도 직접적으로 노출되는 부분에는 사용하지 않고 데이터도 공개하지
않았습니다. 그리고 나머지 “해당 주제를 재미있게 말할 수 있는” 정도를 또한 제가 마음대로 정량화
해서 데이터를 만들어서 이 두 가지와 자리의 상관관계를 먼저 조사했습니다.

뭔가 의도에 맞춰 자리가 배치되었는가?

이 그래프는 카메라에서 보는 위치와 출연자의 선호도 평균값을 나타냅니다. 원 안의 색깔은
언어외선호가 낮을 수록 붉은색, 클 수록 밝은 초록색 (평균은 검은색)으로 나타납니다.
그리고 원의 크기는 해당 위치 출연자 데이터의 표준편차입니다. 대충 경향을 뚜렷히 눈으로
볼 수 있듯이, MC와 가장 가까운 왼쪽 맨 아랫줄 자리가 역시 가장 선호가 높은 자리로 볼 수 있고,
위로 갈 수록 낮아지는게 예측과 일치합니다. 그런데, 하나 예상과 다르게 나타난 것은 경향이
줄마다 있는게 아니라 약간 왼쪽으로 경사가 30도 정도 있습니다!

그 경향을 조사하기 위해서 몇 도를 회전하고 선형회귀를 했을 때 가장 목표값(선호도)과 상관관계가
높은지 보면, 25.8도를 회전했을 때 가장 높게 나타나는데 그 r값이 -0.974가 나옵니다.
물론 주관이 개입되었으므로 자주 보는 사람이 선호가 높은 등의 여러 문제가 있을 수도 있지만,
0.97이라면 그런대로 높은 상관관계라고 볼 수 있겠습니다. 그런데, 왜 25.8도를 회전해야 결과가
나왔는지를 조사해보자면, 패널 자리의 왼쪽은 MC와 방청객이 있기 때문에 카메라가 주로 오른쪽에서
접근하게 되는데, 대략 패널에 접근하는 카메라의 각도가 평균이 그 정도 되는 게 영향을 주지 않았나
생각됩니다.

그런데, 분산은 맨 아랫줄 2번째 자리와 2번째 줄 맨 오른쪽 자리가 분산이 상당히 적게 나왔고 다른 부분은
비슷한데요, 이 자리 둘에 대해서는 은연 중에라도 진짜 일관된 기준으로 배치한 것 같습니다.

그래서, 왼쪽 맨 아랫줄을 기준으로 잡아서 회전한 가로축에서의 거리를 “중심거리”로 정의해서
이를 자리가 제작진이 얼마나 별도의 기준에 따라서 배치하는가에 대해 아래에서 좀 더 조사를 했습니다.

반면에, 각 패널이 얼마나 한국어에 능숙한지를 가지고 관계를 보면 윗 그래프와 같이 전혀 다른 결과가
나옵니다. 언어에 능숙할 수록 뒤로 가는 경향이 있고, 왼쪽 맨 아래 자리만 유독 한국어에 미숙한
패널이 고정적으로 출연하는 자리로 잡힙니다. 그런데, 이 경우에는 경향이 있기는 해도 앞의 그래프만큼
뚜렷한 상관관계까지는 아닌 것으로 보입니다. 역시 “꿍꿍이”의 실체는 “어리고 이쁜 애들”에 훨씬
치우쳐져 있음을 알 수 있습니다.

각 자리들끼리 비슷한 패널이 앉는 자리가 있나?

어느 자리가 좋은지를 주관적인 데이터로 결론을 도출했기 때문에, 좀 더 객관적인 데이터로 경향을
참고해 볼 필요가 있어서 각 자리별로 해당 자리의 출연자와 다른 자리 출연자의 구성이 얼마나
비슷한가를 조사했습니다. 여기서는 1~2회만 출연한 사람들은 비교가 큰 의미가 없기 때문에,
10번 이상 출연한 31명에 대해서만 비교하였습니다.

밝은 초록색은 강한 상관관계, 붉은색은 아주 약한 상관관계, 검은색은 평균입니다.
11은 맨 앞줄의 맨 왼쪽을 의미하는데, 11과 3번째 줄 이후로는 다른 자리들보다 특별히 다른 것을 알 수
있습니다. 비슷한 부분을 보면, 맨 뒷줄의 왼쪽 3자리가 서로 굉장히 비슷하고, 맨 앞줄 중간 2자리와
그 다음 줄 중간 2자리가 서로 비슷합니다. 맨 오른쪽 자리들은 옆 자리들과 유사도가 좀 따로 노는데요,
이건 아무래도 맨 오른쪽 줄에 주로 키가 큰 패널들을 주로 배치하는 경향이 있어서가 아닌가 싶네요.

시간이 지나면서 꿍꿍이가 강화되거나 약화되었는가?

처음엔 의도가 없다가 중간에 생기거나, 패널 풀이 커지면서 다양성이 확보가 되었는지 등의 경향을
보기 위해 각 패널의 주변 5회에서 “중심거리”가 얼마나 변하는지 조사해 봤습니다.

윗쪽 그래프는 각 회별 주변 5회에서 연속 5회 모두 또는 4번 이상 출연한 패널이 얼마나 되는지를
나타내는데요, 처음에는 5번 모두 출연한 패널이 10~12명까지 되다가 점점 떨어지는 경향을 보면
패널이 다양화되는 경향이 좀 있는 걸 알 수 있습니다. 17회, 33회, 41회 같이 파란색, 빨간색이 위 아래로
피크가 반대로 떨어지는 곳을 보면, 둘이 따로 놀지 못하는게 역시 바뀌어 봐야 그 사람이 그 사람이란
걸 알 수 있구요.

아랫쪽 그래프를 보면, 처음엔 편차가 높다가 점차 뚝뚝 떨어지고 있는데요. 처음엔 자리잡기 전이라
좀 자리를 자주 여기저기 옮겨보다가 안정화 되고 나서 의도를 가진 꿍꿍이 배치가 시작된 것 같군요.
19회 ~25회 사이를 보면, 연속출연자는 상당히 많은데도 중심거리 표준편차가 뚝 떨어진게, 사람은
안 바뀌고 자리는 고정되고, 한참 식상하다는 소리를 집중적으로 듣던 시절이라는 걸 반영하고 있습니다.

패널들이 개인별로 시간이 지나면서 자리가 변하는가?

전체적인 평균 위치 말고, 개인별로도 시간에 따라 변할 수도 있을 것 같아서, 조사를 해 봤습니다.
전체 패널이 60명이 넘어서 다 그릴 수가 없다보니 자리가 특색이 있는 몇 명을 추렸습니다.

의도를 가지고 배치되는 중심 위치에서의 거리의 변화 (맨 윗 그래프)를 보면 1회부터 최근회까지
각각의 자리가 어떻게 변해왔는지를 보이고 있습니다. 굳이 따로 해석을 안 해도 그래프 자체가
추세를 보이고 있지만, 전체적으로 출연 초기에는 앞쪽에 있다가 점점 뒤로 밀려나가는 경향이
보입니다. 도미니크는 약간 좀 다른데, 앞뒤로 왔다갔다를 반복하고 있는데 주기가 빨라지고 있군요.

아래의 두 그래프는 그냥 데이터에서 바로 나온 세로줄과 가로줄 위치에 따른 것인데, 세로 줄은
대략 비슷하지만, 가로줄은 개인적인 추세만 봐도 전부 중간으로 몰려가는게 평균치로 수렴해버리는
게 그다지 의도적인 배치가 없다고 볼 수 있구요. 가로줄에서의 경향은 역시 한국어를 잘 못하는
자리에 고정배치된 엘리자베타와 키 큰 패널들만 집중적으로 앉히는 오른쪽 끝자리의 라리사의
경향을 파악할 수 있습니다.

어느 자리에 앉는 사람이 오래가는가?

패널들 중에서 50회를 넘게 출연하는 패널도 있는 반면에 1~2회만 출연한 패널들도 상당히 많습니다.
그래서, 어느 자리에 앉으면 장기 출연이 가능할까! 명당자리를 한 번 뽑아 봤습니다. 물론, 출연 하기도
전부터 제작진이 나름대로 판단한 것이 영향을 좀 미칠지도 모르겠네요.

붉은색은 해당 위치에 앉은 패널들이 출연횟수가 적고, 초록색은 많고, 검은색은 평균임을 뜻합니다.
(원의 크기도 클 수록 출연횟수가 많습니다.) 여기서 보면 한국어 초보자 좌석인 왼쪽 맨 아랫자리가
역시 출연횟수가 두드러지게 적고 (24.27번), 오른쪽 윗줄은 오랫동안 꾸준히 출연하는 사람들의 자리(32.75번)입니다.
의외로 맨 뒷줄 왼쪽자리와 앞줄 3번째 자리가 출연횟수가 낮은데, 보통 새로 출연하는 패널들의
자리로 이 두 자리가 많이 활용되는 것 같군요.


결론!

미수다의 자리배치에는 뭔가 뚜렷한 경향이 있음을 알 수 있을 것 같고요, 제작진이 의도를 하건
안 하건 생각보다 다양한 요소들이 꾸준히 개입하고 있다는 것을 보았습니다. 좀 더 객관적인
자료를 위해서 방송에 나온 시간이나 방청객들의 반응 등을 모두 측정하여 사용했으면 더
좋은 자료를 만들 수 있었을 것 같은데, 좀 아쉽네요. (;;;;)

유니크카드

얼마 전 애자일 블로그에서 언급유니크카드 어떤 건지 무척
궁금해서 저도 하나 만들었습니다. +_+
발렌타인데이 특별세트를 무척 만들고 싶었지만, 아쉽게도
쓸 곳이 없어서 =___=;; (자작극이라도 부려 볼까!)

얼마 전 RCSB 에 올라왔던 달력 그림으로 만들어서 12종으로 50개를 채웠습니다. 킁킁. 단백질 하나 하나 그림으로 이렇게 보니 친구 같고 해서 뿌듯합니다. -ㅇ-; 뒷면의 설명은 대충 원문에서 번역을 해서 만들었습니다. 일단 실험실 동료들은 좋아하는 단백질 2~3개 씩 달라고 하고 매우 좋아하긴 하는데… ;;;;

당신과 비슷한 단백질은 어떤 것인가요! (심리테스트라도 하나 만들어 보면 재미있겠네요 ;;;_-_)

유니크카드 품질은 마음에 드는데, 케이스가 우그러져서 오는 것이 해결되면 좋겠고, 100장에 3만원이라던지 좀 더 많이 싼 가격으로 인쇄할 수 있는 상품이 나오면 좋겠습니다.

Watch movie online The Transporter Refueled (2015)