CJKCodecs 1.1 진행상황

파이썬 2.4a1 릴리스에 반영될 버전인 CJKCodecs 1.1 작업을 띄엄띄엄 생각나면 하고 있습니다. 흐흐. (이제 마비노기도 가입했으니 언제 끝날지는 –;; )

CJKCodecs 1.1에서는 당초 JIS X 0213:2004 지원만 넣으려던 계획에서 좀 확장을 해서, CNS 11643 1번 평면부터 7번 평면까지를 모두 넣어서 EUC-TW와 ISO-2022-CN을 지원하고, 홍콩자치구의 BIG5HKSCS를 지원할 예정입니다. 지금 CNS11643, HKSCS 매핑과 EUC-TW, BIG5HKSCS 인코딩 구현은 모두 끝났고, ISO-2022-CN와 JIS X 0213:2004는 아직 구현이 안 됐습니다. CNS11643 매핑은 소스 파일이 총 920KB이고 바이너리로 340KB인데.. 이건 CJKCodecs의 대만을 제외한 다른 한,중,일 3개국 매핑을 모두 합친 것보다 많은 것이라, 이제 앞으로 대만 사람들을 보면 눈을 한번쯤 흘겨줄 겁니다. HKSCS는 BIG5에 그냥 덧씌운 캐릭터셋인데, 일부 C6~C8까지는 BIG5와 겹치기도 합니다. 요건 매핑 소스가 140KB, 바이너리가 80KB정도 나와서 홍콩에는 계속 좋은 감정을 가질 수 있게 되었습니다. ;; (앞으로 혹시나 홍콩할매귀신을 만나서 “왜 CJKCodecs에서 HKSCS지원 안 해주는 거야 으흐흐흐~~ 잡아먹을테다~~”하는 상황을 피하게 돼서 다행입니다;;)

이번에 정리 작업을 하면서 전에 올렸던 글에서 처럼 바이너리를 정리했는데, 그 뿐만 아니라, 아예 코덱 파일을 모두 나라별로 1개씩으로 합쳐버렸고, ISO-2022도 각 나라별 모듈에서 따로 떼내어서, 기존에 500라인짜리 매크로 파일로 떡칠이 되어있던 소스를 간편한 함수 포인터 기반 소스로 바꾸었습니다. 아주 상쾌합니다. 이히히 :) 결과적으로 파일 개수가 1.0.3에 비해 1/3로 줄었습니다.

그러나, HKSCS와 CNS11643 매핑의 등장으로 타볼 용량은 상당히 늘었는데, tar.bz2가 예전엔 400KB정도였는데 이제는 780KB입니다. 아무래도 이렇게 갑자기 불면 미국애들 눈치를 많이 봐야하기때매.. 파이썬에 넣을 때는 CNS11643매핑은 빼고 넣으려고 생각하고 있습니다. 구글에서 검색해봐도 파이썬에서 euc-tw 안 된다고 투덜대는 사람이 없는 걸로 봐서는 필요도 없는데 괜히 수백KB 덧붙이면서 싸울 필요는 없을 것 같아서 ^^;;

5 thoughts on “CJKCodecs 1.1 진행상황”

  1. 미국애들은 속도가 잘 안 나와서 싫어하는게 아닐까요?
    그 많은것들은.. 이렇게 후다닥 해버리시다니.. 대단대단대단… 퍼키님 모르는게 없으시구나~

  2. 마비노기 무슨 서버에 닉이 모예요???0.0
    (마비노기란 말에 눈이 번쩍했음-.-;)

Comments are closed.