일본어 호환성 지원을 대폭 강화한 CJKCodecs 1.0.2와 기본적인 버그 몇가지를 수정한 iconvcodec 1.1.2를 릴리즈했습니다.
변동사항은:
-
str.encode에서 그냥 스트링 자체를 메모리에 있는 그대로 유니코드 인코딩을 해버리는 모호성 문제를 고쳤습니다. 이제 기본 인코딩으로 디코드한 다음에 인코드합니다.
-
euc-jp-strict와 shift-jis-strict 코덱이 추가되었습니다. -strict 코덱들은 거의 완벽하게 표준을 지원하는 쪽으로 갈 예정입니다.
-
shift-jis 코덱이 이제 JapaneseCodecs 와 호환됩니다. (비표준 매핑 허용)
-
U+005C REVERSE SOLIDUS 를 SHIFT-JIS 0x5c 로 매핑
-
U+007E TILDE 를 SHIFT-JIS 0x7e 로 매핑
-
U+FF3C FULL-WIDTH REVERSE SOLIDUS 를 SHIFT-JIS 815f로 매핑
-
euc-jp 코덱이 이제 JapaneseCodecs 와 호환됩니다. (비표준 매핑 허용)
-
U+00A5 YEN SIGN 을 EUC-JP 0x5c 로 매핑. (단방향)
-
U+203E OVERLINE 을 EUC-JP 0x7e 로 매핑. (단방향)
-
ChineseCodecs JapaneseCodecs 와 호환성을 위해 인코딩 별명이 추가됐습니다.
-
ISO-2022-JP-1: ISO-2022-JP-EXT
-
BIG5: BIG5-TW
-
GB2312: EUCGB2312-CN
입니다. FreeBSD 포트는 지금 프리즈 중이라 업데이트하지 못했습니다. 이번엔 현실적 일본어 지원이 많이 개선되었으니 혹시 ninix나 orangeslice쓰시는 분들은 shift-jis 이걸로 잘 되나 테스트해주세용.. (저는 일본어를 몰라서 –;)
다운로드는 http://cjkpython.i18n.org/ 에서~
SeeAlso http://mail.python.org/pipermail/i18n-sig/2003-November/001623.html
흠, 그 한글 EBCDIC코드는 일단 전각문자와 한자코드테이블도 얻어냈고, 변환은 이상없어 보이는데 퍼키님의 코덱패키지에 맞게 고치지를 못하고 있네요. 일단 되면 흥미를 잃는 습성이… 🙂
크크 그렇군요.. 🙂 뭐 EBCDIC은 쓸 일이 없어서;; 저도 느긋한 편입니다 _-_
iconvcodec에서도 몇가지 수정해서 1.0.2를 같이 릴리즈합니다~
오 멋지네요. 퍼키님이 저 주제로 논문을 쓰심이!
논문에서 저자명으로 찾는 건 너무 힘들어요. 오픈아이디 괜찮은데요? 앞으로는 논문도 구조화해서, 정보를 쉽게 이용하자는 이야기가 많이 나오던데…
Open ID…^^; 저도 쉽게 색인 할 수 있는 방법이 필요하긴 합니다.