본문 바로가기

기술

[옛한글 표기방법] 한양PUA -> 조합형 한글

조합형 한글 유니코드 정보 (KS X 1026-1)

KOREAN INDUSTRIAL STANDARD.08225-n3422.pdf


국사편찬위원회 시스템을 다루는 와중에 옛한글 표기방법에 대한 문의가 들어와 아래에 스크랩겸 정보를 남김.


기존에는 옛한글은 한양PUA 기반으로 작성되어있었으나 이게 전산화에 대한 문제가 있어, 표준 조합형한글로 표기하는 방법이 있다고 한다. 이게 무려 2007년

2007년 한양PUA는 비표준이므로 쓰지 말라는 지침(KSX1026-1)이 나왔다.

한글은 완성형 코드를 쓰지만, 옛한글은 조합형 코드로 쓰라는 지침이다.

[출처] 한글이 곧 훈민정음이라는 속임수|작성자 아래아

한양 PUA


나랏 말미 귁에 달아 문와로 서르 디 아니
이런 젼로 어린 이 니르고져 홇배 이셔도
내 제 뜨들 시러펴디 몯  노미 하니라.
내 이 윙야 어엿비 너겨 새로 스믈여듧  노니
마다  수 니겨 날로 메 뼌킈 고져  미니라.


KSX-1026-1 조합형 한글


나랏 말ᄊᆞ미 듀ᇰ귁에 달아 문ᄍᆞᆼ와로 서르 ᄉᆞᄆᆞᆺ디 아니ᄒᆞᆯᄊᆡ
이런 젼ᄎᆞ로 어린ᄇᆡᆨ서ᇰ이 니르고져 홇배 이셔도
ᄆᆞᄎᆞᆷ내 제 뜨들 시러펴디 몯 ᄒᆞᆶ 노미 하니라.
내 이ᄅᆞᆯ 윙ᄒᆞ야 어엿비 너겨 새로 스믈여듧 ᄍᆞᆼᄅᆞᆯ ᄆᆡᇰᄀᆞ노니
ᄅᆞᆷ마다 ᅙᆡᅇᅧ 수ᄫᅵ 니겨 날로 ᄡᅮ메 뼌ᅙᅡᆫ킈 ᄒᆞ고져 ᄒᆞᆶ ᄯᅩᄅᆞ미니라.




회사 검색 솔루션은 유니코드 기반 검색이므로 유니코드로만 표현되면 KSX1026-1 도 별 무리 없어 검색이 지원될 것 같다. (검색 테스트를 확인해 보니 잘 되네.)


국편의 대부분의 옛한글 문자가 한양PUA로 작성되어 있는데 이를 KSX1026-1 표준으로 변경해도 검색에는 문제가 없을 것 같다.


문제는 한양PUA를 KSX-1026-1 로 변환하는 작업이 필요한데 이게 쉽지가 않을듯.. 


단순히 한양PUA의 유니코드를 KSX1026-1 유니코드를 매핑해서 변환하는 수준이 아닌것 같다.


일단 이거의 참고자료를 모아야 할것 같은데..



'기술' 카테고리의 다른 글

실시간 비행기 위치도  (0) 2012.11.30
한국의 정부 2.0에 대해 고민하는 사람들의 위키공간  (3) 2012.08.01
Sparql Query 즐겨찾기  (0) 2012.07.31