Character Set과 Font

C & C++ 관련 : 2007. 10. 20. 15:48
반응형

Character Set과 Font


이해의 편의를 위해서 기본적으로 알고 있어야 할 것들에 대해서 얘기하고 본격적인 이야기를 하도록 한다. 많은 사람들이 Character Set과 font의 대략적인 의미는 알고 있지만 정확한 의미는 모르는 것 같다. 이것들의 정확한 의미를 이해하면 Character Set을 바꾸는 것이 어떤 의미를 가지며 유니코드를 사용하면 왜 다국어를 저장할 수 있는가를 이해할 수 있다.


컴퓨터는 이진수밖에 인식하지 못하므로 문자(symbol) A 를 A 로 인식하지 못하고 이것에 대응되는 이진수 값으로 인식할 수 밖에 없다. 따라서 어떤 문자(symbol)가 어떤 숫자(numeric value)에 대응된다는 것을 정의해 놓은 것이 필요하며, 그것이 Character Set이다. 그렇다면 문자(symbol)와 숫자(numeric value)의 관계만을 가지고 있으면 될 것인가? 그렇지 않다. 이것을 사람들이 알 수 있도록 출력해주는 것이 필요하다. 이 역할을 font가 담당한다. 예를 들자면 문자(symbol) A 에 대한 숫자 값(numeric value)을 A 나 A 의 형태로 보여주고 출력할 수 있도록 해준다는 것이다.


그렇다면 Character Set을 정한다는 것은 어떤 의미를 가질까? 먼저 표현할 수 있는 문자의 종류를 정한다는 것을 의미한다. 한국어만, 일본어만 또는 유럽어들을 표현하고자 할 경우 Character Set이 달라져야 한다는 것이다. 둘째로 어떤 문자(symbol)에 대응되는 숫자(numeric value)가 달라 진다는 것을 의미한다. Character Set에서 표현할 수 있는 문자(symbol)의 수는 숫자(numeric value)의 길이를 얼마로 하느냐에 따라 좌우된다. Character Set 마다 숫자(numeric value)의 길이가 다르기도 하고 동일한 길이지만 나타내는 문자(symbol)가 다르기도 하다.


Database는 설치된 O/S와는 별개로 저장될 데이터들이 가질 Character Set을 따로 정해준다. 이때 정해진 Character Set이 가지는 특성도 일반적인 Character Set의 경우와 똑같다. 어떤 Character Set을 정하느냐에 따라 저장할 수 있는 언어와 각 문자가 가지는 길이가 달라진다. 그렇다면 하나의 Character Set으로 여러 언어를 표현하는 방법은 없는가? 아래에서 유니코드에 대해서 살펴보자. 참고로 Character Set의 배정은 IANA (Internet Assigned Numbers Authority)에서 한다. 최신의 Character Set정보는 다음 주소에서 확인이 가능하다.
http://www.iana.org/assignments/character-sets

출처 : Tong - 초이통님의 프로그램 상식통

반응형

'C & C++ 관련' 카테고리의 다른 글

#difine과 typedef 와 const 의 정의와 예제줌  (0) 2007.10.22
World of Character Set  (0) 2007.10.20
Volatile  (0) 2007.09.16
Posted by Real_G