Web

아스키코드 vs 유니코드

JUNGKEUNG 2021. 11. 3. 17:11

아스키코드(ASCII Code)


컴퓨터는 0과 1 숫자 밖에 모르기 때문에 문자도 숫자로 기억한다. 이때, 어떤 숫자와 어떤 문자를 대응시키는가에 따라 여러 가지 인코딩 방식이 있는데 통상 아스키 코드 방식을 많이 사용한다. 아스키 코드(ASCII Table)는 0번부터 127번까지만 사용한다. 127번 이후 코드를 사용했던 적도 있었는데 이는 표준이 아니며 운영체제마다 다른 코드(문자)를 배치했기 때문에 호환이 되지 않는다. 윈도우즈 운영체제는 현재 128번부터 255번 사이에 포함된 문자를 출력하려는 시도에 대해 물음표(?)를 출력해서 사용하면 안된다는 것을 알려주고 128번과 255번 문자는 물음표는 아니지만 사용할 수 없는 문자이다.

128~255 특수 문자
0~127 자주쓰는 문자
0~31 특수제어코드

 

 

 

유니코드(Unicode)

나라마다 언어가 틀리고 아스키표도 다르게 되어있다. 아스키표가 많고 복잡하여 이를 해결하기위해서 유니코드가 나왔다. 각나라의 아스키표을 한곳에 모으는 것이다. 이때 아스키코드와 완벽 호환되는 가변길이 문자 인코딩(UTF-8)을 도입했다.

참고 자료: http://yhyacinth.github.io/general/2015/05/18/learn-about-unicode.html

 

 

 

 

UTF-8


UTF-8은 유니코드를 위한 문자 인코딩 방식으로, 가장 많이 사용되고있다. 유니코드는 한 문자를 나타내기 위해서, 1바이트부터 4바이트까지 사용한다. 이 중, 1바이트 영역은 아스크코드와 호환을 위한 영역으로 그 이후의 문자는 아스키코드와의 구별을 위하여 최상위 비트를 1로 표현한다.

출처 : 위키피디아

 

 

 

참고 자료

 


https://m.blog.naver.com/kimkwon429/220723064434

 

 

'Web' 카테고리의 다른 글

인코딩 디코딩  (0) 2021.11.09
DB Connection Pool  (0) 2021.11.05
XML & JSON & YAML  (0) 2021.10.30
[생활코딩] Home Server 강의 정리  (0) 2021.10.30
웹 소켓이란?  (0) 2021.07.04