본문 바로가기

프로그래밍/기타

유니코드(Unicode)와 UTF-8

728x90
반응형

# 유니코드

전 세계 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계한 산업 표준코드다.

과거에는 컴퓨터가 영어와 일부 특수문자만 사용했고 이를 저장하기 위해 각 문자별로 1byte식 사용되었다.

시대 흐름에 따라 영어권 외 타국에서도 컴퓨터를 사용하기 시작했고 해당 국가는 자국어도 컴퓨터에 표시하기 위해

1byte에 영어 대신 자국어를 입력하였다.

그러나 이 경우에는 타국의 네트워크에 접속할 때 표준이 맞지 않기 때문에 문제가 되었고 이를 해결하기 위해 산업 표준인 유니코드가 개발되었다.

 

# UTF-8

유니코드를 인코딩하는 방식으로 문자마다 byte 길이가 다른 가변 인코딩 방식이다.

UTF-8은 표현 가능한 길이는 최대 6byte지만 다른 인코딩과 호환을 위해 4byte까지만 사용한다.

아스키 코드 0~127까지는 1byte식 사용한다.

그리스어, 히브리어 등 라틴계통 언어나 몇가지 계통은 2byte식 사용한다.

한글은 3byte식 사용한다.

4byte는 주로 안쓰는 문자들에 대해서 사용된다고 한다.

 

 

 

 

 

 

다람쥐와 포동포동이

 

 

 

RememberCook 9월 28일 정식 출시!

두번째 게임인 RememberCook이 출시되었습니다. 귀여운 캐릭터들이 나오는 간단한 게임이며 플레이어의 공간인지능력을 테스트하는 게임입니다. 아래 링크를 통해 다운 받으실 수 있으니 많은 관

chipmunk-plump-plump.tistory.com

반응형