프로그래밍/기타
2021. 2. 10.
유니코드(Unicode)와 UTF-8
# 유니코드 전 세계 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계한 산업 표준코드다. 과거에는 컴퓨터가 영어와 일부 특수문자만 사용했고 이를 저장하기 위해 각 문자별로 1byte식 사용되었다. 시대 흐름에 따라 영어권 외 타국에서도 컴퓨터를 사용하기 시작했고 해당 국가는 자국어도 컴퓨터에 표시하기 위해 1byte에 영어 대신 자국어를 입력하였다. 그러나 이 경우에는 타국의 네트워크에 접속할 때 표준이 맞지 않기 때문에 문제가 되었고 이를 해결하기 위해 산업 표준인 유니코드가 개발되었다. # UTF-8 유니코드를 인코딩하는 방식으로 문자마다 byte 길이가 다른 가변 인코딩 방식이다. UTF-8은 표현 가능한 길이는 최대 6byte지만 다른 인코딩과 호환을 위해 4byte까지만 사용한다...