'자료구조'에 해당되는 글 1건

  1. 2008.06.07 utf-8 과 유니코드의 차이점
Tip And Tech2008.06.07 11:38

예전에 언어코드를 설계할 때 지금처럼 다양한 국가나 특수 문자 등의 설계가 포함되지 않았었다.
그래서 8비트의 아스키코드(ASCII : American Standard Code for Information Interchange)에서
확장된 16비트의 유니코드(Unicode)가 만들어지게 되었다.
하지만 아스키 방식은 문자당 1바이트를 사용하는데 반해 유니코드는 2바이트를 사용하게 되었다.
따라서 이러한 크기를 줄이기 위해 만들어진 것이 utf-8이다.
이 UTF-8은 아스키 코드의 영문이나 숫자등은 1바이트 형태로 표현하고 기타 국가언어는 2바이트 형태로
아스키와 유니코드를 혼용한 표현방식이 된 것이다.

Posted by 정윤수 버터백통