여름 언덕에서 배운 것/👩💻 CS
문자열 인코딩
잔뜩
2023. 8. 3. 16:08
인코딩은 사람의 언어를 컴퓨터가 사용하는 이진코드로 변환하는 것
1. 아스키 코드
7비트의 고정길이를 가졌으며
미국에서 정의한 표준으로 영문 알파벳에만 적합
2. ANSI (아스키코드 확장판)
8bit 문자를 표현하는데 사용하며 총 256개의 문자를 표현
3. EUC-KR(Extended Unix Code-Korea)
한글 지원을 위해 유닉스 계열에서 나온 완성향 코드 조합
4. UTF-8(Universal Coded Character Set + Transformation Format - 8bit)
유니코드를 위한 가변 길이 문자 인코딩 방식 중 하나로 ANSI의 단점을 보완하기 위해 만들어졌습니다.
5. 유니코드
국제 표준화 기구(ISO)에서 만든 동일한 규칙으로 모든 언어를 표현할 수 있는 문자 집합
᛫ 유니코드 문자 집합을 표현하는 다양한 문자열 인코딩이 존재 (UTF-8, UTF-16, UTF-32)
728x90