관리 메뉴

여름 언덕에서 배운 것

문자열 인코딩 본문

여름 언덕에서 배운 것/👩‍💻 CS

문자열 인코딩

잔뜩 2023. 8. 3. 16:08

 

인코딩은 사람의 언어를 컴퓨터가 사용하는 이진코드로 변환하는 것

 

1. 아스키 코드

7비트의 고정길이를 가졌으며

미국에서 정의한 표준으로 영문 알파벳에만 적합

 

2. ANSI (아스키코드 확장판)

8bit 문자를 표현하는데 사용하며  총 256개의 문자를 표현

 

 

3. EUC-KR(Extended Unix Code-Korea)

한글 지원을 위해 유닉스 계열에서 나온 완성향 코드 조합

 

4. UTF-8(Universal Coded Character Set + Transformation Format - 8bit)

유니코드를 위한 가변 길이 문자 인코딩 방식 중 하나로 ANSI의 단점을 보완하기 위해 만들어졌습니다.

 

5. 유니코드

국제 표준화 기구(ISO)에서 만든 동일한 규칙으로 모든 언어를 표현할 수 있는 문자 집합

유니코드 문자 집합을 표현하는 다양한 문자열 인코딩이 존재 (UTF-8, UTF-16, UTF-32) 

728x90

'여름 언덕에서 배운 것 > 👩‍💻 CS' 카테고리의 다른 글

CPU  (0) 2023.08.14
모듈  (0) 2023.08.14
dir( 간단한 쉘 명령어 몇가지)  (0) 2023.08.03
JDK(Java Development Kit) , 환경 변수 설정 이유  (0) 2023.08.03
코드  (0) 2023.08.03