C言語のプログラムで,アスキーコードの値を確かめたければ,以下のようにすればよい. 文字'L'を表す整数値を表示するプログラムである.実行結果から分かるように,文字'L' は16進数で4c,10進数で76である.教科書 [1]のp.374の アスキーコード表と比較せよ.
#include <stdio.h> int main(void) { char c; c='L'; printf("%c = %x\t%d\n",c,c,c); return 0; }
L = 4c 76
この例で分かるように,文字型変数(char)を用いて,文字を格納することができる. しかし,この文字型の変数は,-128〜127まで2の整数しか格納できない3ことになっている.従って,文字型の変数で表現できるのは256 種類の文字に限られる.アルファベットを使う文化圏では,このように256文字もあれば 全ての文字が表現できる.0〜255と言うのは,16進数で2桁--2進数で8桁--でコンピュー ターにとって都合が良い.
日本語euc extend unix codeの略で,主にUNIXで使われる.いろいろあるが,すべて文字と整数との対応が決められている.ただし,コード毎にその 対応は異なる.例えば,「秋」という漢字は,表1のようになっている. 英数字では16進数で2桁--1バイト--に対して,日本語では4桁--2バイト--必要である.
shift-jis 主にパソコン(DOSやWindows, macintosh)で使われている.
JISコード 日本工業規格 JIS(Japanese Industrial Standards)が決めたコード.
ユニコード 漢字を含む世界のすべての文字を全部表現できるコード.