コンピュータープログラムで、アスキーコードの値を確かめたければ、以下のようにすれ ばよい。
#include <stdio.h> int main(void){ char c; c='L'; printf("L = %d\n",c); return 0; }
この例で分かるように、文字型変数(char)を用いて、文字を格納することができる。 しかし、この文字型の変数は、-128〜127まで2の変数しか格納できない3ことになっている。従って、文字型の変数で表現できるのは256 種類の文字に限られる。アルファベットを使う文化圏では、それで問題ない。多くのコン ピューターでは、英数字はこのアスキーコードが使われる。0〜255と言うのは、16進数で 2桁である。
ここは少し難しいが、とりあえず説明しておく。文字型の単純データ構造では、1バイト のデータが格納できる。1バイトは8ビットで、0〜255の整数が格納できる。255は、 である。
その解決のために、日本語はアスキーコードとは異なる文字コードが使われる。代表的な のが、
日本語euc extend unix codeの略で、主にUNIXで使われる。である。いろいろあるが、すべて文字と整数との対応が決められている。ただし、コード 毎にその対応は異なる。例えば、「秋」という漢字は、表1のようになっ ている。
shift-jis 主にパソコン(DOSやWindows, machintosh)で使われている。
JISコード 日本工業規格 JIS(Japanse Industrial Standards)が決めたコード。
ユニコード 漢字を含む世界のすべての文字を全部表現できるコード。