インストラクターブログ

和田英一先生来訪(1)

こんにちは。学生スタッフのT. M. です。情報科学専攻の修士2年生です。先日、和田英一先生がなるほど科学体験館に来訪されました。その時の会話で面白いと感じた、文字符号について今回はお話ししようと思います。

現代のコンピュータは何でも0と1の羅列で表して情報を処理します。文字を表すときは0と1の羅列で数字を表し、その数字と文字を一対一対応させています。この対応関係が文字コードと呼ばれるものです。世の中には様々な文字コードがありますが、和田先生からはごく初期の文字コードについてのお話を聞くことができました。

ごく初期のコンピュータは、テレタイプ装置を用いてキーボードの入出力を行っていました。そのため、通信にはITA2 (別名 Baudot Code)*1が用いられていました。1文字が5ビットで構成されていて、通信用の文字コード配置のため、若い番号から「E」「改行文字」「A」…と割り振られていました。5ビットでは32種類しか扱えず、アルファベットと数字を両方入れようとすると収まりませんから、アルファベットと数字をシフトさせて使っていました。

現代の文字コードは、ASCIIコードを発展させた文字コードが多いです。ASCIIコードは7ビットで定められましたが、今は1バイト(8ビット)単位で扱われています。ASCIIコードは情報処理用のため、ABCDE…の文字それぞれが連番で定められています。

いま、このページを書いているUTF-8もまたASCIIコードを発展させた文字コードです。

[*1] 国際電気通信連合(ITU)のITU-T勧告S.1(英語,外部サイト)


タイプボール