文字集合
 ● JIS X 0201/● JIS X 0208

● JIS X 0201

 JIS X 0201は,ISO646の規格に準拠して,策定された日本語を扱うための文字集合である.JIS(日本工業規格)という名前からもわかるように,日本工業標準調査会が定めた,日本で標準化された規格である.JISの規格はその種類ごとにA,B,C……とアルファベットの部門が振られている.Aなら土木および建築,Bなら一般機械,といった具合で,Xは情報処理の部門を表す.策定当時はJIS C 6220(Cは「電子機器及び電気機械」部門)だったのだが,その後X部門が新設されて,1987年にそちらに移された.

 JIS X 0201では,ISO646の規格どおりに2枚の面をもつ.第1面は変更可能な文字のうち,バックスラッシュ「\」(05/12)が円マーク「¥」に,チルダ「〜」(07/14)がオーバライン「 ̄」になっており,これらの第1面の文字はまとめて「JIS ラテン文字」と呼ばれる.そして第2面には,カタカナ(いわゆる半角カナ)が割り振られている.その文字一覧を図5に示す.

〔図5〕ISO646準拠の日本語文字集合 JIS X 0201

● JIS X 0208

 JIS X 0208は1978年にJIS C 6226として定められた,全角のひらがなやカタカナ,漢字といった文字を扱うための文字集合である(JIS X 0208という名称になったのは1987年).JIS 第1水準漢字と第2水準漢字やひらがな,カタカナ,各種記号やキリル文字(ロシア文字),ギリシャ文字,罫線素片など6879字を収録している.

 JIS X 0208では面ではなく「区」という区切りで,文字列を区分しており,そして,その区の中にある文字の位置を「点」という数値で表す.そのため,JIS X 0208のことを「区点コード」とも呼ぶ.JIS X 0208では94の区をもち,おのおのの区には94文字を収録可能である.各区には,表1のような文字列が割り当てられている.第1水準漢字は音読み順,第2水準漢字は部首順,同じ部首では画数順におさめられているのが特徴である.

〔表1〕JIS X 0208の各区に割り当てられている文字
1区,2区 各種記号
3区 算用数字,アルファベット
4区 ひらがな
5区 カタカナ
6区 ギリシア文字
7区 キリル文字
8区 罫線素片
9区〜15区 未定義
16区〜47区 第1水準漢字
48区〜84区 第2水準漢字
85区〜94区 未定義

 JIS X 0208は,1978年の策定以後,1983年,1990年,1997年と3回の改訂を経ており,それぞれの改訂で,内容が若干異なってきている(表2).そのため,規格の番号の後に年号を付け,JIS C 6226-1978,JIS X 0208-1983(JIS C 6226-1983),JIS X 0208-1990,JIS X 0208-1997のように呼ぶ.とくに1983年の改訂では,かなり多くの文字が変更になったため,それまでのJIS C 6226-1978を旧JIS,JIS X 0208-1983以後を新JISと呼ぶ場合もある.

〔表2〕JIS X 0208の変遷
定 義 前の版からの変更
JIS C 6226-1978 初版
JIS X 0208-1983
JIS X 0208-1990
JIS X 0208-1997 文字に追加なし

以降の内容は本誌を参照ください

インデックス
 ◆コンピュータと文字の関係
 ◆文字集合と符号化方式
 ◆文字集合
NEW● ASCII/● ISO646
NEW● JIS X 0201/● JIS X 0208

今月号特集トップページへ戻る


Copyright 2002 水野貴明