連載 第16回(最終回) メールで画像ファイルを送るしくみ
これまで,インターネットにおいて電子メールが届けられるしくみを解説しました.今回はこのメールの中身の話です.当初,メールシステムは文字(文章)を送るためのしくみとして作られてきました.最近では,メールシステムを拡張してメールを使って画像や音声を送ったり,ファイルを添付して送ることができるようになりました. そこで,今回は,文字以外の情報をメールによって送受信するためのしくみやファイルをメールに添付して送受信するためのしくみについて解説します. ASCII文字以外の情報を送るしくみ インターネットのメールシステムはもともと英語文化圏で設計されたために,A,Bや1,2,3などいわゆるASCII文字を送ることを前提としています.そのため日本語で使われるひらがなや漢字といった文字を送ることができません. ASCII文字は7ビットの情報があれば表すことができます.しかし,ひらがなや漢字は少なくとも14ビット程度の情報がなければ表すことができません.そのため,漢字1文字をASCII文字2文字使って表すしくみが日本のコンピュータでは広く使われています.この取り決めが,JIS漢字コードやシフトJIS漢字コード,EUC漢字コードと言われるものです. ● JIS漢字コード JIS漢字コードでは,図1のように漢字コードをASCII文字で表します.そして漢字を表すASCII文字全体を漢字の始まりと終わりを表す文字で囲みます. つまり「見た目はASCII文字なんですが,ここからは漢字コードを表しているので,画面に表示するときは漢字に対応させてください.」といったように解釈します. この漢字の始まりと終わりを表す文字もASCII文字でできているので,見た目はすべてASCII文字です.そのため,ASCII文字しかやりとりできないネットワークを使って,漢字を含む文章をやり取りするときに使われます. インターネットの電子メールも,日本ではJIS漢字コードを使うことが通例となっています.また,JIS漢字コードは,国際的な文字定義の規格であるISO-2022に従っているため,ISO-2022-JPコードと呼ばれることもあります. 〔図1〕JIS漢字コードによる漢字の表現 ● シフトJIS漢字コード マイクロソフト社を中心に開発された漢字の表しかたです.図2のようにASCII文字ではない文字を使うことで漢字の始まりを表しています.JIS漢字コードのように,始まりと終わりを表す特殊な文字コードを必要としません.そのため,漢字1文字は必ず2バイトとなり,メモリに格納するためには都合がよくなっています. ASCII文字以外の文字(つまり8ビットめ)も使うため,ASCII文字しか使えないネットワークではシフト漢字コードでは漢字が正しく送れません. 〔図2〕シフトJIS漢字コードによる漢字の表現 ● EUC漢字コード(Extended UNIX Code) UNIXで漢字を使うために開発された漢字の表しかたです.EUCでは,日本の漢字だけではなく,韓国語EUCや中国語EUCなども定義されています.図3のようにシフトJIS漢字コードと同じく,ASCII文字以外の文字も使います. 〔図3〕EUC漢字コードによる漢字の表現