XMLのWebページ制作における8箇条

(1)XML文書であることを宣言する

 まず,1行目には,いま制作しているファイルが,XMLであることを明記します.XML文書の宣言を書くわけです.versionには,XML規格のバージョンを指定します.現在のバージョンは1.0ですので,xml version="1.0" のように書きます.注:2

(2)文字コードを指定する

 XML文書の宣言に続けて,XML文書の文字コードを指定します。encoding="文字コード"のように書きます.文字コードには,仕様で勧められている「Unicode(UTF-8またはUTF-16)」や,Windows環境では一般的な「Shift_JIS」があります.Windows95,98版のメモ帳は,Unicodeをサポートしておらず,Shift_JISで保存されるため,本書のサンプルではShift_JISを指定しています.

 XMLの基本の用語

 XMLの解説を読むうえで必要な用語を,7個だけ記憶にとどめてください(図1).

 

<図1>XMLの基本用語

(約7Kバイト)

 要素には属性を持たせることができます.

 <題名 出版社="CQ出版社">XMLサンプル集</題名>といったタグ付けをした場合,「出版社」は属性名,「CQ出版社」はその値です.

(3)XML文書には,一つのルート要素を書く

 XML文書の各々の要素は,HTMLと同様,入れ子になっています.

 リスト1は,要素「全体」の中に,要素「題名」があるという構造になっています。この場合,入れ子の内側の箱から外側の箱を見ると,外側が親になります.逆に,外側の箱から内側の箱を見ると子になります.つまり,お母さんのお腹に赤ちゃんがいるような関係です.入れ子の関係では,相対的な親子関係が成り立つわけです.

 この親子関係は,ツリー(tree=木構造)でも表現できます(図2).注:3木に根っこ(=root)があるように,XML文書のソースにも必ず根っこ(一つのルート要素)が必要です.リスト1のXML文書では,<全体></全体>がルート要素です.

 

<図2> 木構造と入れ子の図

(約7Kバイト)

 

(4)全ての要素は正しく入れ子にする

 XML文書の各々の要素を,きちんと入れ子にする必要があります.たとえば,リスト1で,親子関係を無視して,<全体><題名>XMLサンプル集</全体></題名>などと誤って書くと,ブラウザはエラーを返します(図3).

 

<図3> IE5.01で表示されるエラーメッセージ

(約6Kバイト)

(5)すべての要素には,終了タグを書く

 XMLの場合は,HTMLと異なり,必ず終了タグを書く必要があります.

 たとえば,リスト1で</題名>という終了タグを書かなければ,ブラウザは,エラーメッセージを返します(図4).

 

<図4> IE5.01で表示されるエラーメッセージ

(約6Kバイト)

(6)指定した文字コードで保存する

 リスト1(「XMLサンプル集」という文字列を内容とするXML文書)を,任意のファイル名,たとえばtest.xmlといった名前で保存してください.XML文書の拡張子は,.xmlです.

 XML文書の文字コードにShift_JISを指定していますので,Windows95,98版のメモ帳では,そのまま保存してください.注:4

(7)属性値は,二重引用符で挟む

 XMLの要素には,属性を持たせることができます。<題名 出版社="CQ出版社">XMLサンプル集</題名>では,要素名(ここでは「題名」)と属性名(ここでは「出版社」)の間は,半角スペースを空けます.XMLでは,属性値(ここでは「CQ出版社」)は,必ず二重引用符で囲まなければなりません.

(8)大文字,小文字を区別する

 タグには,日本語だけでなく,英字を使ってもよいのですが,HTMLと異なり,XML文書では,大文字・小文字の区別が重要です.大文字・小文字を書き分ける習慣を付けておきましょう. 

 では,作成したXML文書をIE5.01で開いてみます.XML文書を開くと,ソースのツリーが表示されます(図5).

 

<図5> IE5.01で表示されるソースのツリー

(約4Kバイト)

 ブラウザでソースのツリーがきちんと表示できるということは,タグの閉じ忘れや,スペルミスといった間違いがないということです.一箇所でも間違っていると,エラーメッセージが表示されます.正確にタグ付けできているかどうかを,ブラウザが教えてくれるわけです.


注:2 HTMLのドキュメントタイプ宣言のようなものです.

注:31XMLの各タグの関係は,ディレクトリ(フォルダ)のツリーのような階層構造になっています.たとえば,このサンプルでは,「全体」の下に「題名」があります.
 この構造,何かに似ているとおもいませんか?そうです,家系図です.上が親で,下が子孫です.親にあたる部分は,根っこ(=root)で,根っこのある位置はルートです.根っこのほうが上に書かれているから,バオバブの木みたいですね.

注:4 メモ帳以外のテキストエディタ,「秀丸」やWindows98版の「ワードパッド」をお使いの場合も,デフォルトはShift_JISですから,そのまま保存してください.保存前に文字コードを確認したい場合は,XML文書で指定した文字コードにします.
 XML文書中で指定した文字コードと保存した時の文字コードは統一する必要があります.


Copyright 2000 PROJECT kySS 薬師寺 国安 薬師寺 聖

 

新刊のご案内


Copyright 1997-2001 CQ Publishing Co.,Ltd.