XMLってなあに? その2

2001年1月14日(日)更新


たけち: この半年ほどで、いろいろな話やサンプルを見てもらって、XMLってなぁにってことが、な〜んとなく分かってきたと思うので、もう少し詳しく、歴史的な背景なども含めてお話しようと思うけど、どうかなぁ?

さらら: そうねぇ。実は、疑問のままたけちの話を聞いたりしているところもあるから、もう一度詳しく知っておきたいわ。

たけち: そっか・・・丁寧に説明しているつもりでも、意外に、はしょっちゃってるところもあったかもしれないね。じゃあ、タグ付けについてもう一度考えてみよう。

たけち


■タグ付けってなぁに?(タグ付けの考え方)

さらら: タグ付けって、<h1>とか<p>とかの"テキストの前後につける特別な印(しるし)"をつけること、だったわね。それがわかっていればいいんじゃないの?

たけち: もちろん、それがわかっていればいいんだけど、「タグ付け」って一言で言ってもいろいろな考え方があるから。。。。。

さらら: えっ、いろいろな考え方って?!

たけち: じゃぁ、次の図を見てくれる? 一番上は、単純テキスト(プレーンテキストとも言います)で、なんにもタグがついていないもの。下の二つが、タグを付けたテキストなんだけど、その考え方の違いがわかるかな?

さらら

情報をどのように表現・利用したいかの考え方の違いでタグ付けも違ってきますね

さらら: ひとつは、「見栄えに着目してタグをつけた」もので、もひとつは、「論理的な意味に着目してタグをつけた」場合なのね。。。。。そっかぁ〜。タグをつけるには「名前」が必要だけど、その名前のつけ方がいろいろあるってことなのね。

たけち: そうなんだよね。で、「見栄えに着目してタグをつけた」テキストは、論理的な意味を持っていないから、構造化テキストってわけじゃないんだよね。

さらら: えっ、どっ、どうして?

さらら


■構造化テキストってなぁに?

たけち: 図にしてみると分かりやすいんだけど、「見栄えに着目してタグをつけた」テキストでは、そのタグだけを見ても構造が見えてこないよね。でも、実際に文字の大きさが違うものを見たりすると、ぼくたちにはその論理的な構造がわかるよね。。。。これは、どうしてだと思う?

さらら: う〜ん・・・・・・・ちょっと図をよく見させてね。。。。。

論理的構造を意識したタグ付けをするとコンピュータにも構造を理解してもらえる

さらら: ・・・・・・・あっ、そうだったのね。私たち「人」は、文字の内容と大きさなんかで「あぁ、これはタイトルなんだわ」って自分の頭の中で「構造化」してたのね。

たけち: そうそう。そうなんだね。だから、コンピュータのソフトウェアでも僕たちが意識するような「論理的な構造」をタグ付けテキストとして作ってあげれば、ソフトウェアで処理することがとっても簡単になるんだ。

いまでもそうだけど、ワープロソフトなんかでは、この「論理的な意味に関する情報」と「見栄えに関する情報」がごちゃ混ぜになっているんだ。でも、XMLテキストを作ったり、利用したりするときにはこの二つのことをきちんと分けて考えることが必要なんだよ。

さらら: そうだったのね。たけちが言っている「構造化テキスト」っていうのは、コンピュータにも「論理的な構造」が理解できるタグ付きテキストのことなのね。それで、XMLの利用を考えるときには、それがとっても大切だって事なのね。

たけち: そうなんだ。だから、XMLだと自分で自由にタグを定義できるけど、そこには「見栄え」を意味するタグは入れないようにしようね。

さらら: は〜い。

→次はSGMLってなぁに?..... (^ ^)v