古典文学とXML

2000年8月7日(日)更新


■単純な「万葉集テキスト」じゃ、だめなの?

たけち: XMLの作り方やXSLの使い方などを説明してきたから、なんとなくXMLってものが分かってもらえたと思うので、ここからは、万葉集などの古典文学のテキストをXMLにすると何がいいのかを少しずつお話しようね。

さらら: うん。でも、まだまだXMLやXSLについては分からないこととかあるから、そっちもよろしくね。

たけち: そうだね。どんどん新しいことが出てくると思うから、いっしょに勉強を続けていこうね。。

さらら

さらら: ねぇ、たけち。でもねぇ。。。。万葉集はすでにいろんな人たちが電子テキストを作ってくださっているから、内容を見るにはそれで十分だと思うんだけど。それに、必要なことを探したければ、メモ帳なんかのテキストエディタ(テキスト編集用のソフト)で「検索」できるじゃない?! たとえば、「額田王(ぬかたのおおきみ)」の歌を知りたければ、「検索する文字列」に「額田王」って指定すれば見つかるじゃない。。。。そうでしょ。それ以前は、本を全部読んで探してたけど、これならずっ〜と早くて、間違いも無いし。便利だわよね。

たけち: うん。確かに、さららの言うとおりだけど、もっと別の場合を考えてみようよ。 う〜ん。じゃぁねぇ。「明日香」が詠まれている歌をさがしてごらん。

さらら: あら、そんなの簡単だわ。万葉集のテキスト(第1巻)(注1)を開いて・・・・・「明日香」で「検索」すればいいのよね。。。。。。。あら、7番の歌が最初に見つかったけど、、、、これって違うわね。 (^ ^; あれれ

たけち: これは、「明日香川原宮御宇天皇代」って載ってて「斉明天皇(さいめいてんのう)の時代」のことだよね。歌は次のもので内容は「明日香」とは違うよね。

  • 秋の野のみ草刈り葺き宿れりし宇治の宮処の仮廬し思ほゆ

さらら: うっ、う〜ん。そうね。

たけち: 続けて検索してみるとわかるけど、「明日香」には、この他にも「明日香宮御宇天皇(天武天皇)」、第二巻には「明日香皇女(あすかのひめみこ)」が登場するんだ。もちろん、地名としての「明日香」もでてくるよ。

さらら: そうかぁ。そう言われるとそうだわね。あんまり深くは考えて無かったわ。。。。じゃあ、もっと確実に調べられるようにするにはどうしたらいいのかしら。今、調べたかったのは「地名」としての「明日香」なんだけど、「天皇の代」としてや「人名」としての「明日香」が出てきちゃったのよね。。。。。あっ、そうかぁ!!

たけち: あっ、わかっちゃったみたいだね。そうなんだ。おなじ「明日香」でも、「人名」なのか「地名」なのかなどを区別できればいいんだよね。それには・・・・

さらら: XML!!

たけち: そう。今回は万葉集での例をちょっと考えてみただけだから、他の文献との関連も考えてみたいと思うんだ。それから、XMLにするにはどうしたらいいか、XMLにしてからどうするのか、ということについてもね。

さらら: うん。おもしろそう!! (^ ^*)

→ 次は、便利な点をもう少し整理してみたいと思います。
DTD(Document Type Definition)についても説明を開始します (^ ^)v


注 1): 「たのしい万葉集」で掲載しているテキストは、山口大学の吉村誠先生が公開されている万葉テキストを利用させていただいています。ここでも、それを題材にさせていただきます。ここでは、サイズの関係から、「第1巻」だけにさせていただきます。

注 2): 山口大学の吉村誠先生が公開されている万葉テキストには、すでに歌ごとに、作者・天皇名・地名・草花・歌の区別などがキーワードとして掲載されていて、すぐれた万葉集テキストとなっています。