デジタルミュージアムを支える技術
基礎技術

博物館TAD

− 坂村健 −

博物館資料のデジタル化——デジタルアーカイブを行う場合、そのデジタル化したデータのフォーマットには、多様な属性記述能力と同時に一般性という、トレードオフ的な二つの性質が求められる。

例えば、デジタルアーカイブに一つの土器を収納する場合、その形状データ、テクスチャ、X線CT（Computer Tomography：コンピュータ断層撮影）のデータ、土の組成分析データ、文様の解説…など多様なものがあり、かつそれぞれが関連を持っている。例えば外観とCTのデータは、CT断面と形状の位置関係について三次元的にマッピングされていることが望まれる。文様の解説と外観のどの部分に対応するかも同様である。また、これらと別にその土器がどこの発掘現場でどのような状態で発掘されたかという情報も必要になる。一方、後世の陶器になれば、釉薬の化学分析データといったものも加わるであろうし、逆に発掘データのかわりに作った陶工の名前から何という大名の手を経てどこかの旧家の倉から見つかった、などといった由来を記述しなければならないかもしれない。さらには古文書などでは、当時の発音で読み上げた音声情報を付け、その場合時間と文書との対応も必要となるだろう。このように、個々の資料の特性に注目すると、多数のジャンルごとに多種多様なデータフォーマットを用意しなければならないということになる。

しかし、一方、土器の文様がどのように後世に影響を与えていったかといった時代方向や、他の地域の他の物品の文様にどのように影響を与えたかといった水平方向の関連を研究するには、デジタルアーカイブされたデータのフォーマットがジャンルごとに個別化するのでなく、できる限り一般化していることが望ましい。また、21世紀の分散ミュージアム構想を実現するためにも、博物館の持つデータベースが標準的なフォーマットを持つことが望まれる。しかも、この場合の一般化は、単に人間が読んで理解することを期待してテキストファイルをつけそこに解説を書き込むといった安易な一般化ではない。きちんとデータ構造を決め、それぞれの項目の意味も定義され、コンピュータが理解し処理できるものでなければならない。そうでなければ、複数の博物館のデータベースを結んで横串を通すように統合検索することは出来ない。

このために、我々は博物館TADという、博物館用の属性記述データフォーマットを開発することとした。TADは "TRON Application Data-bus" の略で、東京大学坂村研究室で研究開発しているコンピュータ体系——TRONのアプリケーションを超えて標準化されるデータフォーマットの名前である。TADの中のテキストデータの基本である文字コードはTRONコードと呼ばれ、事実上無限の文字収容能力を持ったオープンなコードであり、古今東西の文字十三万文字を収容し現在も文字収集を継続中である。博物館では、通常の文字コードにない多くの考古学的な文字を必要とするが、博物館TADはこのTADのバリエーションとして開発されているため、使えない文字という問題はない。

しかし、先に述べた多様性と一般性という二つの要求の両立は、文字の問題以上に難しい。なぜならば、博物館ごと、博物館における学科ごと、さらには資料のジャンルごとなどにそれぞれ必要な属性記述があり、それらは、共通するものもあれば、特異なものもあるからである。無理に一般化すれば記述能力が下がるし、逆に特殊例に対応すれば一般性はなくなる。我々は「コンピュータの理解」として本格的な人工知能のようなものを想定してはいない。そのため、ここでいう「理解」とは異なるコンピュータ間でメタタグを付けて送り、送られたコンピュータでどういう処理が可能かが一般的にわかるというレベルの標準的な記述を意味している。しかし、そのメタタグのセットを決定するには、完全な属性セットの規定が必要となってしまう。新たな発見がなされることにより新たな属性記述の枠組みが必要とされる可能性も常にある。その意味でも、最初から完全な属性セットを規定することは不可能である。

つまり、それらの——おそらく無限にデータタイプが増え得るような——多様なデータを結びつけ、一つの「収納物」としてオブジェクト化する枠組みが必要なのである。そこで、我々は、オブジェクトオリエンテッド言語により、元になるクラスからローカルに必要最小限の定義を加えることで新しい属性記述のセットを生成することができる、記述の枠組み——PCO (Portable Compound Object) を開発した。そしてその定義はネットワーク中に分散して保存され、解釈のため必要になるとそれがネットワーク経由で参照されるとした。ネットワークの中で、このタグが「理解できる」というのは、そのタグの定義がより基本的なタグとの関係でどんな処理ができるかを含め定義されており、必要に応じてその定義が取り寄せられるという環境を構築するということである。このような環境とすることで、応用ごとの細かい必要に応じていつでもタグ定義を追加できるようになる。

PCOにより、拡張可能な分野ごとの記述クラス・ライブラリとして、収蔵物のカテゴリーごとの属性を定義する。具体的な個々の収蔵物の記述はそのクラスのインスタンスとして、パラメータに具体値をいれて作る。クラスは継承関係を持てるので、例えば「土器」という基本クラスから、個々のジャンルで必要な属性を追加していくことで、「縄文土器」さらには「弥生土器」というような具体的なクラスを定義することになる。

このような枠組みを利用することで、ネットワークでの属性定義のための通信量を最小限に押さえることができる。クラス定義をキャッシングすることにより、よく使う分野の定義については通信せず、定義が更新されたときや、取り込んだデータのなかに知らないタグが有った場合のみ最小限の通信を行うようにできる。さらに、オブジェクト指向とすることで、個々のクラスの継承関係を逆にたどり相互の項目を基本クラスからどう展開しているかを知ることができ、二つの異なるクラスベースに記述された属性を相互の関連に基づき翻訳できるようになる。

世界の博物館にある資料すべての完全な属性セットの規定といったことは、誰かがプロジェクトとして実現しようとしたら、あまりの労力に不可能と思われることである。しかし、このような枠組みが広く運用されることにより、全体のためのボランティアという意識はなく、あくまで自分達の博物館のためというインセンティブを持った多くの人々によって、たがいに関連付けられた属性セットのネットとして、人類の「知的遺産」である博物館資料の記述が広く分散的に充実していくことを期待している。

将来的には、全世界の博物館がネットワーク接続され、自由に高速のデータ交換が可能になるであろう。そうなれば、他の博物館の展示フロアにも仮想空間を通して空間を接続することも可能となる。全世界に置かれた博物館が接続されたメタ博物館が実現するのである。

デジタルミュージアムを支える技術 基礎技術

博物館TAD

デジタルミュージアムを支える技術
基礎技術