[The University Museum]

デジタルアーカイブ


データベース技術

大量のデジタルデータを効率よく管理するためには データベース管理システム (DBMS、Database Management System) が欠かせない。 現在主流となっている リレーショナルデータベース管理システム (RDBMS、関係データベース管理システム) は、1970年代初頭にIBM E. F. Codd が提唱した リレーショナルモデルに基づいており、 すべてのデータを行と列からなる2次元の表形式で表す。 データベース問い合わせ言語としては SQL ISO (国際標準化機構) で標準化されている。 一方、オブジェクトデータベース管理システム (ODBMS) は1980年代半ばから現れたもので、 オブジェクト指向データモデルに基づいて オブジェクトを単位として複雑な構造のデータを管理することが出来る。 文字と数字から成る単純なデータを扱う一般の事務処理には RDBMSが向いているが、 マルチメディアの場合はデータが巨大、連続メディアを扱う、 時間に依存するなどの特徴があるのでODBMSが向いている。 だがODBMSはデータベース問い合わせ言語を持たず、 C++などのオブジェクト指向言語で直接操作し、 単純なデータの取り扱いは必ずしも得意ではない。

一方、1980年代後半から単純なデータも複雑なデータも管理することが出来る というRDBMSとODBMSの特徴を併せもった オブジェクトリレーショナルデータベース管理システム (ORDBMS) の研究が始まった。 研究開発が進んだ結果、 ORDBMSは現在RDBMS並みの性能が得られるようになり、 これからの商用データベースの主流になろうとしている。 ORDBMSの代表に University of California Berkeley(UCB) で1986年から開発された POSTGRES がある。 これはRDBMSにオブジェクト指向の機能としてクラス、継承、型、 関数を取り入れて複雑なデータをとり扱いやすくしたものである。 POSTGRESは、その後 Illustra という製品として商用化され、 だが、最近Illustraは大手RDBMSメーカ Informix 社のRDBMSと統合され性能を向上し、 Informix Universal Server と呼ばれるようになった。 データベース問い合わせ言語は現在標準化が進んでいる SQL3 に対応する。 また近年のデータベースシステムでは取り扱えるデータ型も多様であるが、 例えばIllustra では、 2次元や3次元の空間データの扱うための 2D / 3D Spatial DataBlade、 画像を扱うため Image DataBlade、 時系列データを扱うための TimeSeries DataBlade、 画像検索用の VIR (Visual Information Retrieval) DataBlade などがある。今までの画像データベースは画像にキーワードを付けて キーワードから検索するのが一般的だったが、VIR DataBladeを用いると ある画像に似た画像を検索したり、 スケッチ画を描いて検索したりすることが出来る。

また従来のDBMSとは別の テキスト用データベースシステムも登場している。 初期の段階では文書にキーワードをつけておき、 合致する文書を検索するものだったが、 コンピュータや記憶システムの性能向上、 検索アルゴリズムの研究の進展により、 大量のフルテキストを高速で検索することが実用になってきた。 また類義語、反義語などあいまいな検索も出来るようになった。 最近はフルテキスト検索技術は目的のWWWペ−ジを探し出すための 検索エンジンとして脚光を浴びている。

などに代表されるフルテキスト検索型の検索エンジンは 日ごろ全世界のWWWペ−ジを検索エージェントが訪問してデータを収集して 検索インデックスを作っており、 数十万ページのフルテキストサーチを瞬時に行うことが出来る。

大容量記憶技術

デジタル情報を大量に記録するためには大容量記憶技術が欠かせない。 記憶技術は記録再生原理、メディアの形状などさまざまなものが現れ、 実用化され進歩していったものもあり、消えていったものもある。 コンピュータ外部記憶装置としての大容量記憶装置は まず磁気記録が実用化され、1953年にIBM726磁気テープ装置が、 1956年に IBM305RAMAC 磁気ディスク装置が登場した。 その後40年以上に渡って飛躍的な進歩を遂げ、 主力は記録密度の高い磁気テープから アクセス時間の短い磁気ディスクに移っていった。 1970年代には、光記録方式もまずビデオディスクとして商用化され、 磁気記録よりも高密度のメディアとして期待されてきた。

磁気メディアでは保存のためには定期的にバックアップを行う必要があり、 大容量の長期保存用には光メディアが適しているとされる。 1回のみ書き込み可能な光ディスクであるCD-Rの場合、加速試験によれば、 冷暗所 (摂氏25度、湿度40%の環境) では200年以上保存可能とされている。 ただ直射日光に当てるとすぐ使用不能になる。

[サーバシステム ディスクアレイの画像]
サーバシステム ディスクアレイ (約500Gbyte)

数百万枚の写真がデジタルで収められるデータ量である
総合研究博物館情報メディア研究室

[ディスクアレイ内部の画像]
ディスクアレイ内部

大容量記憶システムは、 RAID (Reduntant Arrays of Inexpensive Disk) のように安価な磁気ディスクを組み合わせて、 高信頼で高速大容量の記憶システムを構成したり、 半導体メモリーを第一階層に、磁気ディスクを第二階層に、 磁気テープ装置を第三階層にというように各々の記憶装置の特性を活かし、 階層構造に組み合わせることにより、 高速、安価、長期保存可能というような目標を達成しようとしている。

(坂村 健)


[編者注] この展示内容に関する最新情報や関連資料等は、随時、 東京大学総合研究博物館のインターネットサーバ上の以下のアドレスで 公開、提供していきます。

http://www.um.u-tokyo.ac.jp/DM_CD/DM_TECH/DIG_ARC/HOME.HTM


[Up]

[Logo]

Copyright (C) 1997 Tokyo University Digital Museum
Version 1.1
web-master@um.u-tokyo.ac.jp