ロゴ

[第一部 デジタルテクノロジー]

デジタルアーカイブ


サーバーシステムディスクアレイ
サーバーシステムディスクアレイ (約500Gbyte)
数百万枚の写真がデジタルで収められるデータ量である。 総合研究博物館情報メディア研究室
ディスクアレイ内部
ディスクアレイ内部

データベース技術

大量のデジタルデータを効率よく管理するためにはデータベース管理システム(DBMS、Database Management System)が欠かせない。現在主流となっているリレーショナルデータベース管理システム(RDBMS、関係データベース管理システム)は、1970年代初頭にIBMのE. F. Coddが提唱したリレーショナルモデルに基づいており、すべてのデータを行と列からなる2次元の表形式で表す。データベース問い合わせ言語としてはSQLがISO(国際標準化機構)で標準化されている。一方、オブジェクトデータベース管理システム(ODBMS)は1980年代半ばから現れたもので、オブジェクト指向データモデルに基づいてオブジェクトを単位として複雑な構造のデータを管理することが出来る。文字と数字から成る単純なデータを扱う一般の事務処理にはRDBMSが向いているが、マルチメディアの場合はデータが巨大、連続メディアを扱う、時間に依存するなどの特徴があるのでODBMSが向いている。だがODBMSはデータベース問い合わせ言語を持たず、C++などのオブジェクト指向言語で直接操作し、単純なデータの取り扱いは必ずしも得意ではない。

一方、1980年代後半から単純なデータも複雑なデータも管理することが出来るというRDBMSとODBMSの特徴を併せもったオブジェクトリレーショナルデータベース管理システム(ORDBMS)の研究が始まった。研究開発が進んだ結果、ORDBMSは現在RDBMS並みの性能が得られるようになり、これからの商用データベースの主流になろうとしている。ORDBMSの代表にUniversity of California Berkeley(UCB)で1986年から開発されたPOSTGRESがある。これはRDBMSにオブジェクト指向の機能としてクラス、継承、型、関数を取り入れて複雑なデータをとり扱いやすくしたものである。POSTGRESは、その後Illustraという製品として商用化されたが最近Illustraは大手RDBMSメーカInformix社のRDBMSと統合され性能を向上し、Informix Universal Serverと呼ばれるようになった。データベース問い合わせ言語は現在標準化が進んでいるSQL3に対応する。また近年のデータベースシステムでは取り扱えるデータ型も多様であるが、たとえばIllustraでは、2次元や3次元の空間データの扱うための2D/3D Spatial DataBlade、画像を扱うためImage DataBlade、時系列データを扱うためのTimeSeries DataBlade、画像検索用のVIR(Visual Information Retrieval)DataBladeなどがある。今までの画像データベースは画像にキーワードを付けてキーワードから検索するのが一般的だったが、VIR DataBladeを用いるとある画像に似た画像を検索したり、スケッチ画を描いて検索したりすることが出来る。

また従来のDBMSとは別のテキスト用データベースシステムも登場している。初期の段階では文書にキーワードをつけておき、合致する文書を検索するものだったが、コンピュータや記憶システムの性能向上、検索アルゴリズムの研究の進展により、大量のフルテキストを高速で検索することが実用になってきた。また類義語、反義語などあいまいな検索も出来るようになった。最近はフルテキスト検索技術は目的のWWWペ−ジを探し出すための検索エンジンとして脚光を浴びている。

Infoseek、Altavista、Excite、Hotbotなどに代表されるフルテキスト検索型の検索エンジンは日ごろ全世界のWWWペ−ジを検索エージェントが訪問してデータを収集して検索インデックスを作っており、数十万ページのフルテキストサーチを瞬時に行うことが出来る。

大容量記憶技術

デジタル情報を大量に記録するためには大容量記憶技術が欠かせない。記憶技術は記録再生原理、メディアの形状などさまざまなものが現れ、実用化され進歩していったものもあり、消えていったものもある。コンピュータ外部記憶装置としての大容量記憶装置はまず磁気記録が実用化され、1953年にIBM726磁気テープ装置が、1956年にIBM305RAMAC磁気ディスク装置が登場した。その後40年以上に渡って飛躍的な進歩を遂げ、主力は記録密度の高い磁気テープからアクセス時間の短い磁気ディスクに移っていった。1970年代には、光記録方式もまずビデオディスクとして商用化され、磁気記録よりも高密度のメディアとして期待されてきた。

磁気メディアでは保存のためには定期的にバックアップを行う必要があり、大容量の長期保存用には光メディアが適しているとされる。1回のみ書き込み可能な光ディスクであるCD-Rの場合、加速試験によれば、冷暗所(摂氏25度、湿度40%の環境)では200年以上保存可能とされている。ただ直射日光に当てるとすぐ使用不能になる。

大容量記憶システムは、RAID(Reduntant Arrays of Inexpensive Disk)のように安価な磁気ディスクを組み合わせて、高信頼で高速大容量の記憶システムを構成したり、半導体メモリーを第一階層に、磁気ディスクを第二階層に、磁気テープ装置を第三階層にというように各々の記憶装置の特性を活かし、階層構造に組み合わせることにより、高速、安価、長期保存可能というような目標を達成しようとしている。

(坂村 健)

アドレス:/DM_CD/DM_TECH/DIG_ARC/HOME.HTM


前のページへ 目次へ 次のページへ