[第一部 デジタルテクノロジー]
デジタルアーカイブ
サーバーシステムディスクアレイ (約500Gbyte) 数百万枚の写真がデジタルで収められるデータ量である。 総合研究博物館情報メディア研究室 |
ディスクアレイ内部 |
一方、1980年代後半から単純なデータも複雑なデータも管理することが出来るというRDBMSとODBMSの特徴を併せもったオブジェクトリレーショナルデータベース管理システム(ORDBMS)の研究が始まった。研究開発が進んだ結果、ORDBMSは現在RDBMS並みの性能が得られるようになり、これからの商用データベースの主流になろうとしている。ORDBMSの代表にUniversity of California Berkeley(UCB)で1986年から開発されたPOSTGRESがある。これはRDBMSにオブジェクト指向の機能としてクラス、継承、型、関数を取り入れて複雑なデータをとり扱いやすくしたものである。POSTGRESは、その後Illustraという製品として商用化されたが最近Illustraは大手RDBMSメーカInformix社のRDBMSと統合され性能を向上し、Informix Universal Serverと呼ばれるようになった。データベース問い合わせ言語は現在標準化が進んでいるSQL3に対応する。また近年のデータベースシステムでは取り扱えるデータ型も多様であるが、たとえばIllustraでは、2次元や3次元の空間データの扱うための2D/3D Spatial DataBlade、画像を扱うためImage DataBlade、時系列データを扱うためのTimeSeries DataBlade、画像検索用のVIR(Visual Information Retrieval)DataBladeなどがある。今までの画像データベースは画像にキーワードを付けてキーワードから検索するのが一般的だったが、VIR DataBladeを用いるとある画像に似た画像を検索したり、スケッチ画を描いて検索したりすることが出来る。
また従来のDBMSとは別のテキスト用データベースシステムも登場している。初期の段階では文書にキーワードをつけておき、合致する文書を検索するものだったが、コンピュータや記憶システムの性能向上、検索アルゴリズムの研究の進展により、大量のフルテキストを高速で検索することが実用になってきた。また類義語、反義語などあいまいな検索も出来るようになった。最近はフルテキスト検索技術は目的のWWWペ−ジを探し出すための検索エンジンとして脚光を浴びている。
Infoseek、Altavista、Excite、Hotbotなどに代表されるフルテキスト検索型の検索エンジンは日ごろ全世界のWWWペ−ジを検索エージェントが訪問してデータを収集して検索インデックスを作っており、数十万ページのフルテキストサーチを瞬時に行うことが出来る。
磁気メディアでは保存のためには定期的にバックアップを行う必要があり、大容量の長期保存用には光メディアが適しているとされる。1回のみ書き込み可能な光ディスクであるCD-Rの場合、加速試験によれば、冷暗所(摂氏25度、湿度40%の環境)では200年以上保存可能とされている。ただ直射日光に当てるとすぐ使用不能になる。
大容量記憶システムは、RAID(Reduntant Arrays of Inexpensive Disk)のように安価な磁気ディスクを組み合わせて、高信頼で高速大容量の記憶システムを構成したり、半導体メモリーを第一階層に、磁気ディスクを第二階層に、磁気テープ装置を第三階層にというように各々の記憶装置の特性を活かし、階層構造に組み合わせることにより、高速、安価、長期保存可能というような目標を達成しようとしている。
(坂村 健)
アドレス:/DM_CD/DM_TECH/DIG_ARC/HOME.HTM