« つくばセンター付近の歩行喫煙は禁止 | メイン | 帰省最終日なのです »

2008年03月22日

横断検索の実現方法とか

帰省中ですが、図書館の話題です。マウスが無いので面倒…。

某所で「学術機関リポジトリの横断検索を開発する」という宣言をしたため、後に引けなくなりました…。既に 筑波大学学内プロジェクト 機関リポジトリ横断検索 があるんですけどね…。今回は、横断検索の種類について述べたいと思います。

はてなブックマーク - はじめての文献複写申込とか - Ceekz Logs
はじめての文献複写申込とか - Ceekz Logs

長野のやつは、いわゆる横断検索だと聞いてます。現状の各館のシステムは基本そのまま

長野県が県下の図書館にある蔵書を一括検索できるシステムを準備しているということですが、僕は NACSIS-CAT に参加すると思ったのですが、風の噂では「横断検索」になるということです。図書館界隈の「横断検索」と僕の思っている「横断検索」に相違があるかもしれませんが、3通りの実現方法があると思います。

名称は、適当です。

1. 非統合型メタ検索エンジン

検索デスクのような横断検索エンジンを指します。この横断検索では、複数の検索エンジンでキーワードを入力する手間が省けます。実装が非常に容易ですが、リンク集の応用版に過ぎません。

2. 統合型メタ検索エンジン

CEEK.JP の構造

CEEK.JP のような横断検索エンジンを指します。各検索エンジンに自動的にクエリを投げ、その結果を任意のアルゴリズムで統合して表示します。各検索エンジンにクエリを投げるため、対象検索エンジンが多数ある場合、表示まで時間がかかります(実装方法次第ですが)。一般的に、横断検索といえばこの方法を指すと思います。

蔵書検索の場合、書籍の ISBN で統合すれば OK です(全国書誌番号でも)。

3. 小規模ロボット検索エンジン

CEEK.JP NEWS の構造

CEEK.JP NEWS のような横断検索エンジンを指します。決められた範囲でデータを収集し、そのデータを検索できるようにします。横断検索とは似つかないかもしれませんが、各検索エンジンに含まれるデータを予め1箇所に集めておく方法です。この横断検索自身は、普通の検索エンジンとして振舞うので、表示まで時間がかかるということはありません(実装方法次第ですが)。しかし、データを収集するコストがかかります。

蔵書検索の場合、各図書館の蔵書情報を一箇所に集めておきます。国立情報学研究所の NACSIS-CAT は、この方法に該当すると思います。

利便性は、後者ほど高いのですが、実装困難性も後者ほど高くなります。ただ、蔵書管理システムのデータ形式が統一化されていれば、比較的楽かもしれません。データ収集で面倒なのは、各データ形式を解析する部分なのです。

僕が開発を進めている「学術機関リポジトリの横断検索」は、最後の「小規模ロボット検索エンジン」を採用します。学術機関リポジトリの大半が DSpace を利用しているため、データ解析が楽なのです。また、データを持てば、属性検索の実装や柔軟な表示が可能になりますので。

長野県は、どうするのかな。「小規模ロボット検索エンジン」を採用するのであれば、各図書館の蔵書管理システムを統合した方が良い気もしますが…。

本日のまとめ。

・学術機関リポジトリの横断検索を開発中です
・横断検索には3通りの実現方法があります
・小規模ロボット検索エンジン開発の依頼は私まで

---

神戸新聞|阪神・北摂|祝日開館へ 三田市立図書館、来月から試行

三田市立図書館と同館ウッディタウン分館が、四月から祝日も開館することが、十四日決まった。

先日、滋賀県立図書館が開館日を減らすという報道がありましたが、兵庫県の三田市立図書館は開館日を増やすそうです。休日である祝日に利用できるようになるのは、良いですね。

祝日開館により、年間開館日は十六日増える。ただし、現在休館日になっている火曜日が祝日の場合、翌日の平日を休む。

祝日に関わらず、火曜日は必ず休館という方がわかりやすいと思ったのですが、図書館としては、祝日は必ず開館というのを広めたいのかもしれませんね。利用できない日よりも利用できる日を伝える方が良いのかな。

ちょっとびっくりしたLibrary2.0 - Sweet Candy はてなダイアリー版

Web 2.0 は、多くの夢をみさせることにより、投資を促すことが出来ました。また、新しい概念のサービスも増えたと思います。Library 2.0 は、新しい図書館の夢をみさせてくれるのでしょうか…。

サービスが進化するとき、既存の概念を覆したり、法に抵触する場合もあります。日本の図書館は、公共団体の運営が大半であり、既存の概念を覆して進化するのは難しいのかもしれません。外部がそう考えるのは仕方ないのですが、仮に内部もそう考えているのであれば、決して進化は望めませんね…。

言い訳を考えるよりも、改善方法を考えよう。僕も気を付けているのですが、なかなか難しい…。

DORA-LOG: [今日のひと言]或る検索

人生経験豊富な人が、こんな若造に聞いて....と、すれば、私たちは恰も「この本を自力で探すことが出来た、図書館員なんか要らないな」というぐらいの達成感を得られるような形で最短ルートで手にする手伝いをする。

レファレンスに対する敷居の高さとして、利用者の「プライド」が挙げられていました。医者や弁護士が相手であれば、プライドを感じて利用しないということは無いと思う。レファレンス業務が利用者に見下されているのかな…。適切な情報(蔵書情報など)を得ることは、簡単に出来ることではないということを、利用者に理解してもらうにはどうすれば良いのだろう。

私たちは、webでのサービスを提供するために他のサービスを疎かにするとか、サービスの転換をするなどとは一切考えていない。

ウェブは既存業務のプラスアルファであるということは、非常に同意します。

筑波大学 | 最新情報 附属図書館にコーヒーショップオープン
中央図書館エントランスにスターバックスコーヒーがオープンしました。 - 新しい情報(全館共通) - TULIPS

筑波大学附属図書館にスターバックスがオープンしました。オープニングイベントの日時を知らなかったのですが、どこに掲示されていたのでしょうか?ウェブに掲示されると嬉しいけど、あまり望めない…。

詳しくは、実際に利用してみてから書くということで。

Tohru’s diary - 全政令指定都市の市立図書館のHPを一気に訪問、で感想と外部サーバ使用について

OPACだけ別サーバ(外部の委託業者サーバでというパターン)ってのが「どこのどんなサーバかも利用者に知らせないまま、利用者が気が付かないようにアクセスさせ、(場合によっては)利用者の個人情報をそのサーバで取り扱う」構造になっているから。

非常に同意です。急に別サーバに飛ばすのは、止めて欲しいと思う。

某氏に RefWorks の利用を勧められたのですが、使う気が失せたのを思い出しました。TULIPS を閲覧すればわかりますが RefWorks は、メニューの一部になっています。その為、筑波大学ドメイン(tsukuba.ac.jp)でホスティングされていると思ったら、違った!気づいたときは、大学のアカウントを入力した後でしたよ…。

附属図書館を信頼しすぎるのも良くないと言うことを今更ながら学びました。ページ移動前に警告を出したり、メニューの色を変えたほうが良いと思います。不注意が原因なので、八つ当たりみたいですが…。

愚智提衡而立治之至也: 学術機関リポジトリがRSSを吐いてないような気がする話

学術機関リポジトリの横断検索を開発します。横断検索を実装した暁には、フィード(RSS)出力機能を付けたいと思います。ただ、フィードを購読するほど、新しい論文がリポジトリに登録されているのかな…。

asahi.com:橋下知事、国際児童文学館を視察「図書館と統合を」 - 社会

向川幹雄館長は視察後、資料のうち50万点が文学発展に貢献するとして寄贈を受けたものと説明し、「文学館だからこそ寄贈が受けられる。統合されたら受けられない」と話した。

図書館では寄贈を受けられないという考えが面白いです。府立図書館だけに寄贈する理由が無くなるというのを危惧しているのでしょうけど、そもそも全ての図書館に寄贈しない理由は何だろう。また、各図書館が活動を PR することで(私ども図書館では児童文学の研究も行っていますとか)、寄贈を受けられないかな。

---

TULIPS の話題で書きたいことがあるのですが、まだ書けません。筑波大学附属図書館が作業を完了しないと書けないのですよね…。何時になったら書けるだろうか。

2008年03月22日 23:47 | Toshokan

トラックバック

コメント