« ドリコムがニュース検索エンジンをリリース | メイン | 一日一食ココスです »

2004年06月23日

勝手に技術的検討

株式会社ドリコムが公開した News&Blog Search を勝手に(重箱の隅をつついた)技術的な観点から見てみようと思う。といっても、技術力の無いやつが検討してるのでハチャメチャだがw

現在、8のカテゴリーに分け、20のニュースサイトと12のブログポータルサイトを巡回対象としているようです。
さて、数は時間の問題だからすぐに追いつかれます。きっと。んで、ちょっと思ったのだが、ニュースとブログを同列に扱っていいのかな。ニュースは、公共の報道、ブログは、個人の報道という意味合いがあると思うのです。それを混ぜちゃうのはどうなんだろう。関連記事を表示するときに、もっと区別がつきやすいほうが便利だと思う。

クローリングについて というページによりますと、ニュースよりブログの方を重視しているみたいです。また、カテゴリ、ジャンルごとの記事一覧ページの巡回は、多分リソースの無駄ではないかと思う。CEEK.JP NEWS も当初はそのように巡回していましたが、現在では、基本的に、ニュースサイトのトップページを巡回することにしました。もしかしたら、トップページには載らないニュースがあるかもしれないけど、そんなニュースは報道側にとって重要度がかなり低いんだ。と割り切ってます。

関連記事摘出に関してだけど、まだ精度が低いかな。って感じがする。これは、単なる類似記事の摘出という意味だけではないです。もっと他に使える情報があると思うのですよ。もう使ってると思うけど _| ̄|○ でも、立命館大学の教授独自のテキストマイニング技術らしいので、日本での適すとマイニング技術はこれが限界なのかもしれない。

隅をつついた検討なので、全体的な技術はすごいと思う。それが原因なのか、何をコンセプトにしているのかちょっとわかんない。CEEK.JP NEWS であれば、「最新ニュースを手軽に。」というコンセプトをもとに開発してます。(今後変更されます。きっと。)

CEEK.JP NEWS も、このまま指をくわえて見てるわけではございませんので。

ご質問がございましたら、お気軽に。答えられる範囲でお答えします。

【関連記事】
ドリコムがニュース検索エンジンをリリース (2004年06月23日)

【関連情報】
・News&Blog Search
 http://news.drecom.jp/
・CEEK.JP NEWS
 http://news.ceek.jp/

2004年06月23日 19:20 | Service

トラックバック

このリストは、次のエントリーを参照しています: 勝手に技術的検討:

» News&BlogSearch from [N]
Myblog Japan、リアルタイム性を高めたニュースとブログの検索サービスを開始です。 News&BlogSearchは、立命館大学の小柳滋教授が保有するデータマイニング技術「マトリックスクラスタリング技術」を元にしたサービス。検索対象はRSS概要だけでなく本文のみを検索対象と... [続きを読む]

トラックバック時刻: 2004年06月24日 09:54

» News&Blog Searchがスタート from ▼△だからこんなもんだって▼△GA+blog▼△
元記事⇒『ドリコム、ニュースとブログの検索サービスを開始--グーグルニュースの日本語版となるか』 ドリコムは6月23日、ニュースおよびBlogの検索サイト「News & Blog Search(仮称)β版」を開始する。現在Googleが英語版でのみ提供しているGoogle Newsのように、検... [続きを読む]

トラックバック時刻: 2004年06月24日 10:52

» 新しいニュースサイト from Xoops .... close to you
GoolgeNEWSのようなサイトが、日本でも運営されるようになってきた。 News&Blog Search 昨日、運用開始したばかりのサイト。 ブログの記事もとりこんだり、ヘッドライン記事を表示したり、なかなか出来は良いですよね。 CEEK.JP NEWS 以前から細々と(失礼!)運用されて... [続きを読む]

トラックバック時刻: 2004年06月24日 13:17

» News&Blog Searchをつかった感想 from utahblog
News&Blog Searchをちょっと使ってみて感じたこと。(期待が大きいだけにちょっと厳しい目で) ・ブログとニュースを分けて検索するようになってます。当然分けたほうがいいとはおもうんですけど両方いっぺんに検索もできればいいのになぁ。 ・やっぱりインターフェースは... [続きを読む]

トラックバック時刻: 2004年06月24日 15:24

» News & Blog Search from ★lonestar Blog★
さて、朝からこんなニュースを ドリコム、ニュースとブログの検索サービスを開始 グ [続きを読む]

トラックバック時刻: 2004年06月26日 07:07

コメント

トラバありがとうございます。あんな貧弱コメントにトラバいただき恐縮です。

これ、技術的にスゲーは分からないのですが、スゲーらしいということは分かるようなわからないような。

使い込んでいき、段々とじわじわとスゲー感を実感できるのかも?と期待しております。


当方インターフェイスデザイナーをやっております。(インターフェイスっていう言葉が色々な意味でつかわれるようですが、ボタン作ったり、操作画面つくったりのデザインです)
またお気軽にお話できればいいなと思っております。

投稿者 KOu : 2004年06月23日 20:33

トラックバックありがとうございます。

Ceek.JPってあのCeek.JPですよね?
2年前から愛用させていただいております。
日頃からお世話になっております。
そんなところからトラックバックをいただけるなんて光栄です。

Ceek.JP Newsのほうが私はすっきりとしていて好きです。
今度からCeek.Jp Newsも使わせていただきます。
宜しくお願いします。

投稿者 えこらごす : 2004年06月23日 20:54

>> K○u さん
そうですね。人によるものですけど、おすすめブログのところに求めていたようなブログが表示されたときに、すごいと感じるものかもしれません。
私も色々なサイトをやってますので、インターフェイス的にダメなところがございましたらご指摘ください。(左下にいくつかあります)

>> えこらごす さん
CEEK.JP は1つしかないので、きっとその CEEK.JP です(なんのこっちゃ、、、w)。
トラックバックはブログの繋がりを示すシステムですから、打ちまくっれなんぼかと。そういう繋がりを GUI で表示するシステムがあれば面白いかもしれませんね。
自分の気に入ったシステムを使ってくださいな。これからも、よろしくお願いします。

投稿者 ceekz : 2004年06月23日 22:56

トラックバックありがとうございます!
>何をコンセプトにしているのかちょっとわかんない。
たしかにそんな感じを受けました。
これからに期待していますが、
さきほど、
Ceek.JP Newsも拝見しました。
見やすいですね。
利用させて頂きます!!
ただ、
「お問い合わせ」がリンクされてないのでしょうか?
SAFARIでは404Not Foundになります。

投稿者 lonestar : 2004年06月24日 07:11

トラックバックありがとうございます。
ceek.jpは使いやすくていいですね。
>何をコンセプトにしているのかちょっとわかんない。
との通り、「とりあえずやってみた」感が強いのですよね。
自分のblogも引っかからないし。

おもしろさでいったら、APIやJavaScriptが使えるbulkfeedsがいいです。
そういうのもできるのかなぁ。

投稿者 kazeburo : 2004年06月24日 09:52

こんにちは。
トラックバックありがとうございます。

CEEK.JP今回初めて知りました。
かなり興味を持ってしまいました。
これから利用させていただきます。

投稿者 takoashi : 2004年06月24日 10:31

現在のCEEK.JPはニュースサイトのクローリングがメインみたいですが、将来的にはテキストマイニングとかも組み合わせてblog(日記?)での注目度からNewsの重み付けをする(もしくはblogでの注目度からNewsを浮かび上がらせる)などのことができるようになったらおもしろいかなーとか思ったり。

…もしかしたら、すでに実施したりどこかで挙げられてたりします?(滝汗

投稿者 wakatono : 2004年06月24日 11:57

>> lonestar さん
問い合わせできないようになってます、、、というのは嘘で、単に作り忘れです。今日中にでも作っておきます。

>> kazeburo さん
うちの脅威に恐れて、とりあえず公開してみたんでしょうかねぇ。って、んなわけない _| ̄|○
API として公開されれば、関連する様々なソフトが出て面白そうです。

>> takoashi さん
おっと。こちらこそ、よろしくお願いします。

>> wakatono さん
まだ実施してませんし、この logs にも多分書いてません。でも、未踏のプレゼンでそのようなことを行いたいという提案を質疑応答の中でやりました。
別件(大学の情報特別演習)で RSS の検索システムを作ろうかと思っているので、もしかしたら組み合わせることができるかもしれません。

投稿者 ceekz : 2004年06月24日 14:11

トラックバックのつながりをGUIで示すシステムですか。
かなり面白いそうですね。
Googleの検索結果で単語のつながりなんかをGUIで示してくれるサイトはかなり人気みたいです。
既にご存知だと思いますが。
日本だとはてながアンテナに登録されたサイト同士のつながりをGUIで表示してくれますね。
private.ceek.jpさんだとこうなります↓
http://a.hatena.ne.jp/map?http://private.ceek.jp/

投稿者 えこらごす : 2004年06月24日 14:43

>> えこらごす さん
> Googleの検索結果で単語のつながりなんかをGUIで示してくれるサイトはかなり人気みたいです。
存じてないです。教えていただけると幸いです。

つながりを GUI で表示するためには、CUI で整理できないとなぁ。面白そうだから、アルゴリズムを考えてみよう。

投稿者 ceekz : 2004年06月24日 16:16

えっとITmedaiの記事なのですが、
http://www.itmedia.co.jp/news/0312/18/nebt_18.html
このようなツールがあるようです。

投稿者 えこらごす : 2004年06月24日 20:45

トラックバックありがとうございます。
「CEEK.JP NEWS」、初めて知りました。早速お気に入りに追加!

検索結果からブログを除外するなら「Blogless Google」( http://www.multithread.jp/blogless/ )なんかもそうですけど…ニュース集めにはダメですからね。
今後は「News&Blog Search」、「未来検索」などと比較しながら(笑)「CEEK.JP NEWS」も使ってみたいと思います。

投稿者 みけ : 2004年06月24日 22:17

>> えこらごす さん
ありがとうございます。名前は聞いたことあったのですが、使ったことがありませんでした。

>> みけ さん
お気に入りに入れていただいてありがとうございます。ぜひぜひ使ってくださいな。
また、お気づきの点がございましたら、匿名でも結構ですので、コメントいただければと思います。

投稿者 ceekz : 2004年06月24日 23:42