« 2005年09月02日 | メイン | 2005年09月04日 »
2005年09月03日
メディア情報処理専修コース(2)
メディア情報処理専修コース の 自然言語処理技術 の2日目は、 JUMAN/KNP と GETA のお話。
どちらも使ったこと無いソフトでしたが、とてもいい!
JUMAN の形態素解析に惹かれた。なんか、非常によい結果を出しているような気がする。 MeCab 0.9 をずっと待ってるのだけど、とりあえず JUMAN を使って遊んでみようかな。

GETA は、汎用連想計算エンジンというものですが、要は類似文書を探すシステムという理解でいいんじゃ無いかと思います。文書分類もできるようですが、今回の実習では触りませんでした。
ベクトル空間モデルを用いて検索をかけるわけですが、どうしても理解できないことがあったので先生に質問した。理解できなかったのは、ベクトル空間モデルを用いたシステムでは、検索するキーワード数が少ないと、小さい文書(ベクトルの次数が小さい)ものしか見つからないのでは無いか?と。
答えは、そのへんを正規化するのがキモとのこと。当たり前といえば当たり前。
この話を聞いていて、「類似文書 = 関連文書」というわけでは無いのだな。とやっと理解した。いままで、同様に扱っていたのだけど。類似文書は関連文書になり得るが、関連文書は類似文書になりえないということ。もちろん、人それぞれの定義があると思うので、一概にそうとは言えないかもしれないけど。
期待しているのは、ニュースの中で「類似ニュース」の集合というと、各ニュースサイトに配信された通信社のニュースが集まっていることかな。要は、各ニュースサイトが取材したわけではなく、通信社から配信されたニュースを編集しただけの集まり。「関連ニュース」は、あるニュース(事実)の経過や原因の集合。
Google の「関連ページ」には、似たページが表示されるわけでは無いのは、上記からわかる。実際のところ、どういうアルゴリズムかわからないが、同時にリンクされているページを引っ張ってきているのでは無いかと思う(もちろん、内容の類似度もスコアに含むだろうが)。
ある文書の集合の中から、重要そうな文書を引っ張ってくる方法を考えてみたいのだ。もちろん、重要度は、人それぞれだが、機会が何らかの理由をつけて、重要そうな文書を引っ張る仕組みを。とりあえず、あるキーワードを入れた検索結果のスコア付けの方法を詳しく調べなくては。
話がそれた。
2日目はそんな感じ。3日目は、体調を崩して参加できなかった。アンケートだけでも、郵送しておこう。

今回の滞在では、東横イン京都四条烏丸を利用しました。となりの施設が明るすぎです。
【関連記事】
・メディア情報処理専修コース(1) (2005年08月29日)
【関連情報】
・自然言語処理のためのリソース
http://www.kc.t.u-tokyo.ac.jp/nl-resource/
・汎用連想計算エンジン GETA
http://geta.ex.nii.ac.jp/
23:54 | コメント (2) | トラックバック | Events
帰省のときに TX に乗った
帰省するときに、流行の TX に乗ったので、その写真を。1週間以上前の話だけどな。
友人に車で駅まで送ってもらう中で、僕の家からなら、研究学園駅の方が近いのでは無いかという話になったが、つくばから秋葉原まで乗らないと、話のネタにならないと主張して、つくばから。
開業記念のパスカードを買って帰ろうと思ったけど、売り切れみたいで諦め。本当に売り切れていたかどうかは知らないけど。
地下は広い。しかし、発券機は非常に混んでた。パスネットを持っていたので、素直にパスネットを使えばよかった。切符の方が記念になる!とか考えて買ったわけだが、秋葉原で改札機に入れちゃったし、写真はピンボケしてるし。うわーん。
車内はゆったりしてる。変なシマシマ模様が付いていたのだけど、座席に座っている場合は、このシマシマ模様まで足を伸ばすな!ってことかいな。ホームは、さっそくガムなどで汚れていて残念。
乗り心地はいい。実家で阪和快速に乗ったのだけど、比べ物にならない。もちろん、どちらも 約130km/h で走行します。
何が違うかというと、ゆれと騒音かな。軽量車両を使ってると思うので、新幹線ほど静かでは無いが、従来の電車より静か。また、ゆれも非常に少ない。ゆれは、カーブでゆれるわけだけど、他にもブレーキをかけたときにもゆれるので、ブレーキがスムーズなのかも。ともあれゆれないのでよい。
他に気づいたのは、地下トンネルの幅が、都内の地下鉄より広い感じ。走行速度が速いので、急激な気圧の変化が起こらないようにしているのだろうか。とはいっても、耳がキーンとしたけど。また、駅の停車時間が 30秒 ほどと、結構長かったです。終点(秋葉原)に近づくほど、短くなってたけど。
秋葉原まであっという間だった。本でも読んでいると、本当に短い時間だろう。なんといっても、バスと違い、定刻に着くのでよい。
秋葉原駅の地下に、商業施設が無い関係か、乗り換えるために地上に出なければならないのが面倒。こればかりは仕方ないかな。商業施設ができれば、それ経由でいけるはずなので、地上まで出なくていいと思うのだけど。
さーて。回数券を有効にまわせる仕組みを考えないと。
【関連記事】
・つくばから東京へ行く方法 (2005年08月19日)
23:48 | コメント (0) | トラックバック | Life
つくば豊里耳鼻咽喉科に行く
先月末から、急性中耳炎にかかっていたので、こちらでの病院を探していました。とりあえずは、大学の保健管理センターに行ってきた。
ここでできることは無いから、他に行ってね♪
のようなことをあっさりと言われ、近くの耳鼻科を紹介された。担当の先生が、循環器内科というのも大きいかも。他にも呼吸器内科を専門とする先生もいるので、そちらの先生だったら、また違った結果かも。
とはいっても、他の病院に行ってと言われたら、そうするしかないので行ってきた。筑波大学付属病院に行こうかと思ったけど、混んでそうなのでパス。近くにあって、しかも 7時 までやってる耳鼻科にした。その名も、つくば豊里耳鼻咽喉科医院というところ。
なんか、耳鼻科だけではなく、漢方とかもやってる。
とりあえず行ってきた。非常に気合の入った先生だった。診察椅子の意味がまったく無い。先生が立ったり動いたりして、診察を行っておる。当然、僕が少し上向き加減になるので、鼻に薬を入れると、のどに流れた。うわーん。
初めての、院外処方を行った。豊里耳鼻咽喉科には、薬局が無いみたい。
院外処方をよく理解していなくて、診察代と薬代は、診察を受けた病院に一括して払っておき、薬だけ院外でもらうのかと思っていたら、そうじゃないんだね。薬屋は、院外処方せんを基に、国などに代金を請求するのかと思ってたよ。
ちょっと調べてみたら、院外処方の方が、以前よりも高くなるみたいだね。まぁ。関わる人間が増えるのだから仕方ないか。飲み合わせなんか、薬剤師では無く、薬を決める医者に聞くものだと思っていたけど、そういうわけじゃないんだな。
てかさ。薬を決めた後に、飲み合わせが悪いことがわかったら、もう1度診察を受けなければならんじゃないの(処方せんを作ってもらう)?そうだとしたら、お金がかかってばかりだな。
院内処方の場合は、薬代はどこに含まれてるんだろう。
あー。医療費が高い。合計 3590円 もした。4日分の食費だ。年金生活者が医療機関の利用を敬遠するという話も、わかるような気がする。もちろん、年金利用者は、少々医療費が安くなると思うが、どの世代の人間も、収入に対する医療費の割合は大きく変わらないのでは無いかな(医療機関を利用しない人は除く)。
23:29 | コメント (0) | トラックバック | Life
2学期初めての週末
ま。気分は、夏休みですけど。ということで、昨日(2日)の食事内容です。
昼は、バターロールを食べる。うーん。レーズンバターロールにしておくべきだったと少々後悔。中耳炎の兼ね合いで、痰がからむと嫌なので、乳製品を控えているし。ミルク無しの紅茶でも飲むか。
夜は、一太郎でお好み焼き。結構、小食になってしまったかもしれない。食べていると、店内にセミが入ってきた。アブラゼミ。ミンミン鳴く前に、店員に追い出されてしまった。お好み焼きの中に入ったら、一緒に焼けるだろーなー。とか考えてた。食べたくないけど。
自宅 (昼)
バターロール
一太郎 (夜)
お好み焼き




