kizasi.jpの「MyBoo ベータ版」がすごい

未分類 Posted by くま @ 2008/01/23 Wednesday 08:19:21

ブログ検索サイト「kizasi.jp」が「kizasi ラボ」で試験公開している「MyBoo ベータ版」というサービスをご存じだろうか。

「あなたのブログを一発解析!」というバナーにつられて偶然利用してみたのだが、直感的に「オモシロイ」。

「自分の(あるいは公開されている)ブログのURL(フィードでも可)」を入力して「解析」ボタンをクリックするだけで、該当のブログに漂っている「雰囲気(気持ち)」とブログ内で多く取り扱われている「話題」を解析してくれる。

myboo.jpg
自分の個人ブログを解析したところ「悲しい気持ち」がにじみ出ているそうだ・・・。

ブログ記事を形態素解析し、より多く使われている単語をあらかじめカテゴライズした「テーマ」に機械的に分類する技術を応用しているのだろう。

仕組み自体はシンプルでバックグラウンドはロジカルであるが、サービスとしては実に「生々しく」、温かみを感じる。

また「MyBoo ベータ版」では、解析したブログと似ている指向のブログを提示することにより、「自分と近い指向のブログやその人の考えを知りたかった、けれど(キーワード)検索ではなかなか見つけられなかった」というブログにまでたどり着けるようになっている。

「ベータ版」ということもあり精度は「解析」するブログによってマチマチだが、さまざまな活用が期待できるサービスだ。

自然言語処理の検索エンジン “Powerset NATURAL LANGUAGE SEARCH”

未分類 Posted by くま @ 2007/08/30 Thursday 03:03:25

powerset.jpg

検索エンジンといえば「検索アルゴリズム」や「検索DB(検索インデックス数)」にばかり焦点が当てられがちだが、実はそれ以外に重要な要素のひとつとして「形態素解析」があげられる。

「形態素解析」とは、簡単に言えば「検索に必要なインターネットウェブページの目次を作る課程で必要な言語解析」のことである。

ユーザが入力するであろうクエリに対して、該当のウェブページを的確に検索結果に表示させるためには、そのウェブページにどんな単語が含まれているのかを理解する必要がある。

9月にアメリカでサービス開始予定の「Powerset(パワーセット)」は、この形態素解析にAI(人工知能)の技術を利用し、ウェブページ上の文字を単純に読解するだけでなく、文字と文字に関連を持たせ推論するようコンピュータを訓練する。

「Powerset」は将来「Google」をも圧倒する存在になりうるだろう、と一部専門家は予測している。
一体、「Powerset」のどこが画期的なのであろうか?

現在の主流の検索エンジンは「アルゴリズム(計算式)」によって検索結果のランキングを決定している。
検索結果のランキングは複雑な計算式によって決定されているが、「類似するウェブページを表示する」という点では、ユーザが入力したクエリと100%合致したウェブページのみを検索結果に表示させるのは難しい。

「アルゴリズム」による検索とは異なり、「Powerset」はウェブページの内容をAIが理解し、知りたい事柄だけが検索できる仕組みになっている。

過去にも自然言語処理の検索エンジンへの応用は幾度もおこなわれてきたが、本当の意味で「ウェブページの内容を理解する」までには至らなかった。

まだサービスオープン前ではあるが、すでに世界各国でのサービス展開も視野に入れており、複雑な日本語でのサービスも開発中だという。
Googleとはまったく異なった視点から誕生する検索エンジンだけに期待が高まる。

掲載の記事・写真の無断転載を禁じます(詳細情報)。 No reproduction or republication without written permission(more).
©2006-2010 lostintime.jp is proudly powered by WordPress. - 25 queries. 0.438 seconds.