日本語・英語・韓国語の視認性
ウェブサービスの企画に忘れてはならないのはウェブサイトのデザイン(UI=User Interface)だ。
いままでにいくつかのウェブサービス企画に携わってきたがそのたびに苦悩する。
日本語には日本語向けのデザインが必要だし、韓国語には韓国語向けのデザインが必要だ。
ここで簡単に「日本語」と「英語」と「韓国語」の特徴を比較してみよう。

○日本語
・単語と単語の間にスペースがない(世界でも稀)
・「ひらがな」「カタカナ」「漢字」という3つの異なる文字を使用する(世界でも稀)
・1つの文が比較的長い
○英語
・単語と単語の間にスペースがある
・「アルファベット」のみ使用
・1つの文が比較的長くなりやすい
○韓国語
・単語と単語の間にスペースがある
・「ハングル」のみ使用
・1つの文が比較的短い
このように、単語と単語の切れ目がなく長文になりやすい日本語は、一目では理解しにくいため、視認性に優れている言語とは言えない。
それに比べ、韓国語は一単語が短く、文章もスペースで区切られているために視認性に優れているのだ。
韓国NHNで「enjoyKorea」という日本語による日本向けのサービスを企画したときには、この「デザイン」に関する部分が一番難航した。
デザイナーは韓国人で日本語を全く知らないため、どのように説明すれば伝わるのか思案した。
実際に韓国語と日本語の文字をプリントアウトして、単語ごとにひとつひとつ並べ比較しながら、韓国語と日本語の視認性の違いや必要領域などを説明し、UIを完成させたのだ。
韓国のウェブページの文字テキストは、比較的薄い色(グレーやパステル)などでデザインされているが、これを日本語のウェブページで適用すれば目がチカチカしてしまい、長時間の閲覧には耐えられない。
それに日本語の場合、1つの文章(タイトル、キャッチコピーなど)がどうしても長くなってしまうので相応のスペースが必要になる。
デザインだけでもこれだけの違いがあるのだ。
さて「検索」に話を戻すと、異なる言語のウェブページを検索するときには、検索エンジンの「言語処理」プロセスを変える必要がある。
一般的にこのプロセスを「形態素分析(形態素解析)」と呼ぶ。
韓国語や英語のように、世界の多くの言語には、単語と単語の間にスペースがある。
このスペースを基準に解析をおこなうことができるため、「形態素」の分析が容易におこないやすいとも言える。
しかし日本語の場合、文節に切れ目が存在しない。
そのうえ、活用形が多種多様に存在する。
そのため日本語は、機械的に分析することがとても難しい言語なのだ。
検索における形態素分析(言語処理)に関する内容は、また次回以降解説したい。

