「Google日本語入力というIMEとは」

| 0 comments

  • このエントリーをはてなブックマークに追加
  • このエントリーをはてなブックマークに追加

「Google日本語入力というIMEとは」Googleはネットしたりします。
日本語入力はMS-IMEをつかってた。
Takumaです。
 

【IME:Input Method Editor】
米国マイクロソフト社がウインドウズで採用している文字入力システムの名称。代表的な日本語入力システムにはジャストシステム社のATOK(エートック)、マイクロソフト社のMS-IMEなどがある。(by Yahoo!辞書)

 

立て続けのGoogleのソリューション提供開始にたじたじな、Takumaです。
Crome OSの開発で、ローカル環境の象徴OSに挑戦しているGoogle。

▼takumart.net:過去記事▼
「ブラウザOS Google Chrome OSがついに公開!!」 | takumaの「デザインはあれでアートはそれで」in takumart.net

今回は、なんとIMEにまで手が広がってきました。

■まずは、ダウンロードしてインストールしてみた■■■■■■■

▼ピックアップサイト▼
Google 日本語入力 – ダウンロード

問題の「Google日本語入力」が、上記からダウンロードして使うわけですが。
(※Windows対象OSは、Windows 7、Vista SP1 以降 XP SP2 以降。)
(※MACの人は右下の「Mac 版をダウンロード」から、Mac OS X 10.5以降対応。)

さっそく、インストールをしてみた(ちなみに、無料)。
日本語の入力サポートな訳で、色々な言葉を入力してみる。

「あれ!?なんか、へんな言葉が変換候補にでてきた!?」

■今までのIMEと何が違うのか? ■■■■■■■■■■■■■■■

簡単に、比べてみた。

●今までのIME

(Step.1)事前にIMEのライブラリに、業者の人が変換候補を登録。
(※定期的に語彙を人力で行い、改善を行っていく。)

(Step.2)OSにそのIMEをインストール(※OSと同時にインストールされてる事もある)。

(Step.3)様々箇所での、文字の入力のタイミングを判定。

(Step.4)IMEのライブラリに該当する変換候補を投げ返して表示、入力サポート。

●Google日本語入力

(Step.1)Web 上の大量のデータから統計的言語モデルを構築し、変換エンジンを構成。

(Step.2-1)「Google日本語入力」をダウンロード&インストール

(Step.2-2)OSのIMEから「Google日本語入力」に切り替える。

(Step.3)様々箇所での、文字の入力のタイミングを判定。

(Step.4)ネット上の変換候補集計結果から、該当する変換候補を投げ返して表示、入力サポート。

(Step.5)変換された内容は、「Google日本語入力」の集積データベースへフィードバック。

(Step.6)step.1~5が繰り返されて、大量の修正機情報が再体系化されていく。

■「もしかして」と「サジェスト機能」の転用■■■■■■■■■

いまでは、当たり前のようになった「もしかして」をはじめとする「サジェスト機能」。その、開発ストーリーが下記のブログで垣間見ることができる。

▼ピックアップサイト▼
Google Japan Blog: 「もしかして」をパワーアップしました!

その中の一節が目にとまった。

-抜粋———————————–

「スペルミスの多くがインプットメソッドの誤変換に起因していることと、チームで開発した「もしかして」システムが高い精度でそれらを修正していく様を目の当たりにして、Google 日本語入力の可能性を確信しました。」

—————————————-

スペルミスの多くがインプットの際の誤変換によりおこり、「もしかして」のシステムはそれを効果的に修正できている事から、この技術の利用を思いついたそうだ。

つまりは、「Google日本語入」の表示結果は、ネット上の多くの人々が検索した際のログが基盤になっている。

誤変換をした際の修正結果がフィードバックされて、この「Google日本語入力」の制度改善へ繋がることになる。

■日本語の入力サポートにネットの多数主義■■■■■■■■■■

という事は、今までのIMEで行われてきた、「表示候補に対する一部の関係者というフィルタリングが少なくなる」という事を意味しているのではないか?

今までのIMEは、製造や配布元の評議員(?)が、定期的に語彙を人力で行い、改善を行っていくというプロセスを挟んでいる。

つまりは、この定期スパンと人的な制限が、オンタイムな変換候補への障壁にもなっていたと考えられる。

(※ネット上の利用者をもとにしたマーケットデータは、国民等のマクロなマーケデータとして代表性に欠けるという意見もあり、その意味では評議員の長年の経験も中長期の文化の経緯を尊重する意味で、無意味ではないのだが・・・)

より、オンタイムの変換候補がでてくるという、大きな壁を乗り越えようとしている「Google日本語入力」。

例えば、

●入力文字:「人が」
⇒変わった変換候補例:「人がゴミのようだ」

●入力文字:「ウル」
⇒変わった変換候補例:「ウルトラマン 動画」

●入力文字:「google」
⇒変わった変換候補例:「google 日本語入力 インストール」

等々。いままでのIMEでは、到底出てこなかった検索対象が出てくる。
しかも、

○「人がゴミのようだ」:天空の城ラピュタの有名なセリフ
○「ウルトラマン 動画」:おそらくウルトラマンの無料動画を探している人たちの検索クエリ
○「google 日本語入力 インストール」:何とも言えないが、反響?

というように、Googleの検索エンジンを利用している人々の、息遣いが聞こえてくるような、変換候補が表示されてくる。

これが、「ネットとローカル」パソコン間で双方に「日本語の入力サポートにネットの多数主義」を生み出すと考えている。

より、「ネットとローカル」の間の垣根が無くなっていく、クラウドOSと周辺技術。
一部では、Crome OSの普及の上で、避けられない道だったという人もいる。

逆にいえば、「ネットとローカル」の間が意識しづらくなる事と同様に、近い数年後には、このような技術を逆ハックする形で、「ローカルPCへのSEO」が始まることも考えられる。ある意味、過渡期の産物だとは思うものの、既成概念がコロコロ変わっていく近年。
すごい時代だと改めて感じる今日この頃です。

■参考文献■■■■■■■■■■■■■■■■■■■■■■■■■

ぶっこ抜き? [Google日本語入力の功罪] – higuchi.com blog
Google日本語入力 ショートレビュー
Google日本語入力を実際にインストールして使ってみた*ホームページを作る人のネタ帳
Google、高い変換精度と圧倒的な辞書を実現した日本語入力ソフト「Google 日本語入力」を公開 – GIGAZINE

■P.S:今日の気になったサイト■■■■■■■■■■■■■■■■

▼ピックアップサイト▼
COOSY 株式会社クーシー|Webデザイン/Web制作会社|クリエイティブエージェンシー

●んで、一言

東京にあるデザイン事務所さんのサイト。
方眼紙の上に、きれいにグリッドデザインされたサイト。

ところどころ、手書き感や手作り感をみせつつ、「クリエイティブのアナログをふくんだ底力」を見せている印象のサイト。

うちのブログの感じに少し近いかも。なんだかんだパソコンが普及してDTPやらWEBが生まれてきても、やっぱりデザインは人ですよね。

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

コメントを残す

Required fields are marked *.


▲このページトップへ

takumaの「デザインはあれでアートはそれで」