「Googleの音声認識を試してみた」

| 0 comments

  • このエントリーをはてなブックマークに追加
  • このエントリーをはてなブックマークに追加

Googleが、サービスに変えていく。
子供の頃に夢に思えた数々の事。
Takumaです。
 

【音声】
1 人間が音声器官を通じて発する音の総称。おんじょう。
2 人間が音声器官を通じて、話し言葉として発する音。言語学では、特に音韻と区別して用いる。
3 テレビなどの音。(by Yahoo!辞書)
 

技術的には、一部で出切る事でも、
インフラも含めサービスにできるほどのレベルに達するのは、超えるべきハードルがたくさんあります。

しかし、Googleはあるサービスをスマートフォン系のアプリとして世に出しました。

■音声でGoogle検索■■■■■■■■■■■■■■■■■■■■■■■■■■

▼ピックアップサイト▼
Google Japan Blog: 音声で Google 検索

単刀直入にいえば、その通り。携帯に向かって「キーワード」を話すと。
音声情報をライブラリに参照してキーワードとして文字情報に置き換えてくれるものです。

その、解説動画がこちらです。

実際に、試してみたのですが

・「音声の認識の精度が高い」
・「地名の認識が可能である。」
・「一連の入力音声に地名が混じっていても、半角スペースが自動挿入」

-googleの利用方法提案—————————-

ウェブページ以外にも、地図・お店・乗換案内・通貨レートなど、様々な情報を検索できます (例: 東京都渋谷区、六本木 イタリアン、品川から京都、 1ドルを円で)。以下のビデオでも、使い方をご覧いただけます。

————————————————-

等々、入力手段としての精度は思った以上でした。しかし、

・「個人名称等の固有名詞の変換は苦手」
・「造語の変換が変なところで区切られる」
(※日本人の英語発音を誤変訳してしまう:ネイティブ発音でないからかな?)

という点がありました。どちらかというと参照しているライブラリのマッチング精度の問題でしょう。
コレに関しては、先日発表したIMEサービス等々の付加情報の連携技術等で補っていくと考えられます。

「日本語IME」サービスの即、モバイル転用はないという、発表がニュースで報じられていましたが、ログ情報は当然ながら改善に役立てるでしょう。

この技術のニーズは当然、無限大にあるでしょう。
モバイルの入力機器とインターフェースは、最善でないと多くの場面で語られているからです。

個人的にはモバイル系ならずパソコンにも転用されるとは考えています。
が、パソコンでは既存の入力のインターフェースでの入力速度、汎用性、入力結果のマッチング度。
総合的に超えなければ、ある程度ですが熟成しているパソコンの入力市場での主役交代には至らないと思います。

しかし、TVの双方向化の中では、この技術は爆発的に絶賛されるように思います。
リモコンを使った文字入力とか、とても使う気にすらなりませんから。

とうとう、スマートフォンアプリとして配布するまでになった、音声入力技術。
子供の頃に、現実にないと気づいた時にガックリした、憧れの夢の技術が現実化する時代に生きていると感じた、今日この頃です。

■P.S:今日の気になったサイト■■■■■■■■■■■■■■■■■■■■■

▼ピックアップサイト▼
博報堂 買物研究所

●んで、一言

袋のキャラクターがかわいい、一見フォトアルバムサイトと思うようなFlashサイト。
メニューを叩くと、ロゴの部分がレシートの頭の部分だったと気づく、デザイン性の高いサイトです。

実はコレ。博報堂の買物研究所という、マーケティング系のサイトなんです。

テーマは「買物」「買物欲」だそうです。購入プロセスの研究やエモーショナルなマーケティング結果を中心に書いてありました。
一点、残念なことが。。。Flashだから文字情報が転用でけへん。

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

コメントを残す

Required fields are marked *.


▲このページトップへ

takumaの「デザインはあれでアートはそれで」