月刊ヌートリアまわり通信2011.10.28寄稿分

こんにちは。最近気になったガジェットやサービスに関して書いて行きたいと思っています。
出ましたね、iPhone4Sジョブズの逝去もあってもうネットでは語られ尽くされた感がありますが、ちょっとお付き合い下さい。今回の発表で一番興味深かったのがSiriです。

これは、いわゆる音声認識機能で時間や天気を聞くと教えてくれたり、メール返信やアラームなど、標準アプリの多くを音声でコントロールして、結果も音声で教えてくれたりします。日本語対応は残念ながら2012年らしいですが、私の英語でも簡単な文なら10回に1回くらいは認識してくれます。これに近い仕組みは今までもあったのですが、今回大幅な機能UPと認識精度のUPを引っさげて再デビューという感じですね。音声のインタフェースが進めば極端な話、パソコンの操作中やテレビを見ながらでもずーとその端末にアクセスする可能性が出てくるわけで、そんなおいしいプラットフォーム獲得に向けて音声認識技術の競争は激化すると思います。絶対。これと時期を同じくして発表された音声関連のサービスにPodcastleがあります。

これはネット上にある音声コンテンツや動画コンテンツの文字おこしを自動で行なってくれるサービスです。実はこれも昔からあったのですが最近Youtubeなどの動画コンテンツに対応してその威力がハンパないです。ニュースコンテンツなどはかなりの精度で文字おこしがされており、初めて見ると驚くと思います。動画コンテンツに対してその中に出てくるキーワード単位で検索しアクセスする感覚は、はじめてGoogleを使った時にも似て「今後こうなるんだろうな」と思わせてくれます。Googleは「良いコンテンツはよいリンクを持っている」というアルゴリズムで他サービスを圧倒しました。音声認識技術も精度を上げるために前後の文脈を理解するとか、話されてる場面を理解するとか、そんな手法も使われると思いますが、それってかなり人間の知性に近づきますよね。音声認識技術を通じてネットの何処かに知性が生まれてしまう日も遠くないかも。