音声認識や文章解析


ふと、自然言語処理が気になり、少し調べてみました。
たとえば、ロボットと会話をしようとしたとき、どんな方法があるか。

①一番シンプルなのは、単語の発生で一方的に命令を送る方式。
 「お座り」のように、犬に命令するような感じです。

②次にシンプルなのは、Q&A方式。
 「今何時?」「キリンオレンジ」のように、1対1で応答を決めておくもの。シーマンなど。

③ほかに馴染み深いのは昔のテキスト入力アドベンチャーゲーム方式。
 「TAKE BOOK」のように、簡単な文章で命令するもの。
 
①はハンズフリーの操作などに便利で有用ですし、
②や③もパターンを増やせばそれなりのエンターテイメントにはなると思います。
クラウドなどで対話例文の蓄積してそこから統計的に受け答えするようにすれば、それなりの知性も感じられるようになるかもしれません。

このあたりはいわゆる「人工無能」と呼ばれる領域で、最近の会話が出来るというロボットも、まだこのへんのレベルなんじゃないかと勘ぐってしまいます。

では、その先はどうなっていくのでしょうねという話。




Siriについての本を読もうと思ったのですが見つからなかったので、オープンソースのそういうものがないかと調べたら、
A.L.I.C.Eというのがあるらしいです。が、日本語での概略情報が見つからなかったのでそこで一旦停止。




「イラストで学ぶ人工知能概論」というのを先日購入したのですが、
後半に自然言語処理の章があったので読んでみました。

音声をテキスト正しく認識した後に、今度はテキストを正しい意味に捉える工程をクリアする必要があるとか、
その手法の基本的な概略も書いてあってためになります。




まず、最初の難関であろう音声認識について。

実際のところどうなんでしょうということで、普段は使わないgoogle音声認識をあえてつかってみました。

なにこれ面白い!かなりすごい認識率で今更ながらびっくりです。
検索されやすいワードとの相性は抜群のようで、「東京特許許可局」なんかは、思いっきり早く読んでも、噛んで言えて無くても認識することがあるほどです。(笑)

逆に、検索されにくいワードは何度読んでもダメで、「ゼムネス」はゆっくり読んでも「税務ネス」「全部です」となり、「シコキック」は「飛行機」になってしまいます。気持ちは分かる気がします。ふむふむ。




では、正しく音声認識ができた後の話として、
テキストの内容を正しく捉える能力については、現在どれくらいの精度になっているのでしょうか。

本に紹介されていた、オープンソース 形態素解析エンジンの「MeCab」で遊んでみました。

キャプチャ3

鰐とか埴輪が出現しました。面白いです♪
入力して結果を見ているだけなのに、少し頭がよくなったような気分になります。




続いて、日本語係り受け解析の「CaboCha」も使ってみました。

キャプチャ2

ダウンタウンのネタより。投げ出さずに最後までちゃんと解析しようとしてるのがすごいです。




こうしてみると、言葉の正しい理解については、手法はある程度の正解がもう見えていて、
あとは、ビッグデータ的な統計との組み合わせが解決してくれそうな気がします。




だいぶ脇道に逸れましたが、話を最初にもどします。
音声認識出来た→文章の内容を正しく理解出来た→となると、
やっぱり、どういう風に受け答えをするか、という本論になります。

・・・続きは次回。
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

二名川(ニナガワ)

Author:二名川(ニナガワ)
ホビーロボットをレトロゲームが発展したものと捉えて楽しく遊び倒します。
子供が夢を見ている時間帯に稼働します。

宣伝:電子出版しました。
「コンソロイド ガイドブック」
46107_CONSOLOID_GUID_FACE_200.jpg





■作成中の機体
汎用ヒト型決戦遊具 ~RX計画~
RX-7.5 ゼロタンク
RRf-0.6 ゼニィ
RXM-7.9 ゼムネス
RX-7.5R 量産型ゼロタンク
RX-7.5Fp ファミタンク仮設1号
RX-7.7 ゼロキャノン
RX-7.8 ゼログレイ
SMS-0.1 ゼロライナー
以下続く

ブログ内検索
最近の記事
最近のコメント
カテゴリ
月別アーカイブ
リンク