“音声認識を介して、恩恵を受けられる世界へ!”

株式会社アドバンスト・メディア
代表取締役会長兼社長
鈴木清幸

インタビュー: 2014/05/16

京都大学大学院工学研究科化学工学専攻博士課程中退。1978年、東洋エンジニアリング株式会社に入社。1986年に株式会社インテリジェントテクノロジーへ転職後、1987年に米国カーネギーグループ主催の知識工学エンジニア養成プログラム(KECP)を修了。1989 年に研究開発部長を経て常務取締役に就任。1997年、株式会社アドバンスト・メディアを設立して代表取締役社長に就任。2005年、東証マザーズ上場。2010年に代表取締役会長兼社長に就任。

生年月日:
1952年
出身:
愛知県
出身校:
京都大学大学院

- 小さな頃はどんなお子さんでしたか?

小牧・長久手の戦いで有名な愛知県の片田舎に生まれ、服飾関係の自営業を営む両親のもとで育ちました。「できないこと」に取り組み、やり遂げることが小さい頃から大好きな少年でしたね。中学生の時に「京大に入る!」と決めて、中学の3年生で生徒会長をやりながら夏までテニスを続け、進学校に入学しました。高校でも3年生の夏までテニスに打ち込み、塾に通うこともなく、京大に合格しました。私が大学を受験した年は、学生運動の影響で前年に東大入試が実施されず、本来よりもより難しい状況にありました。合格できたのは難しい目標を定め、成し遂げるために独自の工夫をし、しつこくやり続けることが大好きな人間だったからだと思います。

- 「できないことをやる」とは具体的に?

私の特性であり独自のアプローチ法なのですが、まず不可能に思えるような目標(ゴール)を定めて、足元の行動可能な“小さな”目標(マイルストーン)に砕く(Goal Driven)。足元のマイルストーンを達成する行動を次から次へと速やかに実行し(Agile)、諦めずかつ根気よく続ける(Persevere)。そうすれば不可能な目標も達成できます。私はこれをGAPと名付けています。GAP能力を養うことが会社を継続的に成長させる確実な手段であり、これこそが企業活動だと思っています。音声認識の市場創造はこれまで成功例がない、つまり「できないことをやる」行為そのものでした。できないことに挑戦し、それをやり続けて成し遂げる思いは会社のロゴにも表現してあります。このロゴには小さな球体がポジティブスパイラルを描きながら徐々に大きくなる様が描かれています。また、球体が平面から徐々に浮かびあがる様も描かれています。後者は社会価値の増大を意味しており、社会にとって「なくてはならない存在」になる思いも同時に込められています。会社のビジョンであるヒューマン・コミュニケーション・インテグレーション(HCI)とは人が自然なコミュニケーションを通じて機械やコンピュータから恩恵を被り、AmiVoiceが社会になくてはならない存在として融合することです。これまではネットから情報を受け取ることが中心でした。ですが、IOT (Internet of Things)の時代が始まったことにより、スマホに「これから帰る」と話しかければお風呂を沸かしておいてくれるというような、自分にとって嬉しい・有難いサービスが次から次へと生み出されていくでしょう。

- 起業のきっかけを教えてください

京大出身のフィールズ賞数学者・広中平祐氏の弟子たちがつくった人工知能のベンチャー企業ITI(インテリジェントテクノロジー)に入社後、人工知能研究のメッカであるカーネギーメロン大学のスピンオフ企業に派遣され、その技術を習得しました。帰国後も同社との連携を強化しながら、日本での人工知能の普及に12年間取り組みました。人工知能というのは、コンピュータで人間並の脳処理をさせることです。ロジカルな回路、つまり極めて左脳的なものを使って、直感などの右脳的な処理をさせることが目的です。ある限られた対象では成功例も出来ていましたが、ハードウエアが非常に高価なために恩恵を受けることができる人は極一部に限られてしまい、私はそこに大きな疑問を感じていました。もう一つは、頭脳処理をコンピュータができるようになっても、依然としてキーボードで人が指令を出すことに不自然さを感じていました。そして、人工知能よりもまずは音声認識の市場化が大事という考えに至ったわけです。

- そこで音声認識の会社を立ち上げられた?

起業するもう1つの重要なきっかけはカーネギーメロン大学のロボティックス研究所に集結した音声認識の天才たちとの出会いでした。彼らは1996年、97年、米国国防総省の国防高等計画局(DARPA)主催の音声認識の競技会で最高位の成績を収めていました。当時、音声認識でビジネス化に成功した会社はありませんでしたが、人工知能ビジネスの経験から音声認識ビジネス成功のヒントを掴んでいた私は彼らに連携を働きかけ、当社を設立しました。音声認識は異言語コミュニケーションにこそ真価を発揮できるという信念の元、他言語対応の構造を作り上げました。音声認識エンジンを言語非依存の基盤部分と言語依存の部分に分け、更に、領域非依存の部分を加味して基盤部分を作っています。汎用的な音声認識エンジンというのが理想ですが、精度が低くなり、実際には使えないものが多い。当社は「医療」「議事録」「コールセンター」「教育」など、その分野に特化した音声認識エンジンを組み込んだ製品開発により高精度を上げたことが信頼につながり、多くの実績を得たと思います。

- 御社の特徴的な技術とはどのようなものでしょうか?

不特定話者の大規模語彙連続型音声認識です。これは単語認識ではなく、文書を認識できる技術です。勿論、単語認識にも使えます。学習不要性とその「文章認識の正確さ」を特長としています。他社の音声認識で必要な学習が不要で、すぐに話し始めても正しい文章化が可能であること。また、方言に現れるイントネーションやアクセントの変化、スピードの変化への対応能力が際立っていることです。医師が書き込むカルテ内容や医療文書などは全国共通の標準語で書かれますが、それらを音声入力で行う場合は北海道から沖縄までの様々な方言のバリエーションに対処する必要があります。当社はこの分野で4, 500施設を越えるオンリーワンの導入実績を誇っています。音声認識は「音韻情報」と「言語情報」の2つを使って正しい文章をつくります。言語情報に関しては辞書や言語モデルに登録さえすれば、言葉として認識させるのはそれほど難しくはないのですが、音韻情報によってイントネーション、アクセント、スピードなどの変化を処理することがとても難しい技術です。

- 会社のなかで大切にしている文化や考え方はありますか?

「チャレンジ&チェンジ」の文化です。挑戦による変化が当社に持続的な成長をもたらします。変化を起こす挑戦とは、がむしゃらに行うのではなく、最初にお話したGAPで行うことが前提です。故に、GAP文化と言い換えることもできます。「チャレンジ&チェンジ」が文化として当たり前になるためには、当社のスタッフがGAP能力を身に着けることが必要です。この文化が根付けば、当社の持続的な成長が担保されることになります。

- たくさんの失敗をチャンスに変えてきたということですが…

創業時は大きな資金を手に入れるために極めて不利な条件でエンジェル投資家と手を組んだのですが、2000年に日本でも事業展開をしている競合会社に米国の兄弟会社が買収されました。これは当社にとっての絶体絶命のピンチを凌いだばかりでなく、エンジェルとの契約解消につなげ、チャンスに変えることに成功しました。会社経営をしていると、いたる所に落とし穴があり、ピンチは日常茶飯事です。いかにそれをチャンスに変えられるかが会社成長においての大きな違いとなって表れてくると思います。

- 今後の展開はどのようにお考えでしょうか?

2009年にGoogleが音声検索を、そして2011年にはAppleがSiriを日本市場に導入し、テレビなどで大々的に宣伝したことで日本でも音声認識に対する認知が急速に進み、スマホを含む未来のデバイスの期待感が高まってきました。これからはインターネットを介して人がコンピュータから多種多様なサービスを受ける時代になります。サービスの質は人とコンピュータとのコミュニケーションレベルに依存しますので、HCIを目指すAmiVoiceの需要が益々高まると思います。今後は幅広い分野での多種多様なサービス、音声インターフェースとして利用料を得たいと考えています。日本に限らず、アジアを経て世界にユーザーが広がっていくでしょう。

- 起業を志す人へメッセージをお願いします

「急がば回れ」「失敗は成功への道しるべ」「目標をつくれ」という言葉を贈ります。これらは成功に導く方程式です。挑戦して成功を掴むには失敗することが必要です。目標がなければ失敗が認識されずに次から次へと手をうつこともできません。一見、回り道に思えますが実はこれが一番の近道なのです。

- 座右の銘は?

自作の「生働一致」です。人間は自己実現、即ち、成長により幸福を感じ、それを求めて生きていきます。仕事においても成長することを求めて活動していきます。GAPにより成長を求める行為という意味では「生きることは、働くことと同じ」です。