News Release

駅の窓口業務を行う「駅案内ロボット」に音声処理技術とマルチマイクハードウェアを提供 <3月16日より京王電鉄下北沢駅で試験運用開始>


 フェアリーデバイセズ株式会社(本社:東京都文京区、代表取締役:藤野真人、以下「当社」)は、オムロングループのオムロン ソーシアルソリューションズ株式会社(本社:東京都港区、代表取締役社長:細井 俊夫、以下「OSS」)が京王電鉄株式会社 井の頭線 下北沢駅にて3月16日より試験運用を開始する駅案内ロボットに、音声処理技術およびマルチマイクハードウェアを提供したことをお知らせいたします。

 少子高齢化による労働力不足、訪日外国人観光客の増加により、多様な利用客が行き交う公共施設では、接客業務の負荷軽減を行うために業務を代替するロボットの実現が求められています。このようなロボットに適切な接客対応を行わせるためには、騒音環境下で正確に音声を収集し、適切に聞き取る音声処理技術、および多言語での認識技術が必要となります。今回、当社が持つ音声処理技術を提供することで、騒音が多い駅構内の環境においても高い精度で音声対話が可能なロボットを実現しました。


           <駅案内ロボット>                    <京王電鉄 井の頭線下北沢駅設置イメージ>
 

音声処理技術について
 


 当社は、実業務現場に音声技術を適用するために必要な、ほぼ全ての要素技術をハードウェアを含む形で提供しています。今回、音声処理技術については、当社のソフトウェア製品シリーズ「mimi®」を提供。マルチマイクはハードウェア製品シリーズ「Fairy I/O®」を提供しています。

 一般的に音声認識処理の精度は、マルチマイク(複数マイク)である方が精度が高まることが知られています。マルチマイクでの集音時に、マイクの異なる配置による音声の位相差や振幅差などを適切に処理することで、目的とする音声のみを強調することができ、それにより音声認識の精度向上がなされますが、その反面、マイク・スピーカー配置や筐体設計などのハードウェア的側面や、マルチマイク処理のアルゴリズムなどのソフトウェア的側面の両面を十分に擦り合わせる必要があり、高度な全体設計が求められます。「mimi XFE」はマルチマイク処理のソフトウェア側を担うソフトウェア・ライブラリであり、当社の業務用スマートスピーカー Fairy I/O Tumbler を始めとした様々なマルチマイク製品で利用されています。
16chを8ch2つに分け、認識精度の向上と自由なレイアウトを可能とし、音前段処理を担う「mimi XFE」、クラウドでの「高速音声認識処理 mimi ASR」と連携することで、ロボット/サイネージなどへの搭載に最適な構成となっています。


>「Fairy I/O 16chマルチマイク(バー型)」

 ロボットから発せられるモーターなどの作動音の影響をできるだけ削減し、発話者の音声をクリアに集音することに適したマイクハードウェアです。2本のバー型形状により、自由なレイアウトを実現します。

T-02 説明.jpg マイク設置部.jpg


>音前段処理 「mimi XFE」

「mimi XFE」は、音声を扱うために必要となる様々な音処理機能を提供しています。今回、雑音の多い環境においても正確な音声を収音するために、「mimi XFE」が持つ以下の技術を活用しています(主要機能のみ)

VAD(発話区間抽出) :人が話し始めこと、また話し終わったことを検出します。
エコーキャンセル :ロボットが発話している最中でも人間の声を認識することができるバージイン対応(割り込み発話対応)を実現しています。
ビームフォーミング :目的とする音声のみを強調して集音します。

 

 

>高速音声認識処理 「mimi ASR」

 人と人との会話は想像以上に速いやり取りがなされています。クラウドでの音声認識処理の速度を高速化し人間に近づけることで、人とロボットとの違和感のない会話体験に貢献しております。


>バージイン対応(割り込み対話機能)


 ロボットが発話している最中でも、人の声を認識できる技術により、ロボットがしゃべり終わるのを待つ必要のない、スムースで自然な対話を実現しました。
 これまでのコミュニケーションロボットなどにおける対話ソリューションでは、「機械の準備が整うまで待つ」「機械がしゃべり終わるまで待つ」というように、人間側に不自然なコミュニケーションを強制している場合が多くありましたが、ロボットがバージイン対応となることで、人間にとってより自然なコミュニケーションを実現しています。


今後の展開について

 
 当社は人間と機械とのコミュニケーションをより自然なものとする技術開発に力を注いでいます。

音声認識処理に関連するソフトウェアのみならず、音声を正確に集音するためのハードウェア開発も合わせて行うことで、駅をはじめとする雑踏環境下のみならず、あらゆる社会インフラへの音声技術の実装を目指しています。
「音声によるコミュニケーション」という人間の本能的な動作を、人間側の負荷を強いることなく機械側が認識する「ボイスファースト」時代の基盤となる技術を提供していきます。


「mimi」 について 


 高度な音声対話システムを構築するための疎結合なソフトウェアスタックであり、マイクアレイ・フロントエンド処理機能を担う「mimi XFE」、多言語での音声認識及び翻訳機能、音声合成を担う「mimi ASR/TRA/TTS」、話者識別機能を担う「mimi SRS」、環境音識別機能を担う「mimi ESR」等からなるクラウドAPIサービスです。「mimi」利用製品は、累計180万台に達します。


参考URL: https://www.fairydevices.jp/mimi_about.html


「Fairy I/O」について 


 「Fairy I/O」シリーズは、「mimi」の開発と運用で培われた知見を基に開発された、音声対話システムを構築する上で最適なホワイトレーベルハードウェア製品シリーズです。その第一弾として、先進的なスマートスピーカーに求められる機能を備えた、高さ14.5cm、直径7.5cmのタンブラー型マルチマイクハードウェア「Fairy I/O Tumbler」の企業向け販売をしております。これにより、難度の高い「クリアな集音」「正確な音声認識」にかかる開発工数を削減でき、お客様ブランドでのスマートスピーカー商品の開発や、先進的な音声ソリューションの開発が促進されます。


参考URL: https://www.fairydevices.jp/fairy_io.html


フェアリーデバイセズ株式会社について


 フェアリーデバイセズ株式会社は、「使う人の心を温かくする一助となる技術開発」をコーポレート・アイデンティティとして掲げ、VUI・VPA関連技術、音/音声認識と関連する機械学習諸分野の応用研究開発、及び対話システム・UXデザインの設計と評価に強みを持ちます。

 
 
※駅案内ロボットについて

 乗換案内や構内・周辺案内といった利用客からの音声によるお問い合わせに、音声・ディスプレイ・ロボットの動きで回答します。これまでOSSが磨いてきた駅業務に特化した対話型AIエンジンに、多くの利用客が行き交う雑踏環境下でも正確に音声を集音し、言葉を認識できる「独自の音声処理技術」と、「クラウドでの高速な音声処理」に加え、ロボットの回答中に別の質問をすることができる「割り込み対話機能」を付加することで、より人と人との対話に近づけることに成功し、これまで困難であった窓口業務の自動化を実現します。

参考URL: https://www.omron.co.jp/press/2019/02/c0305.html


 


※オムロン ソーシアルソリューションズ株式会社について

 オムロン ソーシアルソリューションズ株式会社は、オムロン株式会社の子会社として、社会システム事業を担っております。オムロン株式会社は、独自の「センシング&コントロール+Think」技術を中核としたオートメーションのリーディングカンパニーとして、制御機器、電子部品、車載電装部品、社会インフラ、ヘルスケア、環境など多岐に渡る事業を展開しています。

参考URL:  https://www.oss.omron.co.jp/index.html





※本プレスリリースに記載されている会社名、製品名は各社の登録商標または商標です。

【本件に関するお問い合わせ先】

フェアリーデバイセズ株式会社
お問い合わせ窓口
電子メール  contact@fairydevices.jp