HOME > Fairy I/O™

Fairy I/O

mimi® に最適化された音声入出力ハードウェア製品シリーズ

Fairy I/O は、音声対話システムに最適な、企業向けホワイトレーベルハードウェア製品シリーズです。高度な音声対話システムを実現するには、ソフトウェア・ハードウェアを通して、様々な要素技術を組み合わせることが必要とされます。mimi® は、これらの必要な要素技術を多くを備えたソフトウェアスタックであり、Fairy I/O は mimi® の性能を最大限発揮するために作られたハードウェアです。

本製品シリーズによって、お客様ブランドでの妥協のない音声入出力システムの開発や、先進的な音声ソリューションの探索と開発がより容易かつ迅速になります。

Tumbler

 Tumbler は Fairy I/O™ シリーズの最初の製品であり、mimi® と入念に統合されたマルチマイクハードウェアです。

 Tumbler には Linux OS が搭載されており、開発者は Wi-Fi 経由で外部から ssh でログインして、自由に開発を行うことができます。先進的なスマートスピーカーに求められる機能の多くをソフトウェアライブラリとして備えており、各要素技術は疎結合なモジュールであるので、取捨選択して利用することができます。これにより、開発者が保有するソリューションを組み込んだ形での応用を可能としています。


 Tumbler は企業向けのホワイトレーベル製品です。お客様ブランドでのスマートスピーカー商品の開発や、スマートスピーカーを利用した先進的なソリューションの探索や PoC のために用いることができます。

主な機能と仕様

音声入力

16ch MEMS マイクロフォン、外部マイク入力端子、及びスピーカー再生信号のフィードバック入力の合計 18ch 同期音声入力を持ちます。サンプリングレートは最大で 48kHz, 16bit であり、非可聴帯の信号を受信することが可能です。 mimi® XFE と統合されることで、16ch マイクロフォンを利用した 3D 音源定位処理、ビームフォーミング処理、スピーカー再生信号のフィードバック信号を利用したエコーキャンセル処理が実現されます。


音声出力

同軸に配置された 1ch スピーカーシステム(フルレンジスピーカー、パッシブラジエーター、及びツイーター)による無指向性出力が可能です(最大定格 192 kHz, 24bit 1ch) ソフトウェアイコライザー、ラウドネスイコライザーを持ち、ソフトウェア側からの音質調整が可能です。音声出力信号は、ハードウェア的にフィードバックされているため、どのようなイコライズ処理を施しても、エコーキャンセル処理に影響を与えません。


計算資源

メインプロセッサとして ARM Coretex-A53 CPU(1.2 GHz 物理 4 コア)を備え、RAM 1 GByte、eMMC ストレージ 4 GByte 上に 32bit Linux OS が搭載されています。開発者は Wi-Fi ネットワークを介して、外部から ssh により本製品にログインすることができます(root 権限が与えられます)。コプロセッサとして、メインプロセッサ上の OS からリプログラミング可能な Arduino 互換 CPU を搭載しています。 強力なマルチコア CPU は、mimi® XFE のローカル環境での実行に加えて、ローカル環境での自由なサービス開発を促進します。


通信インターフェース

Wi-Fi、Bluetooth(AAC, aptX, HFP 1.6;ただし BTO オプション)、赤外線 I/O、USB オーディオインターフェース(ただし BTO オプション)を備えます。これにより、音声操作に対応した Bluetooth スピーカーや赤外線学習リモコン、議事録作成に対応した会議用 Bluetooth/USB マイクといった応用が可能となります。


表示機能

本体上部に 18 個のフルカラー LED からなる LED リングを備え、コプロセッサを介してメインプロセッサから制御できます。制御ライブラリはオープンソースとして公開され、自由なパターンを創作して表示させることが可能です。
mimi® XFE との連携によって、音声到来方向や音声受付状態をリングの光り方によって示すことができます。


搭載センサー

照度センサーを搭載します。BTO オプションの環境センサーとして、気温・湿度・気圧複合センサー及び、CO2 ガスセンサーを内蔵することが可能です。音声入出力機能が非可聴帯まで延びていることから、非可聴帯信号を簡易的な周辺測域センサーとして応用することが可能です。また、mimi® ESRと連携することで、環境音の発生状況を推定することが可能です。


ソフトウェア機能

本製品に最適化された SDK がプリインストールされています。SDK には mimi® XFE の機能が含まれ、本製品単独で、LED リングと表示連携した 3D 音源定位機能、適応ビームフォーミング機能、エコーキャンセル(バージイン)機能、発話区間検出機能等が実行でき、クラウド上でも mimi® の各種機能が提供され、すぐに開発を始めることができます。
単純に多チャンネル録音音声をローカル環境に保存することや、mimi® XFE 処理済音声を取得することも可能です。これによって、他社認識器等と組み合わせて利用することもできます。


ハードウェア拡張機能

本体底部に電気的仕様が開示されたドックコネクタを備えます。このドックコネクタには電源端子や、メインプロセッサから直接制御可能な GPIO 端子、メインプロセッサの USB ホスト端子等があり、Tumbler から直接制御できる拡張ハードウェアを開発することができます。

ハードウェア仕様比較

 
Tumbler
型番 T-01
音声入力 18ch(16ch MEMS マイク、外部入力、スピーカーフィードバック信号), サンプリングレート48kHz, ビット深度16bit
音声出力 同軸パッシブラジエータ・フルレンジスピーカー・ツイーターによる1ch 無指向性出力(サンプリングレート192kHz, ビット深度24bit. ただし 30kHz までの出力のみを測定)
計算資源 メインプロセッサ:ARM Cortex A-53 1.2GHz(物理4コア), Broadcom VidecoCore IV GPU 400MHz.  1GB LPDDR2 SDRAM, 4 GB eMMC Storage
コプロッサ:Atmega328-AU 8bit 20MHz, 2kbyte SRAM
インターフェース Wi-Fi, Bluetooth(BTO オプション), 赤外線 I/O(1x IRセンサー 8x IR LED), USBオーディオインターフェース(Bluetooth BTO オプションにバンドル), ドックコネクタ
表示・提示機能 LED リング(RGB LED x18),  インジケータ(白色 LED x1) 
搭載センサー 照度センサー, 環境センサー(温度・湿度・気圧;BTO オプション), CO2 センサー(BTO オプション)
備考
Tumbler T-01
音声入力 18ch(16ch MEMS マイク、外部入力、スピーカーフィードバック信号), サンプリングレート48kHz, ビット深度16bit
音声出力 同軸パッシブラジエータ・フルレンジスピーカー・ツイーターによる1ch 無指向性出力(サンプリングレート192kHz, ビット深度24bit. ただし 30kHz までの出力のみを測定)
計算資源 メインプロセッサ:ARM Cortex A-53 1.2GHz(物理4コア), Broadcom VidecoCore IV GPU 400MHz.  1GB LPDDR2 SDRAM, 4 GB eMMC Storage
コプロッサ:Atmega328-AU 8bit 20MHz, 2kbyte SRAM
インターフェース Wi-Fi, Bluetooth(BTO オプション), 赤外線 I/O(1x IRセンサー 8x IR LED), USBオーディオインターフェース(Bluetooth BTO オプションにバンドル), ドックコネクタ
表示・提示機能 LED リング(RGB LED x18),  インジケータ(白色 LED x1) 
搭載センサー 照度センサー, 環境センサー(温度・湿度・気圧;BTO オプション), CO2 センサー(BTO オプション)
備考