NTTコミュニケーション科学基礎研究所(京都府相楽郡精華町光台)で5月31日、オープンハウスが始まった。
AIや脳機能、ウェルビーイングといった講演や、コミニュケーションやメディアの科学といった4テーマに分けて研究展示を行う同イベント。
デルクロア マークさんらの研究「Speaker Beam」は、複数人の会話の中からコンピューターが特定の人の声を抽出することができるという。従来は抽出する声のサンプルが約5時間必要だったが、ディープラーニング(深層学習)を活用した世界初の技術で、10秒程度の音声でその人の声の特徴をとらえ、複数人が話していたり音楽が掛かっていたりしてもその声を抽出できるという。
この日は、デモンストレーションで目的話者(抽出したい話し手)とは別の音を抽出してしまうアクシデントが発生。すぐに目的話者の録音時にカメラのシャッター音が入ったことが原因だと特定し、2度目のデモで正確な音声の抽出に成功した。
現在似た声は苦手という課題はあるものの、今後、AIスピーカーに組み込んでテレビなどの音には反応せず、持ち主の声だけに反応したり、特定の人の声に反応したりするICレコーダーや補聴器などへの応用を検討しているという。
このほか、振動で行くべき方向を示す手持ち端末「ぶるなび」に赤外線センサーを組み合わせ、障害物に近づくと、振動で障害物の位置や形状が「体感」できるよう改良する研究や、録音した音を元に、人や物の位置関係を予想した画像をディープラーニングを使って作成するといった研究も公表された。
公開時間は9時30分~16時。入場無料。6月1日まで。