ホームリバネス研究費・高専研究費第42回時間・空間・五感賞採択者「声を使わずに操作する、新たな入力インターフェースを創る」木村直紀さん

第42回時間・空間・五感賞採択者「声を使わずに操作する、新たな入力インターフェースを創る」木村直紀さん

から

miyanorei

2020年5月13日

第42回時間・空間・五感賞採択者「声を使わずに操作する、新たな入力インターフェースを創る」木村直紀さん

［第42回リバネス研究費時間・空間・五感賞］採択者インタビュー

【採択者】
木村直紀氏（東京大学大学院学際情報学府暦本研究室修士1年）
【採択テーマ】
口腔内超音波画像を用いたサイレントスピーチインタフェースと知的能力拡張
【研究費情報】
募集テーマの詳細はこちら

近年注目される音声認識インターフェースは、キーボード操作などの特殊な技能が必要なく、未来のコンピュータにおいて主流となりうる技術だ。しかし、発声が必須という音声操作の性質が、普及の上でボトルネックになっている。入力内容が周囲に聞こえてしまい秘匿できない点や、先天的に発声ができない人や手術で声帯を切除した人には利用できない点が課題となるのだ。そこで木村氏は、声帯の振動ではなく口の動きだけをとらえて、音声操作を可能にする新たなサイレントスピーチインターフェースの開発に挑んでいる。
人が言葉を話すとき、声の高さや大きさは声帯でコントロールされるのに対し、発音は口腔内の形状と舌の動きに強く影響される。つまり、声帯を震わせず口だけを動かし(口パク)、その時の口腔内形状を計測して音響情報に変換できれば、声帯を振動させることなくコンピュータに入力できる、と木村氏は考えている。現在、超音波プローブで口パク時の口腔内形状を取得し、それをニューラルネットワークで解析するとともに、音声データを同時に学習させることで、口パクでもいくつかの音声コマンドを動かすことに成功しているという。「将来的に、コンピュータの応答音声をイヤホンや骨伝導で受け取る技術と融合できると、いわば脳内で常にコンピュータと対話している環境が実現できるかもしれない。その時、人間の振る舞いはどう変わるのかにも興味がある」と語る木村氏は、人の知的能力が拡張する未来を見据えている。 (文・塚越光)

返事を書く 返事をキャンセル

返事を書く返事をキャンセル