研究テーマ

単一話者区間を利用した音源分離

複数の音源が混在する観測信号を,個々の音源に分離する方法を研究しています. 我々は,単一の話者のみが発話している区間を積極的に利用して,効率的に音源分離を実現しています. また,分離した音源から,その音源の位置を特定する研究も行っています. ヒアラブルデバイスを意識し,遠方の音源を除去するシステムのリアルタイム実装を目指しています.

聴覚障がい者向け発話支援システムの開発

聴覚障がい者向けの発話支援システムの開発に取り組んでいます. サ行の音を判別する紗音(さのん)は,発話指導の現場に導入され,その有効性について検証が行われています. 関連HPはこちら

長時間位相スペクトルを用いた画像音声変換

音声への画像埋め込み技術に取り組んでいます. 音声は,短時間観測においては,位相スペクトルよりも振幅スペクトルが音声の明瞭度に貢献します. 一方,長時間観測においては,位相スペクトルの方が音声の明瞭度に貢献します. この性質を利用して,画像を振幅スペクトル,音声を長時間位相スペクトルとして融合することで, 音声への画像埋め込みを実現しています. 本手法をFPGAなどに実装し,実環境での性能を検証することを目指しています.

ヒアラブルデバイスの開発

近年,ウェアラブルデバイスの耳版として,ヒアラブルデバイスが注目されています. ヒアラブルデバイスは,補聴器のようなデバイスで,音楽鑑賞をはじめ,通話や翻訳,生体情報の取得,個人認証などの応用が考えられています. 我々の開発したノイズ除去法や音源分離法を低消費電力で実現し,ヒアラブルデバイスに搭載することで,高性能な音声処理システムの実現が期待できます.

ゼロ位相信号を利用したノイズ除去システム

ゼロ位相信号は,フーリエ変換によって得られた振幅スペクトルの累乗を逆フーリエ変換すると得られます. 不要なノイズが広帯域スペクトルをもつ場合,ゼロ位相信号では原点付近にのみ値をもちます. 一方,音声信号の有声音(声帯振動を伴う声)はゼロ位相信号にすると,周期性を保ちます. この違いにより,ノイズ除去を実現できます. この方法では,定常ノイズも突発性ノイズも同じ方法で除去することができます.

可変音声分布による高性能ノイズ除去システム

MAP推定(事後確率最大化)により,ノイズに埋もれた音声を抽出する方法を研究しています. 本手法では,音声スペクトルの出現の仕方(音声の確率密度関数)をうまくモデル化することで,ノイズ除去を実現します. 特に自動車内騒音抑圧への応用について研究しています.

線形予測器を利用したノイズ除去システム

演算量の少ない線形予測器を用いることで,実機(FPGA, DSP)に搭載可能なリアルタイムノイズ除去システムを提案しています. ノイズに埋もれた音声信号の抽出を目的としていますが,FMラジオのビートノイズ(干渉電波)除去への応用についても研究中です.

FPGAによる音声信号処理のページ

当研究室ではFPGAを利用しています.FPGAの導入方法や音性信号処理への応用例について解説します.

リアルタイム音声信号処理のページ

様々なツールによるリアルタイム音声信号処理の実現方法を紹介しています.
自分の声をマイクで取り込みながら,リアルタイムで処理音を体感して下さい.