Top


カツラダ コウイチ
桂田 浩一  教授
東京理科大学 創域理工学部 情報計算科学科
プロフィール | 研究シーズ | 研究室紹介 | 担当授業(32件)
レフェリー付学術論文(27件) | レフェリー付プロシーディングス(57件) | その他著作(42件) | 著書(1件) | 学会発表(66件)
グループ IT
研究・技術キーワード 音声情報処理,顔画像処理
研究・技術テーマ
  • 音声検索語検出
  • 音声合成
  • 歌声合成
  • 顔画像処理
  • 対話システム
研究・技術内容 高速音声検索語検出について: 音声検索語検出とは,音声データから該当する発話箇所を検索する技術を指します. 予め音声を検索に適したデータ構造(例えば音声認識結果等)に変換しておき, そのデータ構造を対象に単語や文章の発話箇所を検索します. 本研究では,従来手法と比較して非常に高速な音声検索を実現しています. 10,000時間程度の音声データを対象に,数ミリ秒で該当箇所を検索することが可能です.
産業への利用 音声検索語検出の用途について ・議会/会議や講義/授業の収録データを対象とするキーワード検索 ・コールセンターの収録データを対象とするNGワード検索 ・家庭用HDDレコーダを対象とする発話箇所検索 ・テレビ局,ラジオ局の番組検索 キーワード検索の性能は音声認識の性能に依存するため, 高性能な音声認識システムの開発グループとの共同研究が望ましい.
可能な産学連携形態 共同研究、受託研究員受入、受託研究、技術相談および指導、国際的な産学連携への対応
具体的な産学連携形態内容
その他所属研究機関
所属研究室
所有研究装置
SDGs
CLOSE