距離の近い領域が直線状に現れることを利用し,これを画像のハフ変換により直線として検出するとともに,検出された直線から音声の始端と終端を得る方法を提案する.本方式を用いて,100都市名の区間検出実験を行った結果,対象音声区間の始端の検出誤差が最大で120ms,終端の誤差は最大で70msであるこ...