波形接続型音声合成

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

波形接続合成: concatenative synthesis;[脚注 1] あるいは素片接続型、素片連結方式、連結的合成)とは、録音された音の断片(「単位」と呼ばれる)を連結し合成する手法である。単位の長さに厳密な定義はないが、およそ10 ms~1秒程度の範囲である。この手法は音声合成楽音合成で、多数の録音フレーズを集めたデータベース(音声コーパス歌手ライブラリ、楽音コーパス)から、ユーザが指定したフレーズの音を生成するのに使用される。

音声[編集]

波形接続合成による音声合成は、「波形接続型音声合成」と表現される事がある。[脚注 2]

歌唱[編集]

音楽[編集]

音楽のための波形接続合成は、2000年代に特にSchwarz[1]Pachet[2]の研究を通じて開発が始まった(musaicingとも呼ばれる[要検証 ])。基本技術は音声の場合と同様だが、音声と音楽の性質の違いにより相違がある: たとえば分割は音素音節等の単位ではなく、ノートやイベント等のサブ単位[要説明]で行なう。[1][3][4]

波形接続合成による楽音合成の研究事例については、Schwarzがサーベイ結果を公開している[5]

関連項目[編集]

脚注[編集]

[ヘルプ]
  1. ^ この記事は、音声 (人の声) 以外のconcatenate synthesisを主に扱う記事なので、音声限定の訳語「波形接続型音声合成」ではなく、より広いニュアンスを持つ訳語「波形接続合成」を用いる。この分野の開拓者Schwarzのサーベイ結果 Schwarz 2006 によれば、国際的に広く認知された成果はまだ日本からは出現しておらず、日本語による定番訳語は不明である。なお「波形接続合成」という表現は、たとえば下記をはじめとする十数件程度の論文で使用されている:
    “"波形接続合成"の検索結果: 約14件”, Google Scholar, http://scholar.google.co.jp/scholar?q=%22%E6%B3%A2%E5%BD%A2%E6%8E%A5%E7%B6%9A%E5%90%88%E6%88%90%22 2013年2月15日閲覧。 
  2. ^ 「波形接続型音声合成」という表現の初出論文および一般性は定かではないが、たとえば下記をはじめ数十件程度の日本語論文で使用されている:
    "波形接続型音声合成"の検索結果: 約55件”. Google Scholar. 2013年2月15日閲覧。

参考文献[編集]

外部リンク[編集]