波形接続型音声合成

出典: フリー百科事典『ウィキペディア(Wikipedia)』

これはこのページの過去の版です。Bcxfubot (会話 | 投稿記録) による 2022年7月27日 (水) 17:35個人設定で未設定ならUTC)時点の版 (外部リンクの修正 http:// -> https:// (scholar.google.co.jp) (Botによる編集))であり、現在の版とは大きく異なる場合があります。

波形接続合成: concatenative synthesis;[脚注 1] あるいは素片接続型、素片連結方式、連結的合成)とは、録音された音の断片(「単位」と呼ばれる)を連結し合成する手法である。単位の長さに厳密な定義はないが、およそ10 ms~1秒程度の範囲である。この手法は音声合成楽音合成で、多数の録音フレーズを集めたデータベース(音声コーパス歌手ライブラリ、楽音コーパス)から、ユーザが指定したフレーズの音を生成するのに使用される。

音声

波形接続合成による音声合成は、「波形接続型音声合成」と表現される事がある。[脚注 2]

歌唱

音楽

音楽のための波形接続合成は、2000年代に特にSchwarz[1]Pachet[2]の研究を通じて開発が始まった(musaicingとも呼ばれる[要検証])。基本技術は音声の場合と同様だが、音声と音楽の性質の違いにより相違がある: たとえば分割は音素音節等の単位ではなく、ノートやイベント等のサブ単位[要説明]で行なう。[1][3][4]

波形接続合成による楽音合成の研究事例については、Schwarzがサーベイ結果を公開している[5]

関連項目

脚注

  1. ^ この記事は、音声 (人の声) 以外のconcatenate synthesisを主に扱う記事なので、音声限定の訳語「波形接続型音声合成」ではなく、より広いニュアンスを持つ訳語「波形接続合成」を用いる。この分野の開拓者Schwarzのサーベイ結果 Schwarz 2006 によれば、国際的に広く認知された成果はまだ日本からは出現しておらず、日本語による定番訳語は不明である。なお「波形接続合成」という表現は、たとえば下記をはじめとする十数件程度の論文で使用されている:
    “"波形接続合成"の検索結果: 約14件”, Google Scholar, https://scholar.google.co.jp/scholar?q=%22%E6%B3%A2%E5%BD%A2%E6%8E%A5%E7%B6%9A%E5%90%88%E6%88%90%22 2013年2月15日閲覧。 
  2. ^ 「波形接続型音声合成」という表現の初出論文および一般性は定かではないが、たとえば下記をはじめ数十件程度の日本語論文で使用されている:
    "波形接続型音声合成"の検索結果: 約55件”. Google Scholar. 2013年2月15日閲覧。

参考文献

  1. ^ a b Schwarz, Diemo (2004-01-23), Data-Driven Concatenative Sound Synthesis, http://recherche.ircam.fr/equipes/analyse-synthese/schwarz/thesis/ 
  2. ^ Zils, A.; Pachet, F. (2001), “Musical Mosaicing”, Proceedings of the COST G-6 Conference on Digital Audio Effects (DaFx-01), University of Limerick: 39–44, オリジナルの(2002-08-09)時点におけるアーカイブ。, http://recherche.ircam.fr/projects/cuidado/wg/dissemination/acceptedpapers/sony/Dafx01-final.pdf 
  3. ^ Schwarz, D. (2005), “Current research in Concatenative Sound Synthesis”, Proceedings of the International Computer Music Conference (ICMC), http://recherche.ircam.fr/equipes/analyse-synthese/schwarz/publications/icmc2005/Schwarz_ICMC2005_Current-Research.pdf 
  4. ^ Maestre, E.; Ramírez, R.; Kersten, S.; Serra, X. (2009), “Expressive Concatenative Synthesis by Reusing Samples from Real Performance Recordings”, Computer Music Journal 33 (4): 23–42, doi:10.1162/comj.2009.33.4.23, http://www.mitpressjournals.org/doi/pdf/10.1162/comj.2009.33.4.23 
  5. ^ Schwarz, D. (2006), Corpus-Based Sound Synthesis Survey, IMTR, IRCAM, http://imtr.ircam.fr/imtr/Corpus-Based_Sound_Synthesis_Survey 

外部リンク