VOCALOID
出典: フリー百科事典『ウィキペディア(Wikipedia)』
| VOCALOID2 Editor | |
|---|---|
| 開発元 | ヤマハ |
| 最新版 | 2.0.12 / 2009年2月9日 |
| 対応OS | Windows XP/Vista |
| 種別 | 音声合成、DTM ボーカルシンセサイザー(歌唱合成) |
| 公式サイト | YAMAHA VOCALOID |
VOCALOID(ボカロイド、ボーカロイド)はヤマハが開発したデスクトップミュージック (DTM) 製作を目的とした音声合成技術、及びその応用製品の総称[1]。メロディーと歌詞を入力することでサンプリングされた人の声を元にした歌声を合成することができる。2009年現在は新バージョンのVOCALOID2がリリースされている。開発元のヤマハ自体はVOCALOID製品を提供しておらず、ライセンス契約を締結した各社がサンプリングされた音声を収録した歌手ライブラリを独自に製作し、ヤマハ製のソフトウェア部分と組み合わせて製品として販売されている[1]。
なお、VOCALOIDという言葉は一部応用製品に設定されているキャラクターを指すために用いられる場合もある。また、ボカロという略称が用いられるケースもある。
目次 |
概要
歌声を作成するための音声合成手法「周波数ドメイン歌唱アーティキュレーション接続法 (Frequency-domain Singing Articulation Splicing and Shaping) 」を採用したリアルな歌声を合成するためのソフトウェア[2]。「実際に収録した人の声を音声ライブラリとして合成するため、より自然な歌声を合成できるほか、ビブラートやこぶしなど歌声に必要な音程変化や抑揚を指定でき、表情豊かな楽曲を手軽に作れるのが特徴[3]」とされる。2000年3月に開発が開始され[4]、2003年2月26日に発表[2]、2004年にVOCALOID技術を使用した最初の製品が発売、2007年以降はより自然な歌声になるよう改良されたバージョンアップ版のVOCALOID2を使用した製品が販売されている。VOCALOIDの登場により、DTMにおいて実際に人間の歌声を録音せずともパソコンだけで人間らしい歌声のボーカルパートを作成できるようになった。なお、VOCALOIDは歌を作成することを前提に開発されたソフトであるため文章の読み上げには対応していない[5]。また歌唱に係わる表現でも、だみ声やシャウトなどを自然に再現することは出来ない[6]。
VOCALOIDという名称は、「vocal(ボーカル)」に語尾の「oid」を組み合わせて作られた造語である(「oid」は「~のようなもの」「~状の」という意味で、「human(人)」と組み合わせれば「humanoid(ヒューマノイド)」、ギリシャ語で男を意味する「andr」と組み合わせれば「android(アンドロイド)」となる)[4]。
システム
VOCALOID2のシステムは大きく分けてユーザーが歌詞やメロディなどを入力する「スコアエディタ(VOCALOID2 Editor)」、音声素片を収録した「歌手ライブラリ」、音声素片を連結して歌声を合成する「合成エンジン」の三要素で構成される。ヤマハの提供部分である「スコアエディタ」と「合成エンジン」についてはVOCALOID2同士であれば基本的に製品ごとの違いは無いため、既にVOCALOID2製品がインストールされているパソコンに別のVOCALOID2製品をインストールする場合はライブラリの追加だけで使用可能となる。日本語と英語の二言語に対応。スタンドアローン(再生、WAVファイルに書き出し)及び、ReWireアプリケーション又はVSTiとしてDAW等から使用可能。
- スコアエディタ(Score Editor)
- ユーザーが入力を行う部分。音符はピアノロールスタイルで入力し、歌詞はピアノロールの音符の中に入力する。日本語用のライブラリを使用する場合は平仮名、片仮名もしくはローマ字を用いて五十音で歌詞を入力。英語用のライブラリでは英単語を入力し、内部の発音辞書により自動的に発音記号に変換される。発音辞書に登録されていない単語は発音記号を直接編集する。日本語用と英語用のライブラリで歌詞の入力方法は異なるが、プラットホームが同じであるためVOCALOID2同士であれば日本語版のエディタでも英語用のライブラリを読み込ませることも出来、逆も可能。歌詞の入力は上記のようにライブラリ依存となっているため、日本語版と英語版のエディタの違いはメニューの表示のみである。
- スコアエディタは歌声に表情付けを行うための各種パラメータを備えており、歌声を作成する際はこうしたパラメータを調整し曲にあわせた加工を施すことが前提となっている[7]。
- ReWireに対応しておりDAWと同期可能。
- 歌手ライブラリ(Singer Library)
- ヤマハからライセンス供与を受けた各社の担当部分で、人間の声からサンプリングした音声素片(歌声の断片)を含むデータベース。音声素片は、音(音素)が変化する際の移り変わりの部分(ダイフォン、diphone)と、伸ばし音が収録されている。例えば、「咲いた」([sa i ta])という歌詞を合成する場合は、ダイフォン「#-s,s-a,a-i,i-t,t-a,a-#」(#は無音を示す)と母音の伸ばし音「a,i」を用い、これらを接続して歌声が作られる。これら音声素片は合成する際に入力されたメロディに合うピッチ(音高)に変換されるが、より自然な合成を得られるよう歌手ライブラリには異なるピッチのものを複数用意している[8]。1ピッチあたりのダイフォンは日本語用ライブラリでは約500個、英語では約2500個収録している[9]。この違いは言語の特性によるもので、日本語のダイフォンが少ないのは日本語の音素の数が少ないことと、音節がほとんどの場合開音節(母音で終わる音節)であるためである。日本語の子音を含むダイフォンでは基本的に「無音-子音」「母音-子音」「子音-母音」という組み合わせのパターンとなるが、英語の場合は閉音節(子音で終わる音節)も多く存在し、「子音-子音」や「子音-無音」といったように組み合わせのパターンも多くなるため、日本語用ライブラリに比べ収録しなければならないダイフォンの数が多く、データベースの容量も大きくなる。また、このような違いがあるため、日本語用ライブラリで英語の歌詞を発音させるといったような使用は適さない。
- 合成エンジン(Synthesis Engine)
- スコアエディタに入力された情報を元にライブラリから音声素片を選び出し、タイミングやピッチ、音色などを調整、連結して歌声に合成する。エディタに入力された情報はVOCALOID MIDIという専用のMIDIメッセージを用いて合成エンジンへ送られる。DAW等からVOCALOIDをVSTiとして使用する場合は、同梱されているVSTプラグインを用いてスコアエディタを介さず合成エンジンへ直接VOCALOID MIDIメッセージを送る形となる[10]。
新旧の違い
初代のVOCALOIDとVOCALOID2の間には互換性がなく、同一のエディタ上で使用することは出来ない。音声素片を組み合わせて歌声を合成するシステムであることは変わらないが、合成エンジンが完全に入れ替えられているほか[7]、エディタのインターフェースも一新[7]、歌手ライブラリの音声もそれまでノイズとしてカットしていた息遣いなどを原音のまま生かし、ハスキーな歌声にも対応できるようになっている[8]。
VOCALOIDを使用した製品
VOCALOID
これら第一世代VOCALOIDのエンジン部は 2006年にVer1.1 にバージョンアップしている[11]。
- LEON - 英語/男声
- LOLA - 英語/女声
- 製造元:ZERO-G(イギリス)(日本国内代理店クリプトン・フューチャー・メディア)
- 発売日:NAMM 2004 Winter (2004年1月15-18日)にてリリース[12](日本国内2004年3月3日[13])
- LEONとLOLAはVOCALOIDエンジンを使用した初めての製品。どちらもソウルシンガーである。モデルとなった歌手はイギリスのプロのセッション・シンガーとされるが、名前は明らかにされていない[14]。パッケージには男女の口周りの写真があるだけで具体的な人物像は描かれておらず、男性女性を表す学術記号(♂と♀)がそれぞれのロゴのアルファベット「O」の部分に当てられている。
- MIRIAM - 英語/女声
- 製造元:ZERO-G(日本国内代理店クリプトン・フューチャー・メディア)
- 発売日:2004年7月1日[12](日本国内2004年7月26日[15])
- アディエマスのヴォーカル、ミリアム・ストックリーがモデルであり、パッケージにも描かれている。
- MEIKO - 日本語/女声
- 製造元:クリプトン・フューチャー・メディア
- 発売日:2004年11月5日
- VOCALOID日本語ライブラリの第1弾。ポップス、ロック、ジャズ、R&B、童謡まで幅広く歌いこなすとされる。拝郷メイコ(元ヤマハミュージックコミュニケーションズのシンガーソングライター)がモデル。パッケージには拝郷メイコ本人ではなく、赤い服を着た女の子のイメージイラストが描かれている。初年度で約3,000本を売り上げ、発売当時におけるDTM市場では異例のヒット商品となった。
- KAITO - 日本語/男声
- 製造元:クリプトン・フューチャー・メディア
- 発売日:2006年2月17日
- VOCALOID日本語ライブラリの第2弾。声質は伸びやかで清涼感が有り、POPSを始めとした歌謡曲~童謡までをオールマイティにこなすとされている。スタジオ・ミュージシャンの風雅なおとがモデル。パッケージには青いマフラーに白い服を身にまとった青い髪の男性が描かれている。発売当時は売り上げが伸び悩み、MEIKOの売れ行き3,000本に対して500本しか売れず、MEIKOの実績から見ると明らかな失敗に終わったとされたが、初音ミクのヒットでVOCALOIDが注目されるようになってからはKAITOの人気も上昇し、2007年末以降売り上げを大きく伸ばしている。
VOCALOID2
- SWEET ANN - 英語/女声
- 製造元:PowerFX(スウェーデン)(日本国内代理店クリプトン・フューチャー・メディア)
- 発売日:2007年6月29日[16](日本国内2007年9月21日[17])
- VOCALOID2エンジンを搭載した最初の製品。ポップシンガーであり、ダンスミュージック等を想定している。MySpaceのプロフィールではスウェーデン人となっている[1]。PowerFX社は「人造人間」的なイメージ戦略をとっており[18]、SWEET ANNのパッケージには首に縫い目のある金髪で小麦色の肌の女性のイラストが描かれている。
- 初音ミク- 日本語/女声
- 製造元:クリプトン・フューチャー・メディア
- 発売日:2007年8月31日
- バーチャルアイドル歌手をプロデュースするというコンセプトの「キャラクター・ボーカル・シリーズ(CVシリーズ)」第1弾。パッケージにはアニメ調のキャラクターイラストが使用されており、16歳の少女という設定がつけられている。得意ジャンルはアイドルポップス / ダンス系ポップス。サンプリング音声は声優・藤田咲が担当。新エンジンの採用、キャラクターの人気などにより発売から約1年で4万本以上を出荷する大ヒット商品となった[19]。
- 鏡音リン・レン- 日本語/女声・男声
- 製造元:クリプトン・フューチャー・メディア
- 発売日:2007年12月27日
- 「キャラクター・ボーカル・シリーズ」の第2弾。女声の鏡音リンと男声の鏡音レン、2つ併せて一つの製品としている。初音ミクと同じくパッケージにアニメ調のキャラクターイラストが使用されており、14歳の少年少女という設定がつけられている。得意ジャンルは、鏡音リンはエレクトロ&ロック系ポップス/歌謡曲~演歌系ポップス、鏡音レンはダンス&ロック系ポップス/歌謡曲~演歌系ポップス。サンプリング音声は声優・下田麻美が一人二役で担当している。2008年7月に "Act2" と銘打ったライブラリアップデートが行われた。
- PRIMA - 英語/女声
- 製造元:ZERO-G(日本国内代理店クリプトン・フューチャー・メディア)
- 発売日:2008年1月14日[20](日本国内2008年2月22日[21])
- ソプラノオペラ歌手で、クラシック系音楽を想定している。他のVOCALOIDと同じDVD-ROMによるパッケージ製品の販売に加え、公式サイトでは同一のソフトを安価にダウンロード販売している。
- がくっぽいど - 日本語/男声
- 製造元:インターネット
- 発売日:2008年7月31日
- VOCALOID2エンジンでは男性の声を元にした最初の製品。ボーカリストGacktの声をサンプリングしており、Gacktの声質をリアルに再現することが重視されている。パッケージには漫画家の三浦建太郎のデザインによるイメージキャラクター「神威がくぽ」のイラストが使用されている。
- 巡音ルカ - 日本語・英語/女声
- 製造元:クリプトン・フューチャー・メディア
- 発売日:2009年1月30日
- 「キャラクター・ボーカル・シリーズ」の第3弾。パッケージはキャラクターイラスト、20歳女性という設定となっている。日本語と英語、二つのライブラリを収録した日英バイリンガルで、得意ジャンルはラテン・ジャズ~エスノ系ポップス、ハウス~エレクトロニカ系ダンスとされている。サンプリング音声は英語に堪能な声優の浅川悠が担当。
- Megpoid - 日本語/女声
- 製造元:インターネット
- 発売日:2009年6月26日
- Megpoid(メグッポイド)は歌手で声優の中島愛の声をベースとした製品。パッケージには漫画家のゆうきまさみのデザインによるイメージキャラクター「GUMI」のイラストが描かれている。
- BIG-AL - 英語/男声
- 製造元:PowerFX
- 発売日:発売未定
- 低音を特徴としている。2008年6月現在、発売未定だが紹介サイトではデモソングが公開されている。
NetVOCALOID
NetVOCALOIDは、サーバ上にVOCALOIDを実装し歌声合成機能をネットワークを介して事業者向けに提供するSaaS型のサービス。ヤマハの社内プロジェクト「Y2プロジェクト」の一環として提供が行われているもので、一般ユーザー向けのサービスはヤマハ自体ではなく提供を受けた事業者が行い、入力内容は事業者によってNetVOCALOIDサーバへ送られ歌声の合成が行われる[22]。インターネットにつながっている機器であればVOCALOIDの機能を提供出来、スペックの低いパソコンや、携帯電話やゲーム機といった機器からVOCALOIDを利用するサービス[22]、インターネット上のアバターに歌を歌わせる、ロボットへの応用、広告への利用といった展開も可能とされる[23]。
NetVOCALOIDを活用した一般ユーザー向けサービスとしては2009年4月よりインターネット社の「ケータイがくっぽいど」、クリプトン・フューチャー・メディアの「ミクと歌おう♪」が携帯電話向けサービスとして提供されている[24]。
関連技術
- VocaListener
- VocaListener(ボーカリスナー)は産業技術総合研究所で研究されている、歌声を入力に用いてVOCALOIDのパラメーターを設定し合成歌唱を作り出すことのできるシステム。略称は「ぼかりす」。入力された歌唱からパラメーターを推定し、更に合成歌唱と元の歌唱とを比較しながらパラメータの再調整を繰り返すことで歌手ライブラリごとの特性などによらず元の歌唱の歌い回しを真似た合成歌唱を得ることができる。元となる歌唱の音高や歌唱スタイルを調整する機能も備えており、ユーザーの歌唱力が低い場合やユーザが歌唱できない表現にも対応する。2008年5月28日の第75回音楽情報科学研究会での発表に先立つ同年4月28日に、動画投稿サイトニコニコ動画にてVocaListenerを用いて作成された歌声が公開され、その人間が歌っているかのような自然な歌声にファンの間で大きな話題を呼んでいる[25]。
参考文献
- 剣持秀紀、大下隼人「歌声合成システムVOCALOID--現状と課題」、『情報処理学会研究報告』Vol.2008,No.12、情報処理学会、2008年2月、51-56頁、ISSN 0919-6072。
- 剣持秀紀「歌声合成技術とVOCALOID」、『ヒューマンインタフェース学会誌』Vol.10 No.2、ヒューマンインタフェース学会、2008年5月、95-98頁、ISSN 1344-7254。
- 「剣持秀紀interview」、『DTM magazine』15(2) (通号 166) (増刊) 2008.1、寺島情報企画、36-39頁。
- "デジタルコンテンツの知的財産権に関する調査研究 : 進化するコンテンツビジネスモデルとその収益性・合法性-VOCALOID2、初音ミク、ユーザ、UGMサイト、権利者 : 報告書" 33-42頁. デジタルコンテンツ協会 (3 2008). 2009年1月16日 閲覧。
- 「音楽情報処理最前線!VOCALOIDに歌を真似させるVocaListener(ぼかりす)」、『DTM magazine』15(9) (通号 173) 2008.8、寺島情報企画、72-73頁。
- ^ a b 『情報処理学会研究報告』Vol.2008,No.12、情報処理学会、51頁。
- ^ a b “歌詞とメロディを入力すると歌い出す ヤマハが歌声合成ソフト開発”. ITmedia(. 2003年2月26日) 2009年1月13日 閲覧。.
- ^ "デヤマハが歌声合成ソフトVOCALOID(ヴォーカロイド)をインターネット経由でサービスプロバイダー向けに提供を開始". ヤマハ (4 2009). 2009年4月15日 閲覧。
- ^ a b "デジタルコンテンツの知的財産権に関する調査研究 : 進化するコンテンツビジネスモデルとその収益性・合法性-VOCALOID2、初音ミク、ユーザ、UGMサイト、権利者 : 報告書" 35頁. デジタルコンテンツ協会 (3 2008). 2009年1月24日 閲覧。
- ^ "デジタルコンテンツの知的財産権に関する調査研究 : 進化するコンテンツビジネスモデルとその収益性・合法性-VOCALOID2、初音ミク、ユーザ、UGMサイト、権利者 : 報告書" 41頁. デジタルコンテンツ協会 (3 2008). 2009年1月16日 閲覧。
- ^ 「歌声合成技術とVOCALOID」、『ヒューマンインタフェース学会誌』Vol.10 No.2、ヒューマンインタフェース学会、97頁。
- ^ a b c 『DTM magazine』15(2) (通号 166) (増刊) 2008.1、寺島情報企画、39頁。
- ^ a b 井上理「技術フロンティア 肉声に近づいた音声合成(ヤマハ、クリプトン・フューチャー・メディア、アニモ)」、『日経ビジネス』(1424) [2008.1.14]、日経BP、78-80頁、ISSN 0029-0491。
- ^ 「歌声合成技術とVOCALOID」、『ヒューマンインタフェース学会誌』Vol.10 No.2、ヒューマンインタフェース学会、96-97頁。
- ^ 「歌声合成システムVOCALOID--現状と課題」、『情報処理学会研究報告』Vol.2008,No.12、情報処理学会、53頁。
- ^ “VOCALOIDがアップデート”. DTMマガジン(. 2006年2月24日) 2008年12月18日 閲覧。.
- ^ a b "ZERO-G ANNOUNCE FIRST 3 VOCALOID TITLES" (英語). ZERO-G. 2008年10月12日 閲覧。
- ^ "メディアファージ事業部". クリプトン・フューチャー・メディア(インターネット・アーカイブより). 2008年10月12日 閲覧。
- ^ Rubens, Paul (2004-02-19). “Life: Online: Inside IT: Virtual voices: Lola and Leon are the first cloned voices used to create software that mimics human singing. Paul Rubens looks at the commercial implications” (英語). The Guardian. p. 23.
- ^ "メディアファージ事業部". クリプトン・フューチャー・メディア(インターネット・アーカイブより). 2008年10月12日 閲覧。
- ^ "Old news archive" (英語). PowerFX. 2008年10月12日 閲覧。
- ^ “英語で歌う女性VOCALOID 2「SWEET ANN」国内発売”. DTMマガジン(. 2007年9月21日) 2008年10月12日 閲覧。.
- ^ 「特集 VOCALOID」、『DTM magazine』(通号 173) 2008.8、寺島情報企画、24。
- ^ 岡田有花 (2008年7月23日). “「初音ミク」発売からもうすぐ1年 開発者が語る、これまでとこれから”. ITmedia 2008年10月13日 閲覧。.
- ^ "Vocaloid PRIMA by Zero-G, a virtual vocalist plug-in powered by Yamaha VOCALOID2" (英語). ZERO-G. 2008年10月13日 閲覧。
- ^ "VOCALOID2『PRIMA』リリース!". クリプトン・フューチャー・メディア. 2008年10月13日 閲覧。
- ^ a b 岡田有花 (2009年4月20日). “VOCALOIDの可能性、DTMの“外”にも――ヤマハに聞く「NetVOCALOID」”. ITmedia News (ITmedia) 2009年4月26日 閲覧。.
- ^ 永井美智子 (2009年4月7日). “初音ミク、がくっぽいどがケータイで利用可能に--KDDI公式サイトで登場”. CNET 2009年4月26日 閲覧。.
- ^ 山崎健太郎 (2009年4月9日). “携帯で初音ミクを歌わせる「ミクと歌おう」が開始 -利用料発表/完成曲も配信。「がくっぽいど」も”. AV Watch (インプレス) 2009年4月26日 閲覧。.
- ^ “初音ミクの“神調教”が自動で!? 「ぼかりす」に話題騒然”. ITmedia News (ITmedia)(. 2008年5月1日) 2009年3月30日 閲覧。.
関連項目
- 音声合成
- デスクトップミュージック (DTM)
- キャラクター・ボーカル・シリーズ(CVシリーズ)
- ソフトウェア・シンセサイザー
- UTAU
外部リンク
- YAMAHA VOCALOID
- Y2 PROJECT
- ZERO-G(英語)
- クリプトン・フューチャー・メディア
- POWER FX(英語)
- インターネット
- H. Kenmochi & H. Oshita "VOCALOID – Commercial singing synthesizer based on sample concatenation", Interspeech 2007 (英語)PDF (213KB)
|
|||||||||||||||||

