楽譜OCR

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

楽譜OCRは、OCRのアプリケーションで、楽譜または印刷されたスコアを編集可能なものに、かつ、しばしば、演奏可能な形式にするものである。一度デジタル的にキャプチャされると、音楽はよく使われるファイル形式、例えば、MIDI (再生用)とMusicXML(ページレイアウト用)に保存することが出来る。

歴史[編集]

初期の、楽譜の認識の研究は、1960年代後半の、MITと他の研究機関において、大学院レベルで行われた。 (Pruslin, Dennis Howard (1966) (PDF). Automatic Recognition of Sheet Music. http://links.jstor.org/sici?sici=0031-6016(197223%2F24)11%3A1%3C250%3AOCOPMA%3E2.0.CO%3B2-2 2007年1月24日閲覧。. ) ローカライズと記号から外した五線譜の削除は認識でき、解釈する事がうまくいった。最初の商用楽譜スキャニング製品であるMIDISCANはMusitek社によって1991年にリリースされた。

順番に単語を解釈する、テキストに対するOCRと違い、楽譜表記は、すぐそばに配置された独立して演奏する記号が進行していく、複数の声部が存在するという、並列な要素がある。そのため、音符間の空間関係、発想記号、強弱、調号などの他の記述は音楽を表現するのに重要な部分である。

最近の楽譜OCRパッケージは、きれいなスキャニングが使われて、音符が例外的でない(すなわち、埋まっていない声部、非標準の表現形式など)が使われた時、99%以上の認識が期待できる。楽譜記号はドットをスタッカートとして使うか、音符の長さを拡張するために使われるため、スキャンの結果の解釈に困る場合がある。

商用ソフトウェア[編集]

Free/Open Source ソフトウェア[編集]

参照[編集]