トリプルストア
トリプルストア(triplestore)、別称 RDF ストアとは目的指向型のデータベースであり[1]、意味論型のクエリを介してトリプルの保存と取り出しを行う[2][3]。 トリプルというデータ項目は3要素つまり「主語–述語–目的語」で構成される。英文であれば「ボブの歳を年数で表すと35である」という意味に対して「Bob is 35」と述べる。または「Bob knows Fred」も一例となる。
問い合わせ言語を用いて情報を保存もしくは取り出すトリプルストアは、データベースの特徴が関係データベースと類似し、前者では後者と異なりトリプルを取り扱うように特化している。クエリに加え、 リソース記述フレームワーク(RDF=Resource Description Framework)その他のフォーマットを採用してトリプルを扱う。
実装
[編集]トリプルストアとしてまとめた中には、当初からデータベース・エンジンとして開発したものがあり、その他に既存の商用関係データベース・エンジン(SQL基盤など[4])、あるいはNoSQL エンジンなど文書型データベース(英語版)[5]を基盤に構築したものがある。たとえばトリプルストア開発の初期段階では、オンラインの分析型処理「OLAP」データベースの開発初期段階に似て、プログラミングの労力は大規模で強力なデータベース・エンジン構築にほとんど費やしていない[6]。
トリプルストアをSQL上に実装しようとすると「トリプル」の「格納」はできても、それ以外に固有の難しさがある。SQLクエリはSPARQLからマッピングするなど、グラフベースのRDFモデルへの効率的なクエリ実装が困難[7]。
関連するデータベースの種別
[編集]トリプルに名称(name)を加えると数字の「4」に由来する「クアッドストア」もしくは名前付きグラフ(named graph)ができる。
トリプルストアよりも汎用的な構造を備えるものを「グラフデータベース」(英語版 graph database)と呼び、データの表現と格納に用いるグラフ構造にはノード、エッジ、属性が含まれる。このデータベースではインデックス参照は不要で、要素ごとにそれぞれ隣接する要素への直接的なポインタが含まれていて、インデックス無用の隣接性を提供する。
汎用グラフデータベースはあらゆるグラフを格納でき、特殊なグラフデータベースであるトリプルストアやネットワーク型データベースなどとは異なる。
脚注
[編集]- ↑ Shigesada, Yukihiko; Kobayashi, Shinsuke; Koshizuka, Noboru; Sakamura, Ken (2010-07). “ucR Based Interoperable Spatial Information Model for Realizing Ubiquitous Spatial Infrastructure [ucRに基づきユビキタス空間インフラ実現に向けた相互運用可能な空間情報モデル]” (英語). 2010 IEEE 34th Annual Computer Software and Applications Conference. IEEE. pp. 303-310. doi:10.1109/compsac.2010.38. CRID 1364233270932321024
- ↑ Rusher, Jack. “TripleStore”. Workshop on Semantic Web Storage and Retrieval. 2025年10月20日閲覧。 – SKOS「SWADヨーロッパ」(2002年–2004年)の申請論文。
- ↑ Upadhyay, Rishabh; Fujii, Akihiro (2016-10-02). “Semantic Knowledge Extraction from Research Documents” (英語). Annals of Computer Science and Information Systems (IEEE) 8: 439-445. doi:10.15439/2016f221. ISSN 2300-5963. CRID 11872272492485603584.
- ↑ アメリカ合衆国特許出願「Storage and management of semi-structured data」出願者:Andrew, Peter。内容は「RDFトリプルストアとしてSQL関係型データベースを応用」。
- ↑ Cagle, Kurt. “Semantics + Search : MarkLogic 7 Gets RDF” (英語). 2015年8月8日時点のオリジナルよりアーカイブ。2015年8月2日閲覧。
- ↑ RUHLO, K. (2007). “An evaluation of triple-store technologies for large data stores” (英語). Proc. ISWC Workshop on Scalable Semantic Web Knowledge-base Systems, 2007. CRID 1571980075711542528.
- ↑ Broekstra, Jeen (2007年9月19日). “The importance of SPARQL can not be overestimated” (英語). 2014年1月19日時点のオリジナルよりアーカイブ。2014年4月25日閲覧。
関連項目
[編集]データのモデル化に同様の取り組みをするもの
- 意味論メディアウィキ – ウィキのうち「主語・述語・目的語」に対応する意味論を基盤とする(英語版)。高度なクエリに対応、多くの大規模組織による実装の例がある。
- 実体関連モデル – 実体–属性–値モデル
以下は50音順。
関連資料
[編集]Yamada, Issaku; Campbell, Matthew P; Edwards, Nathan; Castro, Leyla; Lisacek, Frederique; Mariethoz, Julien; Ono, Tamiko; Ranzinger, Rene et al. (2021-02-23). “The glycoconjugate ontology (GlycoCoO) for standardizing the annotation of glycoconjugate data and its application” (英語). Glycobiology 31: 741-750. doi:10.1093/glycob/cwab013. ISSN 1460-2423. CRID 1870302167852273024.
外部リンク
[編集]- SPARQL 1.1 アップデート - W3C 推奨(2013年3月21時点)
- SPARQL クエリ言語
- SPARQL 作業グループ - w3.org 旧称は RDF データアクセス作業グループ
- SPARQL プロトコル
- 大規模トリプルストアの一覧- esw.w3.org
- その他
- リーハイ大学ベンチマーク- リーハイ大学(LUBM)
- RDF データベース類とその他のNoSQL ソリューションの相違- DataGraph の公式サイト掲載のブログ