spaCy

出典: フリー百科事典『ウィキペディア(Wikipedia)』
spaCy
作者 Matthew Honnibal
開発元 Explosion AI、他
初版 2015年2月 (9年前) (2015-02)[1]
最新版
3.7.4[2] ウィキデータを編集 / 15 2月 2024年 (エラー: 最初のパラメータを日付や時間として解析することができません。) (15 2月 2024)
リポジトリ ウィキデータを編集
プログラミング
言語
Python, Cython
対応OS Linux, Windows, macOS
プラットフォーム クロスプラットフォーム
種別 自然言語処理
ライセンス MIT
公式サイト spacy.io ウィキデータを編集
テンプレートを表示

spaCy ([spˈs] spay-SEE) は高度な自然言語処理を行うためプログラミング言語PythonCythonで書かれたオープンソースソフトウェア・ライブラリである[3][4]。このライブラリはMITライセンスの下で公開されており、現在、英語、ドイツ語、スペイン語、ポルトガル語、フランス語、イタリア語、オランダ語に対する種々の解析処理と多言語固有表現抽出のための統計的ニューラルネットワークモデル、また、その他様々な言語に対する字句解析モデルを提供している[5]

教育や研究に広く使用されているNLTKとは異なり、spaCyは製品用途のソフトウェアを提供することに重点を置いている[6][7]。バージョン1.0の時点で、spaCyはTensorFlowKerasscikit-learnPyTorch[8]等のよく知られた機械学習ライブラリによって訓練された統計モデルが使用できるディープラーニングのためのワークフロー[9]をサポートしている。spaCyの機械学習ライブラリであるThincが、個別のオープンソースPythonライブラリとして公開されている[10]。2017年11月7日にバージョン2.0がリリースされた[11]品詞タグ付け構文解析固有表現抽出のための畳み込みニューラルネットワークモデルや、およびモデルの訓練と更新、カスタム処理パイプラインの構築周りのAPIの改善を含んでいる。

主な特徴[編集]

拡張機能とビジュアライザ[編集]

Dependency parse tree visualization generated with the displaCy visualizer
displaCyビジュアライザで生成された依存解析木の可視化

spaCyには、無料のオープンソースライブラリとして利用できるいくつかの拡張機能とビジュアライザが付属している。

関連項目[編集]

参考文献[編集]

  1. ^ Introducing spaCy”. explosion.ai. 2016年12月18日閲覧。
  2. ^ Release 3.7.4” (15 2月 2024). 20 2月 2024閲覧。
  3. ^ Choi et al. (2015). It Depends: Dependency Parser Comparison Using A Web-based Evaluation Tool.
  4. ^ Google’s new artificial intelligence can’t understand these sentences. Can you?”. Washington Post. 2016年12月18日閲覧。
  5. ^ Models & Languages | spaCy Usage Documentation”. spacy.io. 2017年11月8日閲覧。
  6. ^ Facts & Figures - spaCy” (英語). spacy.io. 2017年11月8日閲覧。
  7. ^ Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). “Multidisciplinary instruction with the Natural Language Toolkit”. Proceedings of the Third Workshop on Issues in Teaching Computational Linguistics, ACL. https://www.aclweb.org/anthology/W/W08/W08-0208.pdf. 
  8. ^ Facts & Figures | spaCy Usage Documentation”. spacy.io. 2017年11月8日閲覧。
  9. ^ explosion/spaCy”. GitHub. 2016年12月18日閲覧。
  10. ^ explosion/thinc”. GitHub. 2016年12月30日閲覧。
  11. ^ spaCy: 💫 Industrial-strength Natural Language Processing (NLP) with Python and Cython, Explosion AI, (2017-11-08), https://github.com/explosion/spaCy 2017年11月8日閲覧。 
  12. ^ Models & Languages - spaCy” (英語). spacy.io. 2017年11月8日閲覧。
  13. ^ Models & Languages | spaCy Usage Documentation” (英語). spacy.io. 2017年11月8日閲覧。
  14. ^ Trask et al. (2015). sense2vec - A Fast and Accurate Method for Word Sense Disambiguation In Neural Word Embeddings

外部リンク[編集]