文書分類

出典: フリー百科事典『ウィキペディア(Wikipedia)』

2016年12月5日 (月) 11:36; MomijiRoBot (会話 | 投稿記録) による版 (Bot: [​[Tf-idf|tf-idf]​] → [​[tf-idf]​] ,Replaced piped link to regular link ∵Check Wikipedia #64)(日時は個人設定で未設定ならUTC

(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)

文書分類(ぶんしょぶんるい、: Document classification/categorization)は、情報科学における問題である。電子文書をその内容に基づいて、1つ以上に分類する。文書分類には、外部から(例えば人間が)正しい分類に関する情報を与える教師あり文書分類と、外部の情報を参照せずに分類する教師なし文書分類がある。

技法[編集]

文書分類に使われる技法としては、以下のものがある。

他にも、自然言語処理に基づく手法がある。

応用[編集]

電子メールスパムを分離するスパムフィルタに応用されている。

関連項目[編集]

参考文献[編集]