モジュラリティ

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

モジュラリティ: Modularity)は、コンピューターネットワークや、ソーシャルネットワークなどのネットワークやグラフの解析に用いられる効果関数。ネットワークから、モジュールやコミュニティへの分割の「質」を定量化するものである。

高いモジュリティを持つような高レベルな分割は、モジュール内部でのノード間の密なネットワークを持つ反面、異なるモジュール間で疎なネットワークを持つ。

ネットワーク内のコミュニティ構造を探し出すための最適化法の基礎としてよく用いられる。

目的[編集]

多くの重要な科学的課題がネットワークを用いて表現され、研究されている。 ネットワークとして扱うことができる現実世界の現象の一例として、生物学的・社会学的パターン、WWW、代謝ネットワーク、食物連鎖、神経ネットワーク、病理ネットワークなどが挙げられる。これらはネットワークを用いることで数学的に表現され、またトポロジカルな研究によって予期せぬ構造の性質が明らかになった[1]

これらのネットワークのほとんどは明確なコミュニティ構造を持つ。コミュニティ構造はネットワークのダイナミクス(ネットワークの生成過程・伝播など)を理解する上で重要である。例えば、密接に繋がった社会的集団では、ゆるく繋がった集団に比べて、情報やうわさ話が速く伝わるだろう。ネットワークが多くのノードとそれを結ぶリンクで表現されるとすると、コミュニティは「グループ内のノード同士は密接に結びついていて、またグループ外のノードとは疎な関係しか持たない」ようなノード集団として定義される。

コミュニティはノードの次数、クラスタ係数、媒介中心性などのネットワークの平均量とは異なる特性であり[2] 、ネットワーク上のコミュニティを識別することは不可欠である。そのようなコミュニティを判定する指標の一つがモジュラリティである。モジュラリティを最大化することによって、与えられたネットワークからコミュニティを見つけることができる。

定義[編集]

モジュラリティは、ネットワークの与えられた分割に対して、「グループ内のノード同士が繋がるリンクの割合」から「リンクがランダムに配置された場合の期待値」を引いた値として定義される[3]

ノードの数 N、リンクの数 M のネットワークを考え、ノードを\left\{ g_1, g_2, ..., g_C \right\}C 個のグループに分ける。ネットワークの隣接行列Aと表し、行列成分A_{rs}はノードr, s 間に存在するリンクの数とする。

モジュラリティはネットワークのリンクに方向や重みがある場合にも定義できるが、ここでは簡単のため方向・重みの無いネットワークを考える。つまりAの各成分はリンクの有無によって1か0の2値のみをとり、対称行列であるとする。隣接行列の成分の和は \sum_{rs} A_{rs} = 2M となる。

giに属するノードと gj に属するノードが繋がるリンク数の合計の、全リンク数に占める割合は、以下のように書ける。


e_{ij}= \sum_{r \in g_i} \sum_{s \in g_j} \frac{A_{rs}}{2M}

よって、同じグループ gi に属するノード同士が繋がるリンク数の全リンク数に占める割合は eii である。

次に、リンクがランダムに配置された場合における eii の期待値を考える。ランダムな配置は、次のように行う。まず、M 本の全リンクを切断することで、片側のみノードに接続した「手」を 2M 本作る。次に、ノードに残された「手」をランダムに2つずつ選択して繋ぎ直す。このように繋げ直すことによって、各ノードの「手」の数を保ったままランダムなネットワークを作ることができる。ここでノード r の「手」の数をノード r の次数 (: degree) と呼び、k_r = \sum_{s} A_{rs} と表す。全ノードの次数の合計は \sum_{r} k_r = \sum_{rs} A_{rs} = 2M である。

上記のような方法によるランダムな配置において、リンクの一方に gi 内のノードの「手」が選ばれる確率は、以下のように書ける。


a_{i} = \sum_{r \in g_i} \frac{k_{r}}{2M} 
= \sum_{r \in g_i} \sum_{s} \frac{A_{rs}}{2M} 
= \sum_{j}  \sum_{r \in g_i} \sum_{s \in g_j} \frac{A_{rs}}{2M} 
= \sum_{j} e_{ij}

これは、少なくとも一方が gi 内のノードに繋がるリンク数の、全リンク数に占める割合の期待値である。リンクの両端が gi 内のノードである場合の、すなわち eii の期待値は ai の2乗となる。

よって、モジュラリティは以下のように定義される。


Q = \sum_{i} \left( e_{ii} - a_{i}^{2} \right)


脚注[編集]

  1. ^ Newman, M. E. J. (2006). “Modularity and community structure in networks”. PROCEEDINGS- NATIONAL ACADEMY OF SCIENCES USA 103 (23): 8577?8696. doi:10.1073/pnas.0601602103. PMC 1482622. PMID 16723398. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=1482622. 
  2. ^ Newman, M. E. J. (2007). Palgrave Macmillan, Basingstoke. ed. “Mathematics of networks”. The New Palgrave Encyclopedia of Economics. 
  3. ^ Newman, M. E. J. (2006). “Fast algorithm for detecting community structure in networks”. Phys. Rev. E 70 (6): 066133. doi:10.1103/PhysRevE.69.066133. 

関連項目[編集]