5.5.3 スケールフリー・ネットワーク
- スケールフリー(scale-free)
リンク先は「複雑ネットワーク」です。この中の「スケールフリー性」という項目に書かれていますが、「一部の頂点が他のたくさんの頂点と辺で繋がっており、大きな次数を持っている一方で、その他の大部分はわずかな頂点としか繋がっておらず、次数は小さいという性質」のことです。
- 次数(degree)
ある頂点がもつ辺の数のことです。
- べき則(power
law)
リンク先は「冪乗則(べきじょうそく)」です。べき乗則とも書かれます。「べき分布(power
law distribution)」もこのリンク先です。統計モデルの1つであり、f(x) =
axkのような形で表されることが多いです(aとkは定数)。xに相当する説明変数のスケールが変わる(単位がmmからcmに変わるとかそういうイメージ)と、aやkの値も変わるが、関数自体の形は変わらないのが特徴です。両対数プロットをとると直線性を示すという説明もよくなされます。
- ネットワーク(network)
もの(遺伝子)どうしの制御関係(つながり)をつなげた系(システム)のことです。
- 統計(statistic)
現象を調査することによって数量で把握すること、または、調査によって得られた数量データ(統計量)のことです。統計の性質を調べる学問は統計学です。
- Barabási
AL.(著), 池田裕一ほか(監訳) (2019) ネットワーク科学, 共立出版,
ISBN:9784320124479
- Albert-László
Barabási
リンク先は「バラバーシ・アルベルト・ラースロー」です。ハンガリーの理論物理学者です。インターネットから細胞内化学反応まで、複雑なネットワークに共通して見られるつながりの構造発見で有名なヒトです。
- べき分布(power
law distribution)
リンク先は「冪乗則(べきじょうそく)」です。べき乗則とも書かれます。統計モデルの1つであり、f(x)
=
axkのような形で表されることが多いです(aとkは定数)。xに相当する説明変数のスケールが変わる(単位がmmからcmに変わるとかそういうイメージ)と、aやkの値も変わるが、関数自体の形は変わらないのが特徴です。両対数プロットをとると直線性を示すという説明もよくなされます。このような数式に従う分布がべき分布です。
- 生命科学(life
science)
生命を研究対象とする学問のことです。
- log-logプロット(log-log
plot)
リンク先は「両対数グラフ」です。グラフの両方の軸が対数スケールになっているプロットのことです。極端に範囲の広いデータを扱えるという利点があります。
- Albert-László
Barabási
リンク先は「バラバーシ・アルベルト・ラースロー」です。ハンガリーの理論物理学者です。インターネットから細胞内化学反応まで、複雑なネットワークに共通して見られるつながりの構造発見で有名なヒトです。
- 優先的選択
ネットワーク上には様々な次数の頂点が存在しますが、そこに新しい頂点がつながる際に、「次数が少ない頂点」よりも「次数が多い頂点」のほうが優先的に選択されることです。
- ネットワーク(network)
もの(遺伝子)どうしの制御関係(つながり)をつなげた系(システム)のことです。
- インターネット(internet)
インターネット・プロトコル・スイートを使用し、複数のコンピュータネットワークを相互接続した、地球規模の情報通信網のことです。省略してネットともよばれます。インターネット・プロトコル・スイートとは、インターネットを含む多くのコンピュータネットワークにおいて、標準的に利用されている通信プロトコルのセットのことで、TCP/IPともよばれます。
- HTTP
リンク先は「Hypertext Transfer
Protocol」です。HTTPはこの略です。WebブラウザがWebサーバと通信する際に主として使用する通信プロトコルであり、インターネット・プロトコル・スイートのメンバです。HTMLなどのテキストによって記述されたWebページ等のコンテンツの送受信に用いられます。
- 次数(degree)
ある頂点がもつ辺の数のことです。
- トポロジー(topology)
リンク先は「位相幾何学」です。この場合は、全体的な関係性のことです。この場合は、次数分布が全く同じネットワークでも、頂点どうしの接続法が異なるネットワークが多数存在しうるという意味で用いています。
- クラスター(cluster)
リンク先は「クラスター
(疫学)」です。基本的にはこのリンク先の説明と似たようなイメージ(特に地理的な意味合いのみ)で捉えればよいです。図5.19(b)で示されているように、頂点から張られている辺の数に偏りがある、張られている辺がランダムではなく有意に特定の頂点に偏っている(そのおかげで、少ないステップ数である頂点から別の頂点にいくことができる)ことを「クラスターをなす」と表現しているのだと理解すればよいです。
- 中心性(centrality)
リンク先は「Centrality」です。中心と呼べる頂点を選び出す指標のことです。セントラリティともいいます。
- スケールフリー・ネットワーク(scale-free
network)
リンク先は「複雑ネットワーク」です。この中の「スケールフリー性」という項目に書かれていますが、スケールフリーとは、「一部の頂点が他のたくさんの頂点と辺で繋がっており、大きな次数を持っている一方で、その他の大部分はわずかな頂点としか繋がっておらず、次数は小さいという性質」のことです。そのような性質をもったネットワークが、スケールフリー・ネットワークです。
- べき分布(power
law distribution)
リンク先は「冪乗則(べきじょうそく)」です。べき乗則とも書かれます。統計モデルの1つであり、f(x)
=
axkのような形で表されることが多いです(aとkは定数)。xに相当する説明変数のスケールが変わる(単位がmmからcmに変わるとかそういうイメージ)と、aやkの値も変わるが、関数自体の形は変わらないのが特徴です。両対数プロットをとると直線性を示すという説明もよくなされます。このような数式に従う分布がべき分布です。
- 乗算過程
掛け算的な過程のことです。
- 漸近的
「近似的に成り立つ」という理解でよいです。
- 正規分布(normal
distribution)
確率論や統計学で用いられる連続的な変数に関する確率分布の1つです。データが平均値の付近に集積するような分布を表します。ガウス分布(Gaussian
distribution)ともよばれます。中心極限定理(central
limit
theorem)により、独立な多数の因子の和として表される確率変数は正規分布に従います。
- 中心極限定理(central
limit theorem)
標本平均と母平均との誤差を論ずるもので、「多くの場合、母集団の分布がどんな分布であっても、その誤差は標本の大きさを大きくしたとき近似的に正規分布に従う」という定理です。
- 対数正規分布(log-normal
distribution)
連続確率分布の一種です。この分布に従う確率変数の対数をとったとき、対応する分布が正規分布に従うものとして定義されます。そのため中心極限定理の乗法的な類似が成り立ち、独立同分布に従う確率変数の積は漸近的に対数正規分布に従います。
- 図5.23
中央値がネイピア数eになる対数正規分布です。中央値がネイピア数eになる対数正規分布にすべく、dlnorm
関数のオプションとしてmeanlog=1
を与えています。これが中央値がe\(^1\)になる対数正規分布を作成せよという指令に相当します。対数正規分布は2つのパラメータ(定数μと定数σ)をもちますが、これらは正規分布とは異なり平均と標準偏差には対応しないのでご注意ください(ウィキペディアのリンク先にも書かれています)。なお、この定数μに相当するdlnorm
関数のオプションがmeanlog
になります。
以下のRスクリプトのコピペで作成できます。
curve(dlnorm(x, meanlog=1, sdlog=0.3), xlim=c(0, 10), col="black")
curve(dlnorm(x, meanlog=1, sdlog=0.7), xlim=c(0, 10), col="red", add=T)
curve(dlnorm(x, meanlog=1, sdlog=1.0), xlim=c(0, 10), col="blue", add=T)
curve(dlnorm(x, meanlog=1, sdlog=2.0), xlim=c(0, 10), col="green", add=T)
page169
- 図5.23
中央値がネイピア数eになる対数正規分布(確率密度関数)の例です。
- 表5.2
各種ネットワークモデルの比較です。
次数の分布とハブの存在 |
次数が一定で、ハブは存在しない |
次数がほぼ一定で、ハブは存在しない |
ポアソン分布をとり、ハブはきわめて少ない |
べき分布をとり、ハブは比較的多い |
頂点間距離の平均値 |
長い |
短い |
短い |
ハブが多く、とても短い |
クラスター(三角形の密度) |
一様に密 |
大部分が密 |
一様に疎 |
一様に疎 |
- 格子(lattice)
リンク先は「格子
(数学)」です。「周期的に並んだ区切り、または仕切りのこと」だという理解でよいです。図5.20(a)に例示されているように、そのような周期的に並んだ区切りのところに頂点を配置して、頂点間を辺で結んだネットワークが格子ネットワークです。
- スモールワールド(small
world)
リンク先は「複雑ネットワーク」です。この中の「スモールワールド性」という項目に書かれていますが、「任意の2つの頂点が、中間にわずかな数の頂点を介するだけで接続されるという性質」のことです。現実世界のネットワークが持つ性質の1つです。
- 乗算過程
掛け算的な過程のことです。
- べき分布(power
law distribution)
リンク先は「冪乗則(べきじょうそく)」です。べき乗則とも書かれます。統計モデルの1つであり、f(x)
=
axkのような形で表されることが多いです(aとkは定数)。xに相当する説明変数のスケールが変わる(単位がmmからcmに変わるとかそういうイメージ)と、aやkの値も変わるが、関数自体の形は変わらないのが特徴です。両対数プロットをとると直線性を示すという説明もよくなされます。このような数式に従う分布がべき分布です。
- スケールフリー(scale-free)
リンク先は「複雑ネットワーク」です。この中の「スケールフリー性」という項目に書かれていますが、「一部の頂点が他のたくさんの頂点と辺で繋がっており、大きな次数を持っている一方で、その他の大部分はわずかな頂点としか繋がっておらず、次数は小さいという性質」のことです。
- 例題5.5
1ページ目が問題、2ページ目以降が解答例です。PDFファイル中のRコマンドのコピペ実行は不具合が生じやすいため、実際にコピペする際は以下のスクリプトをご利用ください。両方とも基本的に中身は同じで、igraphパッケージのインストールから含めています。
- 例題5.6
1ページ目が問題、2ページ目以降が解答例です。PDFファイル中のRコマンドのコピペ実行は不具合が生じやすいため、実際にコピペする際は以下のどちらかをご利用ください。dlnorm
関数を用いてmeanlog
とsdlog
という2つのオプションで確率密度関数を定義しています。たとえば黒色の分布ではmeanlog=1
とsdlog=0.3
を与えていますが、これは対数化前の平均がe1、標準偏差(standard
deviation)がe0.3というパラメータを与えていることに相当します。なお、xlim
オプションは、x軸の範囲を指定するものです。lty
オプションは線の種類を指定するものであり、lty=1
は実線、lty=2
は破線に相当します。
page170