Duncan J. Watts & Steven H. Strogatz (1998), “Collective dynamics of ‘small-world’ networks”, Nature volume 393, pages 440–442 논문을 통해 배우들의 영화출연 관계, 전력선 연결, 예쁜 꼬마 선충의 뉴론 연결구조 등을 통해 다양한 분야에서 공통적으로 관찰되는 특징을 모아 네트워크 과학의 시작을 알리게 되었다.
네트워크 데이터의 분석의 시작점은 아마도 네트워크에서 중요한 역할을 하는 노드(node)/결점(vertex)을 식별하는 것이다. 네트워크 중심성(Centrality)은 결점(vertext)에서 연결선(edge)를 통해 주고받은 횟수, 중심성이 높은 네트워크는 일부 결점이 극단적으로 많은 연결을 갖는 반면 낮은 중심성은 다수 결점이 유사한 수의 연결선을 갖는 것을 나타냄.
igraph::degree(g)
함수에 indegree
, outdegree
, 전체 degree로 mode="in"
, mode="out"
, mode="total"
인자를 전달하여 계산한다.strength(g)
함수를 사용한다.Closeness
가 높다는 것은 네트워크 중심성이 낮다는 반증이 됨.
closeness(g, normalized=TRUE)
함수 사용.betweenness()
함수 사용.eigen_centrality(g)$vector
함수 사용.page_rank(g)$vector
함수 사용.authority_score(g)$vector
함수 사용.네트워크 전체를 기술하는 기술통계량도 중요한 역할을 수행한다. 이를 위해서 diameter()
, get_diameter()
, mean_distance()
, distances()
함수를 통해서 전체 네트워크에 대한 특성을 확정지을 수 있다.
diameter()
: 가장 긴 두 노드/결점 길이를 측정함.
diameter(g, directed=FALSE, weights=NA)
get_diameter()
: diameter()
로 특정한 가장 긴 두 노드/결점 경로를 파악.
get_diameter(g, directed=FALSE, weights=NA)
mean_distance()
: 전체 네트워크의 두 노드/결점간의 평균 길이.
mean_distance(g, directed=FALSE)
distances()
: 각 노드/결점을 짝지어 거리를 나타냄.
distances(g, weights=NA)
edge_density()
: 네트워크에 존재할 수 있는 모든 가능한 연결선 대비 실제 존재하는 네트워크 연결선에 대한 비율
edge_density(g)
reciprocity()
: i
노드/결점이 j
노드/결점에 연결되었다면 상호간에 대등하게 j
노드/결점이 i
노드/결점에 연결되어야 하는 정도.transitivity()
: 군집계수(clustering coefficient)로 알려져 있고, i
노드/결점이 j
노드/결점에 연결되었고, j
노드/결점이 k
노드/결점에 연결되었다면, i
노드/결점이 k
노드/결점에 연결될 확률이 얼마인지 측정함.
해당 네트워크에서 노드의 중요성을 측정하는 degree
, betweenness
, closeness
, eigenvector
등 지표를 활용한다. 이은조 (엔씨소프트), “네트워크 분석 기법을 활용한 게임 데이터 분석” 4번째 슬라이드에 나온 네트워크를 대상으로 각 노드별 중요도 측정 지표를 구해본다.
degree
중심성(Centrality)between
중심성(Centrality)closeness
중심성(Centrality)[1] 7
+ 8/19 vertices, named, from 12ad606:
[1] a f h i j m q s
[1] 0.4285714
[1] -0.2394366
Duncan J. Watts & Steven H. Strogatz (1998), “Collective dynamics of ‘small-world’ networks”, Nature volume 393, pages 440–442↩
Shirin Glander(2017), Network analysis of Game of Thrones, data science+↩
Social network analysis with R: node and network properties↩
https://www.datacamp.com/community/tutorials/centrality-network-analysis-R↩
Pablo Barbera(June 27, 2017), “Social network analysis with R: Descriptive analysis”↩