社会网络分析是社会学研究中发展较为成熟的方向,有相当长的历史。早在十九世纪三十年代,就出现很多有代表性的社会网络研究范例,只是那个时代的社会学家往往热衷于讨论一些政治意味浓厚,相对沉重的话题,比如劳工命运,妇女权益等等。早期的社会网络研究还特别关注人们之间的友谊关系,Rapoport对学校学生间友谊关系网络的研究即使从今天的眼光来看,也是一件杰作。这些前期的研究有一些共同的弱点:首先是网络的规模大多数比较小;其次是网络的建构带有很多主观的因素,比如什么叫朋友,这个定义就很主观;再有就是网络的数据往往不完整,比如Milgram著名的“六度分离”实验中,大部分信件都在传递过程中丢失了,这就使得其结论的可信度大打折扣。归功于海量数据库的出现和计算机处理能力的提高,近年来对于社会网络的研究开始向大规模化、精确化和定量化发展,下面我们简要介绍五类不同的社会网络。
第一种可以称之为社会合作网络,其节点是参与合作的人,如果几个人之间有某种合作关系,就互相连边。比如说演员们在同一部电影中出现过,可以看作一次合作;又比如科学家在同一篇论文上共同署名,可以看作一次合作,等等。社会合作网络是最早得到关注的一类网络,实际上,很多复杂网络新性质的发现都应归功于对好莱坞电影演员合作网和科学家合作网络的研究。需要特别指出的是,关于合作网络的研究虽然源于社会网络,但并不仅限于社会网络,Myers和何大韧给出了非社会合作网络很多有趣的例子。
第二种是朋友网络,最近的一些研究主要集中于在线交友网站中的好友关系。如美国的Facebook,韩国的Cyworld,日本的Mixi,匈牙利的WIW,中国的校内网(现改名人人网),Google旗下的Orkut等等,都受到了广泛的关注。有趣的是,尽管每个人都能够感觉到虚拟世界的好友关系与现实生活中的朋友关系很不一样,但在线朋友关系网络却展现了很多与现实朋友关系网络一致的特点。举个例子,通过对Facebook上420万用户的好友列表信息进行分析,Golder等人发现用户的好友平均数为180,中值为144,这与Dunbar提出的著名的“150法则”,即一个人最多能维持150个好友关系,不谋而合。Ahn等人对Cyworld的研究再次印证了这个法则。又如Zakharov发现LiveJournal网络从结构上直接继承了现实社会网络的特征,特别有趣的是,Liben-Nowell等人发现即便是LiveJournal这类虚拟在线网络也明显存在几何效应,依然是IP地址地理距离相近的用户容易产生关系。
第三种是信息网络,即基于信息传递、共享和交换形成的网络,但又不同于后面要介绍的通讯网络。信息网络的一种典型形式,是由信息传播路径形成的信息发送者和接收者之间的关系网络。以微博为例,用户从关注对象那里获得信息,自己发布的信息又会自动传送给粉丝。如果用从用户指向粉丝的边表示信息流向,就可以构成一个有向的信息网络。类似的信息传递关系还包括博文订阅,接受来自其他用户的新闻、图书、音乐、电影等推荐,复制或分享其他用户的收藏,等等。通过对来自Delicious, Flickr, Twitter和Youtube的海量数据进行分析,我们发现,在这四个有代表性的信息网络中,用户的领导能力(用粉丝数量表征)都服从幂律分布――少数人拥有惊人的影响力,大多数人应者寥寥。在一篇名为《谁对谁说了什么》的有趣文章中,作者通过对用户身份的分类,剖析了Twitter中连接形成的模式和机制。事实上,如果把BBS和论坛中的评论者和转发者看成对楼主帖子的信息接收者,也可以建立相应的信息网络。当然,也可以把同一个帖子下的所有评论者看对针对某一个话题进行了一次合作,从而用合作网络的分析方式进行分析。信息网络的结构和功能之间存在极强的耦合演化关系:结构的变化会影响信息传播的动力学性质,与此同时,用户会因为对某些信息内容的兴趣,而建立一些新的连接,造成结构的改变。
第四种是通讯网络。随着通讯技术的发展,各种各样的通讯工具伴生出各种各样的社会通讯网络。谢智刚小组研究了包含固定电话和手机的通讯网络,发现通讯对象数目的分布符合幂函数律。Onnela等人研究了包含460万节点的大规模手机通讯网络,发现决定该网络连通能力的关键是较弱的连接,该发现从一个全新的角度印证了“弱连接理论”的正确性。Ebel等人研究了包含近6万节点的电子邮件网络,发现该网络是典型的小世界和无标度网络;Eckmann等人则提出了用熵来刻画网络中包含长期通讯模式和临时通讯模式,前者对应一个规则固定的事物,后者对应于临时因会议或者其他活动形成的电子邮件联系。Smith研究了nioki即时通信系统构成的社会网络,其中节点是注册用户,每位用户与自己的联系人相连接,连接是有方向的。Wang等人研究了基于P2P通信的社会网络,其中如果用户B曾回答过用户A的提问,则从A到B建立一条有向边,该边的权重定义为回答的次数,整个网络是有向含权的。
最后一种是社会接触网络,即指由真实物理接触形成的人与人之间的网络。分析这类网络,对于理解流行病的传播有重要帮助。社会接触网络由于主要是通过调查问卷和口头采收集信息,数据量都比较小,大部分研究主要集中在相对封闭的系统,例如学校、社区、公司董事会等等。比较深入的研究主要集中在性关系网络方面,包括网络自身结构的特点以及其对各种性传播疾病的影响。例如Liljeros等人分析了瑞典的性关系网络,Latora等人分析了布基纳法索的性关系网络。遗憾的是,获得真实准确的性伙伴和性行为数据非常困难,因此实证分析总是停留在较小规模的网络中,而除了知道这类网络节点度分布具有异质性(大部分节点性伙伴很少,少量节点具有大量性伙伴)外,可以获取的可信又有价值的信息很少。很多学者开始探索利用先进的数据分析方法或从其他角度探索性关系网络。Fichtenberg等人尝试从抽样得到的网络中推断性关系网络的全局性质,遗憾的是,数据非常稀疏,以至于通过访谈对象得到的网络只能给出极少量的局部信息。Frost另辟蹊径,研究了性活跃人群和捕获性伴侣的场所之间的关系,希望籍此了解性关系网络的性质。事实上,互联网的发展也能帮助理解性关系网络,最近Rocha等人分析了巴西6624名网络色情服务提供者和10106名消费者的记录,建立了网上色情交易活动的二部分网络。我们有理由相信这些服务人员和消费者之间存在线下的物理接触,因此这种基于互联网记录的虚拟网络和真实的性关系网络有很大的重合部分。需要小心的是,色情业从业人员及消费者的性关系网络,特别是懂得利用互联网媒介的这一部分人员之间的关系,不一定能够作为一个合适的样本反映整个社会性关系网络的统计特性。通过监测佩戴RFID,传感器或其他可以精确定位相互作用的小型设备的志愿者的活动,可以真正探测由物理接触形成的社会网络,但是这往往只能针对特定环境下少量人群,并且这些人群由于知道自己处于被监测的情形下,行为可能和常态有所不同。
11级博士 王英供稿赵月华编辑
转自:http://bbs.sciencenet.cn/home.php?mod=space&uid=3075&do=blog&id=531837