网络舆情的结构与网络特征分析
曹效阳,曹树金,陈桂鸿
(中山大学资讯管理系,广东广州,510275)
摘要:通过对互联网的物理结构与互联网网站结构的分析得出舆情网络的逻辑结构,另外,通过对前人研究成果的整理分析,以及对网络舆情的网络特征的分析,得出网络舆情的结构化模型,为准确表达网络舆情,寻求更有效的网络舆情监测方法与思想奠定基础。关键词:舆情网络;特征模型;舆情监测中图分类号:TP393
文献标识码:A
文章编号:1007-7634(2010)02-0231-04
ResearchontheCharacteristicStructureand
ModelofNetworkOpinionCAOXiao-yang,CAOShu-jin,CHENGui-hong
(DepartmentofInformationManagement,SUNSAT-SENUniversity,Guangzhou510275,China)Abstract:ThroughtheanalysisoflogicalandphysicalstructureofChinainternetthearticledeductsthelogicalstructureofopinionnetworkinChina.Furthermore,BaseonthestudyofthenetworkcharacterandstructurethearticlealsodeductscharacteristicmodeloftheopinionnetworkinChinaandachievesafoundationofnetworkopinionsurveillance.
Keywords:opinionnetwork;characteristicmodel;networkopinionsurveillance.
球第一,真正成为了继报纸、广播、电视之后的“第四
1引言
媒体”,在如此庞大的参与群体,如此发达的传播网络下,网络舆论的影响是巨大的,其中大部分是正面的影响,也有负面的影响,从表1的数据可推断事件的影响大小。
表1网络舆情事件的影响
事件北京奥运汶川抗震华南虎事件崔真实自杀
从Google搜索到的标题数
影响性质正面影响正面影响负面影响负面影响
随着计算机的不断普及,以及互联网络的不断发展,我国的网民数量逐年猛增,据CNNIC第20次中国互联网调查,截至2008年6月,中国网民总人数达到2.53亿,仅次于美国,位居世界第二【1】,其中,拥有大专及以上学历的网民占4成多,达到
7121万人;在这一群体中,较高的学历成分使网民
对社会政治关切度高,参与网络舆论的热情高【2】。中国互联网舆论平台也十分发达,如各大门户网站的新闻频道,网络社区(BBS)、聊天室(ChatRoom)、即时通讯(腾讯QQ和微软MSN等)、聚合新闻(RSS)、维基(WIKI)。中国拥有130万个BBS论坛,规模为全
收稿日期:2009-04-24
43,600,00012,400,0001,270,000693,000
从数据可知,各事件的规模数量级有明显的差
作者简介:曹效阳(1963-),男,广东南海人,在职博士研究生,讲师,主要从事网络信息管理教学与科研研究.232情报科学28卷
别,影响的大小也差异很大,但值得注意的是:在排列末位的“崔真实自杀事件”中,由于网络舆论(有关崔放高利贷的传言)的传播,负面舆情所产生的心理压力直接导致了崔真实的死亡;可见,如果不对网络舆情的加以监控与引导,一旦被错误利用,就可能产生严重的负面影响,以致危害公共安全,甚至是危害国家安全;互联网是完全开放的虚拟的公共空间,每个网民可成为网络信息的发布者,每个网民都有选择网络信息的自由,网络舆情是网络与一般社会舆情结合的产物,网络舆情除具有社会舆情的一般特征外,还具有其它的特点:如网民在网上发布信息是匿名的,网民会直接表达自己的观点,反映真实的情绪;网络舆论的形成往往非常迅速;网络舆情的主题是宽泛的、自发的、随意的;网民普遍表现出强烈的参与意识,网络舆情经常是互动的;网民由于各种因素影响,网络舆论可能是感性的,情绪化的甚至是非理性的【3】。
关于网络舆情监测,“近年来,一些学者和研究机构已经进行了一些重要的研究,取得一定进展。同时也存在一些不足”,“试图自动发现并追踪社会热点和焦点内容及舆情,但分析模式仅仅停留在热点和焦点方面,难以深化。这些不足的长期存在和困扰使得很多怀着对科学方法崇拜和信任的委托开发者,最后对大批貌似科学而难付实用的产品、成果感到茫然和失望【4】。”由此可见,网络舆情是一个复杂的事物,网络舆情监控与引导更加是一个复杂的系统工程。但归根结底,网络舆情的复杂性与舆情监测的难度是由其网络特征与具有极大的网络效应所造成的,因此,笔者认为必须从网络舆情的体系结构入手,归纳出网络舆情结构化定义,研究网络舆情(这里指具体的网络事件)从酝酿,爆发,持续到消亡的整个过程的发展模式,研究网络舆情的网络效应,发现其内在联系与规律,才能对网络舆情做出透彻的了解,进而找出对其实施监控与引导的有效方法。
其内在规律;因此必须在一个更深的层次对这一复杂概念做出系统的研究。
3网络舆情的层次结构
网络舆情是舆情与网络结合的产物,网络舆情的复杂性源于舆情的网络效应与网络特征,因此,对网络舆情的研究要从它的层次结构开始,网络舆情的层次结构如图1所示。
图1网络舆情的层次结构
任何网络舆情都具有该种层次结构,舆情经过制造通过传播网络向舆情受众传播,或舆情以某种形态栖宿网络平台,舆情受众通过访问网络平台获取舆情,舆情的制造者也可能同时是舆情受众,传播网络与平台可以是互联网的某个站点,也可以是广义上具备同等功能的非互联网产物,但后者的网络效应较低,并非本文的主要研究对象。
4网络舆情的物理结构
如果只考虑网络舆情相关的计算机硬件或网络硬件之间的关联,根据层次结构,得到如图2的物理结构。
图2网络舆情的物理结构
网元可以是代表舆情的制造者,传播平台与舆
2关于网络舆情的概念
关于网络舆情的概念,归纳学者在近年来的研究成果,一种称为狭义定义:“民众主体通过互联网对中介性社会事项的社会政治态度”;另一种称为广义定义:“民众主体通过互联网对社会客观情况与民众主观意愿”【5】;但笔者认为对网络舆情进行概括性的哲学定义是不够的,因为,无论是狭义定义还是广义定义,都无法从定义清楚表达网络舆情内涵与情受众的计算机或电子终端,而网元的数量大于上网人数(网民)与网站数的总和,总数超过2.53亿(根据截止至2008年的数据),每个网元都可以通过互联网与另一个网元建立信息交换链路(舆情传播),图2只画出了6个网元的拓扑图,那2.53亿个网元的拓扑图将是何等庞大,因此,舆情具有网络效应后,其产生与传播就如原子弹的链式反应一样,顷刻间席卷网络,这也是引起网络舆情复杂性的根源所在。
2期网络舆情的结构与网络特征分析233
落,这种区域性特征除受网络带宽的区域性所造成
5网络舆情的逻辑结构
舆情网络的物理结构虽然如此庞大,但其实际的网络活动是受到很多制约的,其逻辑结构与物理结构有着不同的网络形态,究其原因,首先,网元中大部分是舆情受众网元,传播平台只占相对少数,这两种网元的网络带宽与网络协议类型都有极大的差异,舆情受众网元之间并不具备高效与快速通信链路,另外,舆情受众网元数量比舆情制造者网元的数量大得多,而受众网元的活性要低的多,因此,网络舆情的逻辑结构(可称之为舆情网络)与其物理结构也有较大差异,如下图所示。
外,还可以由行业聚集,兴趣爱好,由工作、学习单位边界造成,甚至是由某种网络使用习惯造成,由于这种多样化的成因,使得网民(网络舆情的制造者与受众)可以归属于多个区域性群落,舆情在群落内的传播是非常快的,在群落间传播是较慢的,群落间传播方式有两种,首先是通过归属不同群落的制造者进行传播,另外是通过归属不同群落的制造者之间的传播,后一种传播方式通常是私密的和低效的,例如电子邮件,即时通信(腾讯QQ),手机短信,电话,面对面交谈等,因此,群落中的舆情传播是高效的、快速的和公开的,群落间的舆情传播是低效的、慢速的和私密的。
5.3舆情网络的规模特征
图3所示的舆情网络规模是巨大的,这里的规模有两种含义,一是群落数量的大小,即舆情网络的规模,二是群落的大小,即单个舆情群落的规模;根据CNNIC在2008年的统计,网站总数为150万
图3网络舆情的逻辑结构
个,其中个人网站10万个,BBS数量130万个,个人博客1.07亿个,从数据显示:个人博客的数量与上网人数相当,他们可成为舆情的制造者,但他们不能够成为舆情群落的中心,事实上博客也从属于某个网络平台,舆情网络的总规模可以BBS数量作为估算,约为130万个,假定某个舆情事件在舆情群落中的分布服从布氏定律,有如下公式:
公式1A+A2+A3+....An=1300000
设n=10(分10个等级区间),得出:An+1-A=1300000公式2A-1
所以:A≈㏒1300000≈5.15
根据参数,得出序列:5,27,137,703,3623,18657,18657,96084,494832,254835,1300000;
这个序列有两方面的意义,首先,这个序列也是网络舆情规模增长序列,可见最快的舆情规模增长是指数增长,可以在短时间内覆盖整个网络,但也并非所有主题的舆情增长规模都是如此,完成的时间也有差异(对此,笔者将另撰文详细探讨),从序列的前5个等级的群落数量5000个看,其规模的增长在初始阶段是可控的;另外,从舆情网络的信息分布看,网络舆情较为集中在为数较少的舆情群落中,如序列的前5个等级的5000个,而且每个群落的生存,也与群落的规模(拥有的用户数量)密切相关,在网络效应的影响下,处于后5个区的群落规模将逐在图3中,A~I代表网络舆情的制造者和网络舆情的受众,舆情网络是网络舆情的受众与制造者以网络舆情平台为中心组成的区域性、虚拟的网络群落集合(舆情群落的数量也是巨大的,图中只画出了3个舆情群落)。网络舆情的受众与制造者可以是多个网络群落的成员,现从几个方面论述其特征:
5.1舆情网络的传输带宽特征
网元的网络带宽对舆情的产生与传播影响很大,也决定网元在舆情网络中的地位,图3的“字母网元”的带宽是比较窄的,而且上下行不对称,上行带宽就更窄,例如:ADSL上网的带宽是1.5Mbps-
3Mbps(下行带宽),上行带宽只有512kbps;网络舆情平台的网络带宽通常在100Mbps(共享或独享)
以上,而且上下行带宽对称,虽然网络是虚拟的,应该与地理位置无关,但事实上,网络带宽是与地理区域密切相关,通常本地区域带宽比区域间带宽要大得多,区域之间通常还存在带宽瓶颈(如图3上部所示),这种带宽瓶颈甚至可以人为造成,例如,中山大学校园网内带宽比校园网与教育网间的带宽要大得多,因此,网络带宽的分布有着明显的区域性特征。
5.2舆情网络的传播特征
舆情网络是以舆情网络平台为中心的区域性群234情报科学28卷
渐减少,直至消亡,因此,能长期形成网络舆情的群落数量是较少的。
的复杂程度,也体现了目前网络舆情的产生方式,也使网络舆情与传统舆情产生了本质区别,具体描述如下:
非交互式,点对多点方式:舆情的制造者以点对多点的方式向浏览者传播舆情,如新闻网站,博客等;特点是:浏览者只能浏览信息,不能制造信息。
交互式,点对点;舆情的制造者以点对点的方式向浏览者传播舆情;如QQ,聊天室,SMS,电话,E-
6描述与评价网络舆情的指标体系
对网络舆情的特点,近年来,许多学者作了很多的研究,现将其归纳如表2。
表2网络舆情的特点(已有研究)【6】
特点
意义
人们传播新闻和发表言论的自由,网络的传播自由
自由性与可控性
也是有限的网民与政府、与网络媒体的互动以及网民间的互动,传播和表达具有了较高的时效性。
所涉及的社会问题和事件包罗万象,表达和传播途
丰富性与多元性
径的多样化。
网络用户具有不同程度的隐匿性,发表的言论,能够
隐匿性与外显性
较为清楚地推断出他的情绪和态度
非理性舆情在网络上的产生和弥散主要是社会现实
情绪化与非理性
和公众心理相互作用的结果
个性化与群体表达总是倾注了个人的情感,团体的沟通,使形式上极化性变得极端
互动性和即时性
mail,等方式,特点是:个人的,私密的信息交换方
式,由于局限于小范围,不利于舆情的传播。
交互式,点对多点:舆情的制造者以点对多点的方式向浏览者传播舆情;如带评论的新闻浏览,维基,或百度知道等,特点是浏览者有一定的舆情制造能力,并且有利于舆情的传播。
交互式,多点对多点:舆情的制造者以多点对多点的方式向浏览者传播舆情;如BBS,论坛等,特点是:舆情的制造者也是舆情的浏览者和传播者,舆情信息制造能力与传播能力都极强。
网络舆情的产生方式决定了网络舆情信息之间的关联性,而舆情信息在时间维度的集合构成了舆情事件(也可统称为网络舆情),舆情信息的关联产生了更多的网络舆情特征,网络舆情事件的表达式如下:
网络舆情事件=ΣEn+Σ网络舆情信息
n
n
突发性网络舆论的形成往往非常迅速
从前人的研究得出,对网络舆情特征的研究大部分集中在舆情主题,而且这些特征都是非结构化的,用这些特征很难量化网络舆情事件,更谈不上准确描述网络舆情事件,使得网络舆情监测难度增大,因此,笔者在此提出一个网络舆情的特征模型,力求能准确的描述网络舆情。网络舆情信息的表达式如下:
网络舆情信息=ΣCn+Text
i=1n
公式4
公式3
i=1i=1
表达式分成两部分,其中E表示关联特征,第一部分是关联特征描述集,这种关联通常是指在时间上后期的舆情信息与首发的舆情信息之间的关联,第二部分是网络舆情信息在时间维度上的集合。另外,关联特征带有明显的倾向性,如为了舆情监测,关联的特征将是回帖数,主题关联等。
网络舆情信息由两部分组成,特征描述与舆情内容,其中C表示特征,n是特征的数量,Text是舆情内容,特征模型如表3所示。
表3网络舆情的特征模型
特征分类分类分类缩写
特征名称浏览量时间
特征说明
舆情事件被访问的次数,或浏览量排行位
数
舆情事件产生的时间
C11
基本特征
7结语
C12C13C14C21
浏览量变化浏览量的增长率
对舆情网络以及其特征的研究是为了量化网络舆情,只有准确的表达网络舆情事件,才能对此实施有效的监测与控制,另外,网络舆情的网络特征的研究也将对网络舆情监测的总体构思,技术路线产生影响,如舆情的网络特征说明网络舆情的监控在宏观上是一个多点监控系统工程,再者,单点(如某个
文件类型
一般网络舆情存在形式是文本文件,也可能是图片,声音,视频,等多媒体文件舆情制造者IP
IP
网络特征
C22C23C31
IP覆盖率舆情的传播区域范围指标
网络舆情与浏览者和制造者之间的交流
产生方式方式,有点对多点(如BBS),点对点形式
(如腾讯QQ等)主题类别网络舆情内容的主题所在的文献分类舆情群落对相关网络舆情主题的参与程
主题普及率
度。主题数量单主题的或是多主题的网络舆情
主题特征
BBS站点)的监控也不是简单的主题监控或敏感词
监控,而是舆情网络规模与敏感主题监控的有机结合,因此,网络舆情结构化特征研究是网络舆情监控的基础。C32C33
其中,C23的产生方式的特征决定了网络舆情(下转第238页)
238情报科学28卷
计算结果表明,在图书馆虚拟馆藏质量评级体系中,5个分目标的权重依次为:数据库内容权重为
3.3评价结论
该图书馆虚拟馆藏得分为89.28,比较同类图书馆评价分值,可以直接反映出本馆虚拟馆藏的建设水平和使用状况,从而在各个单项指标的得分上找出差距,更有针对性的建设和发展图书馆,使之尽快达到较高层次的,具有现代化水平的图书馆。
0.3648,检索系统与功能权重为0.1781,使用情况权重为0.2351,成本权重为0.1350,出版商服务权重为0.0869。从指标权重可看出,数据库内容在综合指标
体系中权数最大,对图书馆虚拟馆藏质量综合评价起着决定性作用。
3.2虚拟馆藏的定量评价
通过专家评定,用户调查等手段获得用户对各个二级指标满意度的值作为得分pi(百分制),实例中二级指标得分pi取自表3中优良率的值作为满意度的值见表6,最后计算出本馆的虚拟馆藏总分
4结语
应用层次综合评判法进行图书馆虚拟馆藏质量评判,能反应图书馆虚拟馆藏质量综合水平,是一种行之有效的评价方法。文章构建的图书馆虚拟馆藏质量评级指标体系,克服了传统评价方法的只考虑单一指标的局限,评价更具客观性、系统性。采用层次分析的综合评价法,弥补了加权法的缺陷,既全面反映专家和决策者的主观意见,又不失评价结果的
R=ΣRi,Ri=1
mi=1
Σp×W。
i
ij
j=1
m
表6评价分值
Uu11u12u13u14u21u22u23u24u31u32u33u34u41u42u43u44u51u52u53
pi78415844785642434273674270544255111
Wi0.420.120.260.180.420.260.120.180.170.380.300.130.340.240.170.240.330.330.33
R3=33
89.23
R3=10.975R3=15.11R2=15.025R1=15.17Ri=1
mΣp×W
i
j=1
m
ij
R=ΣRi
i=1
客观性,然而应用这种方法进行馆藏质量评价,计算较为复杂,必须依靠计算机来完成。
参考文献
1
张革联,杜秦宁.馆藏评价与新时期馆藏建设工作思考[J].当代图书馆,2006,(2).66-68.
2张加红.虚拟馆藏若干问题的研究[D].郑州:郑州大学,2007.
3刘兹恒.试论虚拟图书馆与传统图书馆的关系[J].图书情
报工作,1997,(4).13-15.
4吴清强,韩5安
涛.数字图书馆评价研究综述[J].现代图书情
报技术,2006,(6):22-25.
娜.高校数字图书馆评价指标体系研究[J].现代情报,
欢.电子资源综合评价指标体系及其
(责任编辑:孙晓明)
2007,(5):97-100.6向英明,谭艺曼,林
数学模型的研究[J].图书馆杂志,2004,(1):26-29.
(上接第234页)
参考文献
1祝华新.2007年中国互联网舆情分析报告[J].今传媒,2008,(2):11.
2毕宏音.网民的网络舆情主体特征研究[J].广西社会科学,2008,(7):166-169.
3谢海光.互联网内容及舆情深度分析模式[J].中国青年政治
学院学报,2006,(3):95-100.
4刘毅.略论网络舆情的概念、特点、表达与传播[J].理论界,
2007,(1):11.
5姜胜洪.试论网上舆情的传播途径、特点及其现状[J].社科
纵横,2008,(1):130.
6姜胜洪.试论网上舆情的传播途径、特点及其现状[J].社科
纵横,2008,(1):130-131.
(责任编辑:孙晓明)
因篇幅问题不能全部显示,请点此查看更多更全内容