联系电话:17703161000
您现在的位置:首页 >> 危机百科 >> 舆情监控 >> 内容

大年夜数据下的舆情监测与猜测

时间:2018-6-14 16:55:22

  核心提示:   摘要:Web2.0情况下,原有的舆情监测方法已难以适应实际须要。而大年夜数据的特点契合了Web2.0的收集情况和舆情研究的须要,可以或许实现更精确切时且基于关系的舆情监测。同时,大年夜数据技巧对...

 

  摘要:Web2.0情况下,原有的舆情监测方法已难以适应实际须要。而大年夜数据的特点契合了Web2.0的收集情况和舆情研究的须要,可以或许实现更精确切时且基于“关系”的舆情监测。同时,大年夜数据技巧对舆情猜测也有着独特的优势,并具进行更高质量的舆情猜测的潜力。
  
  关键词:舆情;大年夜数据;数据分析;舆情猜测一、Web1.0与早期舆情监测与即时通信类的收集应用不合,博客、小我空间、微博都具有必定的公共性质,并被统称为自媒体。自媒体的隆盛,使其成为热点舆情况成的重要推动者,而收集舆情也成为社会舆情的重要构成部分。
  
  自媒体几乎没有准入门槛,同时又具有匿名性,应用者的序言素养良莠不齐,很轻易产生各类掉范现象;自媒体也不像传统媒体那样轻易监督,对于掉范现象难以追溯泉源,同时给各方主体带来影响舆论、把控舆论走向的机会,使得收集舆情处于加倍复杂的情况中。自媒体的网状构造又决定了收集舆情可以快速发酵,甚至在短时光内多次转向,是以加倍难以监控和把握。
  
  而对自媒体勃兴之后收集舆情的监测,传统的现场查询拜访、拜访查询拜访、问卷查询拜访等方法见效不佳,早期曾经广泛应用的收集舆情监测手段也裸露出了越来越多的问题。早期的收集舆情监测,主如果针对Web1.0设计的。互联网成长至今经历了两个阶段:Web1.0和Web2.0。两者的重要差别并不在于技巧规范或物理设备,而是用户之间以及用户和收集应用之间的交互方法。
  
  在Web1.0时代,互联网内容重要由各大年夜网站临盆,用户和网站的交互重要表现为寻找和接收响应的内容,用户之间也只能经由过程有限的方法进行散落接洽。早期的收集舆情监测,就是针对如许层次的交互而设计。流程大年夜致是:一、经由过程相干样本库,把须要监测的网页进行模板匹配,并设定为监测数据源;二、应用爬虫法度榜样抓取数据,存储到本地,再进行数据的净化和简单的分析;三、应用简单的图表模板和文字描述,出现监测和分析的成果。①早期的收集舆情监测方法有一些原生的问题,譬如:一、因为处理才能有限,只能抽取部分样本进行监测,无法避免有时误差;二、文本分析算法的精确度、监测对象和体系模板匹配的程度、对数据的净化,以及分析的算法等身分对于最后监测成果的精确度都有决定性的影响,无法避免体系误差;三、将监测的对象简化为自力的信息元,欠缺分析收集内容之间接洽的才能和猜测才能。
  
  早期的收集舆情监测方法,尽管有很多问题,对Web1.0时代的离散的收集内容和单向的交互方法来说还可以实用。跟着互联网成长到了Web2.0时代,早期收集舆情监测方法的局限性表示得日渐明显,其监测功能已经弱化而无法适应新的舆论情况。
  
  二、大年夜数据技巧下的收集舆情监测时代最凸起的特点就是更慎密的网状构造。用户自立生成内容使收集内容临盆者数量呈几何级增长,用户与网站之间双向交互,用户与用户之间也在进行多渠道、多层次的立体的交互。的收集内容不再是离散的,具有强烈的“关系”属性。这种基于各类强弱关系的网状构造,也直接使收集舆情可以或许快速成型、发酵,短时光内可以多次转向。时代的舆情监测,更存眷“关系”,可以或许更快速、更精确地跟踪舆情变更。这恰是早期收集舆情监测的缺点。
  
  新的舆论情况,须要加强收集舆情的监测,而新的收集舆情,须要新的监测方法。大年夜数据技巧下的收集舆情监测,就是如许一种新的方法。
  
  自1980年以来,全球的数据存储才能每40个月就翻一倍。②赓续进行量级上的增长的宏大年夜数据量和数据背后储藏的信息,带来了大年夜数据时代。
  
  大年夜数据平日指的是宏大年夜、复杂,难以用传统的软件对象来分析处理的数据集。对大年夜数据的处理,又牵扯到从数据抓取、整顿、分析、共享、可视化到存储、传输等一系列问题。大年夜数据集合经常来源于日常生活,与人的行动、交往有必定的同构性,部分条目直接附加了时光、地舆等信息。可以说,在大年夜数据的数据集合中天然蕴含着各类关系。是以,大年夜数据集合能供给同数据量的若干小数据集合无法带来的新信息。人们可以经由过程数据发掘寻找数据之间的接洽,确立数据之间相干关系的规律,进而供给多方面的猜测。
  
  显而易见,大年夜数据处理技巧的优势,正契合了Web2.0时代的特点。正因为大年夜数据在发掘数据之间的关系、进行成长趋势猜测方面的才能,已经有很多机构借助其进行舆情监测和出现,并取得了不俗的成就。譬如在消息业,就有不少国际传媒机构已经在各类项目中采取了大年夜数据分析和数据可视化技巧,如BBC以及《卫报》《华盛顿邮报》《纽约时报》等。
  
  三、大年夜数据带来舆情猜测的新可能“猜测”本身就是大年夜数据的一个重要应用。针对同一主题的海量数据进行分析,经由数据发掘和建模后,可以获得响应的猜测模型,进而猜测将来的成长趋势。譬如奥巴马竞选团队,就在2012年竞选的多个环节应用了大年夜数据技巧,特别是在及时监测选平易近意向、猜测投票情况方面。竞选团队每晚都邑应用特制的模仿大年夜选的模型,根据及时监测的选平易近意向模仿大年夜选,并在第二天上午根据模仿成果对各州从新分派竞选资本。这种对舆情的及时监控和猜测对奥巴马2012年总统蝉联起到了重要感化。
  
  麻省理工学院博士内森·凯乐斯的一项以2013年埃及爆发的平易近众抗议活动的大年夜数据猜测为重要案例的研究,获取了全球范围主流媒体消息、当局出版物、社交媒体、博客等各类类型跨越三百万个数据源的目标数据。其证实可以经由过程大年夜数据技巧和特定模型来发掘大众,的情感、立场变更,并最终猜测以大年夜型抗议活动为代表的大年夜型公共事宜的产生,包含事宜即将产生的时光地点。③而这还仅仅是一个开端。大年夜数据有不合的来源,互联网中以自媒体为代表的各类原创内容持续爆炸式增长,各类移动通信设备、可穿戴设备也在一向地产生和存储、传递各类数据,除此之外的数据来源还有麦克风、摄像头记录的音频、视频数据,运营数据,遥感数据等等。
  
  按照来源不合,数据大年夜致可以分为三类,即以自媒体内容为代表的用户原创数据、各类经营活动中产生的运营数据(如发卖记录、医疗记录等)、感知数据(如各类可穿戴设备获取的数据)。④ 个顶用户原创数据对舆情监测的重要性已经浮现,而对其他数据来源的大年夜数据分析、不合数据来源的融合分析,也蕴含着巨大年夜的舆情猜测潜力。
  
  与用户原创数据比拟,感知数据和运营数据似乎与“舆情”没有直接接洽。然而,舆情从来不是孤登时存在的,舆情的发酵、转向源于实际社会的事宜和情况,舆情的成长又会影响实际活动。而感知数据和运营数据和人们日常生活具有同构性,甚至直接记录着人们的举措和身材变更。如可穿戴设备,已经可以检测应用者的心跳、体温、血液含氧量等数据,并经由过程模型分析应用者的情感变更。而对地位移动、购买行动的相干数据的监测,以及基于这些数据对小我行动的猜测,更是已经投入营销活动的应用。
  
  在这些感知数据、运营数据中可以获知人们的情感、立场、日常行动的变更,也就可以结合其他数据源进行舆情猜测。数据源从用户原创内容扩大到感知数据、运营数据,必定会带来舆情猜测整体质量的进步。从这个意义上来说,大年夜数据给舆情研究带来的不仅是更精确、即时、动态的舆情监测,更给舆情猜测带来无穷可能。

  本文由北京tw优化工作室公关公司编辑收集于收集,不代表本站任何不雅点。如有侵犯权益,请接洽本站治理员!北京tw优化工作室专业研究品牌保护危机公关处理,收集公关处理,企业当局危机公关处理,负面消息信息处理,供给专业百度口碑保护筹划,保护企业品牌信用及当局荣誉!如需懂得更多相干公关资讯,请存眷北京tw优化工作室官网。

作者:佚名 来源:不详
共有评论 0相关评论
发表我的评论
  • 大名:
  • 内容:
  • 危机百科|危机公关|危机管理|品牌维护|负面处理|负面屏蔽|负面压制|口碑优化公司(www.seotw.cn) © 2018 版权所有 All Rights Reserved.
  • 联系方式:17703161000(东哥)QQ:2010860982