单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,大,数据,or,大问题?,大数据时代,的安全挑战及防护,目录,万千气象,:,大,数据,之,分析,1,2,防不胜防:大数据之风险,3,天网恢恢:数据之网络安全,4,淘沙取金:大数据之内容安全,5,任重道远,:,大数据,之展望,Jasmine.More,万千气象,:,大,数据,之,分析,社会信息化和网络化导致数据的爆炸式增长,云计算、物联网等新技术催生大数据,数据仓库、数据分析、数据挖掘等技术,大数据的核心是,数据、技术和思维,万千气象:大数据之分析,当今,创造的数据,早已经远远超越了目前人力所能处理的范畴,大数据时代正在来临,数据,指数,增长,根据,IDC,监测,,数据,量正在呈指数级增长,,约,每两年,翻一番。,结构,日趋,复杂,大量新数据源的出现则导致了非结构化、半结构化数据爆发式的增长。,万千气象:大数据之分析,大容量,高速度,真实性,多样性,处理速度快,数据类型繁多,追求高质量的数据,大数据的特征,数据巨大,万千气象:大数据之分析,7,。,优化,各级政府、主管部门、上市公司、企业集团、外资公司都将基于大数据分析平台优化其决策。,革命,大数据分析能力逐渐加强,传统市场研究行业、证券研究所、产业链咨询机构将逐渐消失。,颠覆,银行都将基于企业大数据平台开展银行直销业务,同时按照产业链金融服务事业部模式开展业务,改变,因大数据系统的出现,所有依赖信息不对称盈利的业务都将消失。,大数据对,政府、运营商,高校,、企业来说,象空气一样不可或缺!,万千气象:感受数据之大,Jasmine.More,防不胜防,:,大,数据,之安全风险,大数据的例子,万千气象:感受数据之大,GOOGLE,通过全美各地区,搜索,H1N1,及流感相关关,键字频率和分布,得出疫,情爆发情报,对冲基金通过,Twitter,用户,每天关于情绪的关键字进,行以亿为单位的数据分析,,用以为买入和卖出股票,做参考,BOSTON,爆炸案,通过当天的数据分析,第二天抓获嫌疑犯,制止再次作案。,防不胜防,:大数据之安全风险,大,数据成为,竞争新,焦点同时,带来了,更多安全风险,业务数据,大数据本身成为网络攻击的显著目标,隐私泄露,大数据加大隐私泄露风险,存储风险,大数据对现有的存储和安防措施提出挑战,APT,攻击,大数据成为高级可持续攻击的载体,大数据不仅意味着海量的数据,也意味更,复杂、更敏感的数据,数据会吸引更多的潜在攻击者,成为更具吸引力的目标,数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率,防不胜防,:大数据之安全风险,大数据成为网络攻击的显著目标,大,数据成为更容易被,“发现”,的大目标,承载着越来越多的关注度,数据的大量聚集,,使得一,次成功的攻击,能够,获得更多的数据,,增加了攻击收益率,大数据包含复杂敏感数据,会,吸引更多的,潜在,攻击者,成为更具吸引力的目标,1,防不胜防,:大数据之安全风险,大数据加大隐私泄露风险,数据,汇集包括大量企业,运营数据、客户信息、,个人行为,的,细节记录,数据的集中存储增加了,数据泄露,风险,敏感数据的,所有权和使用权,无,明确,的界定,,大数据分析未,考虑,到个体隐私,问题,2,防不胜防,:大数据之安全风险,大数据对现有的存储和安防措施提出挑战,攻击者利用,大数据将攻击很好地隐藏起来,,使,传统的防护策略难以检测出来,随着数据增长,安全防护更新,升级速度无法跟上数据量,非线性增长,的步伐,大数据,的价值低密度性,让安全分析工具很难,聚焦在,价值点上,,攻击可隐藏,在大数据,中,3,防不胜防,:大数据之安全风险,大数据成为高级可持续攻击的载体,数据,大,集中的,导致,复杂,多样的数据,存储,如可能出现数据违规存储,攻击者可设置陷阱误导,安全厂商目标,信息提取,导致,安全监测偏离应有的方向。,常规的安全扫描手段需要耗费,过多时间,,,已影响,到安全控制措施能否正确,运行,4,防不胜防,:大数据之安全风险,Jasmine.More,天网恢恢,:,大,数据,之网络安全,防不胜防,:大数据之安全防护,大数据在带来了新安全风险的同时也为信,息安全的发展提供了新机遇,1,网络安全,防护,网络信息,内容防护,随着经,济社会快速发展,,保障我国大数据,信息安全已经成为关乎大数据应用的重要,利用大数据分析,通过搜集来自多种数据源的信息安全数据,深入分析挖掘有价值的信息,对未知安全威胁做到提前响应、降低,风险,借助基于大数据分析技术的机器学习和数据挖据算法,,智能,地洞悉信息与网络安全的态势,,从而,加主动、弹性地去应对新型复杂的威胁和未知多变的风险。,保证大数据安全采取的措,安全分析,大数据正在为安,全分析提供新的可能性,对于海量数据的,分析有助于,信息安全服务提供商更好的刻画网络,异常,行为,从而找出数据中的风险点。,认证技术,收集用户行为和设备行为数据,对这些数据分析,获得用户行为和设备行为的特征,进而确定其身份,匿名保护技术,数据发布匿名保护技术是对大数据中结构化数据实现隐私保护的核心关键与基本技术手段,。,大数据安全防护,-,网络安全篇,万千气象:感受数据之大,基于大数据,企业可以更主动的发现潜在的安全威胁,相较于传统技术方案,大数据威胁发现技术有以下优点:,1,、分析内容的范围更大,2,、分析内容的时间跨度更长,3,、攻击威胁的预测性,4,、对未知威胁的检测,基于大数据的认证技术,:,攻击者总能找到方法来骗取用户所知的秘密,或窃取用户凭证,传统认证技术中认证方式越安全往往意味着用户负担越重,2,防不胜防,:大数据之安全风险,身份认证:信息系统或网络中确认操作者身份的过程,传统认证技术只要通过用户所知的口令或者持有凭证来鉴别用户,基于大数据的认证技术,:,2,防不胜防,:大数据之安全风险,减小用户负担,更好的支持各系统认证机制的统一,攻击者很难模拟用户行为通过认证,原理:,收集用户行为和设备行为数据,对这些数据分析,获得用户行为和设备行为的特征,进而确定其身份。,存在用户隐私问题,初始,阶段认证分析不准确,对数据质量要求高,优点,缺点,大,数据匿名,保护技术,:,3,防不胜防,:大数据之安全风险,一定程度上保护了数据的隐私,能够很好的解决静态、一次发布的数据隐私保护问题,原理:,对,大数据中结构化数据实现隐私保护的核心关键与基本技术手段,典型例子,:,k-,匿名技术要求发布的数据中存在,一定,数量,(,至少为,k),的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的具体个体,从而保护了个人隐私,优点,缺点,K,匿名方案,。,不能应对数据连续多次发布、攻击者从多渠道获得数据的问题的场景,社交网络中典型的匿名,保护,:,3,防不胜防,:大数据之安全风险,原理:用户,标识匿名与属性匿名,在数据发布时隐藏了 用户的标识与属性,信息,;,用户,间关系匿名,在数据发布时隐藏了用户间的,关系,边,匿,名,方案,多,基于边的增删,用随机增删交换便的方法有效地实现边,匿名,不足:匿名边保护,不足,超级,节点,方案,基于超级节点对图结构进行分割和集聚,操作。,不足在于牺牲,数据的可用性,Jasmine.More,沙里淘金:,大,数据,之内容安全,防不胜防,:大数据之安全风险,大,数据成为,竞争新,焦点同时,带来了,更多安全风险,信息过滤,如何从海量数据中过滤敏感信息内容,舆情分析,如何实时将最重要的舆情信息优先放到用户面前,社会网络分析,大,数据对现有的存储和安防措施提出挑战,开源情报分析,大,数据成为高级可持续攻击的载体,大数据环境下的信息过滤特点,智能,智能过滤违法国家法律法规以及侵犯用户权益的内容,达到净化网络空间、提取情报的目的,确保国家、社会与个人的信息内容安全。,高效,在本系统在保证准确率的情况下,,可以满足海量,处理,规模,数据,快速便捷地,匹配自定义,的关键字、词,自学习,通过机器学习,自动抽取新的语言知识,以适应新的网络语言变化,做到因时而变。,大数据安全防护,-,网络安全篇,查询同样,的,变化,信息内容需花费大量,的时间,万千气象:感受数据之大,大,数据信息过滤应用,网络信息是动态变化的,用户时常关心这种变化,2,克服重复查询,实现“主动服务”,“信息找人”,提供个性化信息服务,对,不同用户,采取,不同服务,策略,提供差异服务,色情内容,保护青少年身心健康,实现有害信息的过滤,反动言论,,谣言,保护,国家安全,用户和用户,之间,,关键问题是,聚类,提供用户资源的新颖性,防不胜防,:大数据之安全风险,协同过滤时需要解决的是稀疏性,并尽力提高可拓展性,大,数据信息过滤应用,2,协作过滤,大,数据舆情分析,:,3,防不胜防,:大数据之安全风险,原理:,通过互联网传播的公众对现实生活中的某些热点、焦点问题所持有的较强影响力、倾向性的言论和观点,传播场所包括论坛、博客、新闻跟帖、转帖、微博,等,原理:,开放性,、,时效性、互动性、多元性、突发性、个性化、群体极性、揭露问题、批判,现实,社交媒体数据量爆炸增长,传统舆情技术无力实现全数据采集,万千气象:感受数据之大,大数据舆情监测的挑战,利用,传统数据处理,与存储方式,要,实时处理海量数据,投入巨大,2,大,数据采集和处理,如何实时将最重要的舆情信息优先放到用户面前成为重要问题。,舆情的发现,用户一天满负荷接收的数据量有限,需要有技术识别舆情的真假,防止被错误引导,内容,舆论噪音的辨别与去除,社交平台中存在大量受控制的机器账号,,可快速,增长某些内容的转发量,大,数据舆情分析示例,:,3,防不胜防,:大数据之安全风险,大,数据社会网络分析,:,3,防不胜防,:大数据之安全风险,研究,内容:,测量网络数据、发现网络性质、建立网络模型、分析,网络用户行为及与各个连接节点的关系。,发展应用:,社会网络与大数据分析相结合,为分析复杂的社会系统提供了有力的工具,在社会学、管理学、经济、国家安全等领域将得到广泛应用。,测量网络数据,发现网络数据,建立网络模型,控制网络功能,分析网络行为,社会网络,建模分析方法,大,数据社会网络分析,:,3,防不胜防,:大数据之安全风险,研究,内容:,测量网络数据、发现网络性质、建立网络模型、分析,网络用户行为及与各个连接节点的关系。,发展应用:,社会网络与大数据分析相结合,为分析复杂的社会系统提供了有力的工具,在社会学、管理学、经济、国家安全等领域将得到广泛应用。,测量网络数据,发现网络数据,建立网络模型,控制网络功能,分析网络行为,社会网络,建模分析方法,社交关系网,结构,:,3,防不胜防,:大数据之安全风险,大,数据社交,关系,结构,:,3,防不胜防,:大数据之安全风险,大,数据开源情报分析,:,3,防不胜防,:大数据之安全风险,研究,内容,:,将大量的存在,于网络中的开源各,类数据以,图形方式对数据,间的关联进行描述和展现,,并运用众多数据分析,的方法(关联分析、网络分析、路径分析、时间序列分析、空间分析等)来发现和揭示数据中隐含的公共要素和,关联,大数据环境,下的网络开源,情报分析特点,效率,情报收集成本小,,降低,情报收集工作量,,减少违法,或违反道德的风险,丰富,借助开源情报来,理解,相,关联的秘密情报,且有助于,研究长期问题,隐蔽,可以保护情报源和情报,方法以及自身战略意图,大数据安全防护,-,网络安全篇,数据定量分析,多源数据融合,防不胜防,:大数据之安全风险,网络开源情报分析方法,2,协作过滤,相关性分析,Jasmine.More,任重道远:,大,数据,之展望,任重道远:大数据,展望,技术和政策并重,完善重点,领域,数据管理和规范制度,加强对重点领域敏感数据的监管,持续对大,数据安全与,隐私方向研究,大数据时代,期望数据与安全完美,平衡,