首页>论文 > 哲学 > 伦理学 > 大数据的信息伦理问题及构建

大数据的信息伦理问题及构建

2014/11/14  阅读 (0 )

简介:大数据(Big data),或称海量数据,指包含的数据量已无法通过人工在合理的时间内对其进行收集、管理、整合并提供给用户使用的信息。大数据虽难于处理但价值无限,已成为美国国家创

  大数据(Big data),或称海量数据,指包含的数据量已无法通过人工在合理的时间内对其进行收集、管理、整合并提供给用户使用的信息。大数据虽难于处理但价值无限,已成为美国国家创新战略、国家安全战略、国家ICT产业发展战略以及国家信息网络安全战略的交叉领域。不过伴随利用大数据为企业或组织带来的收益不断暴涨,我们也相应看到对大数据的“利用”引起了社会各阶层关于信息伦理道德的争辩与反思。面对大数据,究竟是采取放任的态度还是利用法律的框架和伦理道德约束它?又该如何约束?

  1国内外大数据环境下的信息伦理问题案例分析

  1.1国外案例—美国“棱镜门”事件

  2013年6月,美国中央情报局前雇员斯诺登向媒体曝光美国国家安全局和联邦调查局代号为“棱镜”的秘密项目,其直接接入苹果、微软、谷歌、雅虎等九大互联网公司的中心服务器,针对境外非美国人搜集情报,用户的电子邮件、在线聊天、信用卡信息等都无密可保。“棱镜门”的曝光暴露了全球社交网站甚至企业网站时刻都处在严密的监控中,导致企业及个人用户的信息安全受到威胁。

  这一案例引发对信息伦理中个性化服务与隐私权之间矛盾的研究,用户期望得到企业的个性化服务,企业期望得到政府的特殊对待,无形中允许了政府以及企业获取隐私信息。人们当然希望企业、政府能一身正气将信息用在便捷工作生活上,但获取的程度却难以界定,由此引起了信息伦理问题的产生。

  1.2国内案例—“查开房”网站

  2013年10月18日,以“股社区”为新浪微博账号名的用户发布了一个名为“查开房”的网址,只要输入查询对象的姓名以及身份证号就能查询包括生日、地址、手机号、邮箱、公司、登记日期等真实信息。本网站所涉及的内容包括如家、七天等连锁酒店的房客个人信息数据库。黑客通过入侵无线上网认证管理系统供应商—浙江慧达骤站网络有限公司的系统漏洞获取数据。

  这一网站的出现,不仅导致个人私隐的安全问题,同时引起了现实社会中的伦理问题的激化。多数不法分子通过该网站获取他人私人信息散播到网络中,大众的知情权与个人隐私权的矛盾再一次引起信息伦理问题。

  2大数据环境下的信息利用革新及特点分析

  2.1大数据产生前后信息利用的差异对比

  (1)科学范式的革新。计算科学范式盛行时期,计算机及机械设备等产生的数据信息数量有限、增速缓慢,针对这类信息的利用主要集中于数值模拟、模型拟合与数据分析、计算优化等方面。而第四范式的产生正是大数据时代科学研究对科学数据信息利用的革新。从计算科学中把数据密集型科学区分出来作为一个新的、科学探索的第四范式颇有价值。通过使用大数据处理技术对科学实验海量数据进行整合分析,经过深度提炼挖掘信息价值,向用户展现更广阔的数据融汇关联性,真正地实现“多跨度”的检索和集成。

  (2)被利用的信息结构种类增多。大数据时代涉及到的信息数据结构丰富多样,结构化、半结构化以及非结构化的信息数据相互交织,共同被大数据环境中的数据处理技术如Map Reduce Hadoop等分析处理;而传统数据分析主要针对已知的数据范围中易处理的数据进行,大多数据仓库都有一个完善的ETL流程和数据库限制,想要从更多数据中挖掘细微变化十分困难。

  2.2大数据环境下信息利用的特点

  (1)信息规模庞大。据IDC统计:截至2010年底,全球数据量已经达到了120万PB;到2020年,全球以电子形式存储的数据量将暴增44倍,达到35ZB。目前能源开发、制造业、交通运输业、服务业、科教文化、医疗卫生等领域都积累了TB级、PB级乃至EB级的大数据。全球连锁超市沃尔玛每日处理约100万条用户请求,同时还维护着一个容量约2.SPB的数据库;社交网络Facebook目前也已存储了超过500亿张的照片。无论从数量还是涵盖范围上看,大数据环境下得以利用的信息规模是十分庞大的。

  (2)信息利用涉及到的网络安全隐私权问题增多。早在1986年Mason就总结了信息伦理中的主要四个冲突—PAPA(隐私权和信息共享之间的冲突,信息的准确性与信息道德风险的冲突,知识产权与市场交易的冲突,信息资源存取权与信息公平的冲突。面对不断完善的社会法律体系以及公众对于隐私权利的诉求,要想利用大数据创造价值,又要避免陷入“数字化圆形监狱”的处境,就必须对大数据建设提出约束,对公众的意识观念提出规范。

  3现代社会大数据引起的社

  会信息伦理问题和影响

  3.1个人信息的获取利用与数据挖掘间的矛盾

  虽然海量数据处理具有隐私性,其操作前提是在不暴露用户敏感信息的情况下进行数据挖掘。但随着信息技术和大数据的发展,用户个人信息与数据分析技术之间的隐私矛盾问题依然在增多。第一,现代数据挖掘等分析技术仍存在功能漏洞,导致在输出分析数据的过程中信息流失、黑客攻击等问题;第二,大数据拥有方通过对海量数据聚类分析等操作获取巨大的经济利益,但信息提供方是否共享到同等价值的经济效益无从衡量。类似Amazon的商品推荐系统通过分析用户数据提供个性化服务的行为会给信息利用和提供的双方都带来利益,但从用户角度出发,其所要承担的风险更多,而相对的利益获取更少,双方的利益权衡问题得不到明确的社会关系准则的规范。

  3.2社交网络大数据的利用与传播无约束

  大数据的主要来源之一莫过于现代社交网络集群。根据相关机构统计,Faeebook通过对海量社交网络数据与在线交易数据进行分析和挖掘,从而提供点对点的个性化广告投放策略,2010-2011年实现了广告份额增长95%,比Google的增速快了近3倍。新浪微博也依靠其大数据集群实现“Pale”新功能,强化周边音乐、电影、美食等事物概念。而当人们欣喜于快速进步和便利的产生之时,关于社交网络对于大数据的“任意”使用和传播也成为了目前信息发展的主要社会问题。

  3.3企业间基于大数据的竞争情报获取疏于规范

  目前部分大型企业和组织拥有大数据,这些数据实际上是企业正常运营中产生的商业内部信息,一般应该属于企业内部信息管理系统所处理的对象。但正是由于大数据的“4V”特性,通过对大数据的深度分析,企业可以轻易发觉用户需求趋势、洞察市场运作状态以及调整企业发展战略,提升企业竞争情报实力和核心竞争力。但这些企业的业务数据以及交易数据大多以云平台(大数据集群)存储管理,在处理技术尚不完备的状况下,数据窃取、第三方数据买卖交易等非正规竞争情报获取方式,使得企业组织在应对大数据洪流的过程中疏于规范。

  4面对大数据洪流的信息伦理构建

  (1)网民的自律与加强信息伦理教育的他律结合。在以交互为主要特征的Web2.0环境下,网民是数据洪流的接受者和提供者,网民必须同时具备个人隐私不透露和他人不侵犯的自律意识,拥有这种意识就需要具备较高的道德素养。网民在享受越来越智能化的个性服务的同时应多思量这一服务与个人信息安全之间的关系。真正的道德是由于认识到自然规律和社会责任而形成的一种行为的必然性和自觉性。网民应在继承传统道德的基础上,加强网络时代的道德自律,进一步建立公众意识和他人意识,弘扬个人人格力量,是养成教育的最终目的。

  (2)网络技术人员职业道德自律与发展数据保密技术的他律结合。从现代技术层面探讨,目前最为实用的技术方法非数据加密莫属,针对微信可使用端到端的手机语音加密方法,即使用AES算法对话音数据进行加密;同时使用ECDH算法来协商生成AES算法的共享密钥。该方法可针对微信中语音实时对讲的信息安全加以加密保护。

  近年来,数据挖掘成为一门学科,只要购买相关书籍,通过自学就能掌握数据挖掘技术,这令信息更加唾手可得。因此作为掌握一定数据获取挖掘技能的任何网络技术人员都应从伦理道德层面出发衡量数据挖掘行为,以防侵犯他人隐私。

  (3)个人或企业的自保与健全的法规准则的他保结合。目前关于大数据信息环境下的相关法律还十分欠缺,并且具有针对性和细化的法规更需要长时间的探索和发现。因此在法律建设不健全的条件下,个人用户应注意自身的网络行为,不随意注册、回答网页或应用中涉及的个人信息,不轻信广告、中奖邮件等恶意盗取隐私数据的信息,提高网络公民意识;而企业组织就应结合自身实际,通过道德呼吁、企业自身规章制度等,加速催生信息法律以及社会信息伦理的新时代。

  2014年两会期间“大数据”被众多委员热议,也有很多人提出应加强个人信息安全、企业信息安全立法,细化和完善现有法律法规,明确信息资源是资产,规定信息主体、客体的权利和义务。总体而言单凭规章限制或个体自律是无法实现信息网络伦理道德建设新高度的,因此需要通过立法和强调行业自律的方式,形成良好的数据开发和使用氛围。

  5结语

  通过对大数据时代下的典型案例分析,以及信息伦理问题产生的原因和众多现象的阐述,笔者了解到目前的社会信息伦理构建还存在边界不明确、体系不完备、法律不匹配等问题,并相应地提出解决问题的方法。伴随大数据的不断发展壮大,相应的信息安全伦理问题应该得到更多的关注。

关键词:
特别推荐

2017年全国硕士研究生招生考试初试成绩本月

2017年全国硕士研究生招生考试初试成绩,将从本月起陆续公布。复试在三、四...

更多>>热门院校
  • NO/1 中国科学技术大学