文章

2013,齐奏大数据的交响乐

2013-07-31e-works 王聪

621阅
IDC在《2020年的数字世界》中提到,从2005年到2020年,数字世界将增长300倍,从130EB增长到40ZB。相比2010年所作出的预测35ZB又高出了14%。对于IT厂商而言,如何整合企业现有资源提供一体化的大数据解决方案,为企业真正实现大数据的价值,将是今年的核心课题。由于大数据技术横跨多个技术领域,从数据存储、虚拟化和云计算,到数据库管理、并行计算和数据挖掘,覆盖了IT诸多领域,相信关于大数据交响乐中的任何一个变奏都会带来信息领域里诸多方面的突破性发展。

    短信、QQ、e-mail、微信......我们身边无时无刻不在进行着数据的交换,2013,我们已经身处在一个巨大的数据漩涡中。“大数据”,一个看似通俗直白、简单朴实的名词,却无疑在全球引领了又一轮数据技术革新的浪潮。对大数据这个词汇也许并不感到陌生,然而至今业界对大数据也没有一个统一的定义,因为随着技术的不断发展,符合大数据标准的数据集越来越多,并且不同行业对大数据有着不同的定义,这取决于特定行业通常使用何种软件和数据集,这使得大数据在不同行业中的范围可以从几十个TB到几个PB。最新预测表明,大数据将继续以每年40%的速度持续增长,而大数据所带来的市场规模也将以每年翻番的速度增长。进入2013年,有关大数据的话题也逐渐从讨论大数据相关的概念到研究如何从业务和应用出发来挖掘大数据所蕴含的价值。

    作为存储领导厂商,EMC一直是大数据的积极推动者。从2008年到2011年,EMC相继收购了Greenplum和Isilon,这期间大数据业务增长了10倍。EMC为大数据开发的硬件是模块化的EMC数据计算设备(DCA),它能够在一个设备里面运行并扩展Greenplum关系数据库和 Greenplum HD节点。DCA提供了一个共享的指挥中心界面,让管理员可以监控、管理和配置Greenplum数据库和Hadoop系统性能及容量。今年4月,EMC和VMware、GE通用电气联合投资创建Pivotal公司,进一步发力未来的大数据市场。整体来看,EMC的大数据战略是通过提供解决方案,使用户从数据源获得最大价值,增强灵活性并提高效率。EMC大数据解决方案构架在弹性的、横向扩展存储平台上,运行特性设计的分析工具,可处理结构化和非结构化数据,在生产环境中和业务流程平台上提供可付诸实践的洞察力。

    IBM作为全球最大的信息技术和业务解决方案公司,自然不会眼睁睁看着大数据从身边溜走。今年5月末IBM发布了最新大数据技术,包括业内首创的BLU Acceleration和全新大数据专家PureData for Hadoop,旨在提高企业部署Hadoop的速度,同时降低部署难度。Hadoop作为颠覆性的开源软件,可用于组织和分析海量的结构化和非结构化数据,例如社交媒体网站的微博与评论、图片和视频、网上交易记录和记录手机定位数据等。稍早的3月12日,IBM还发布了最新的与牛津大学共同的大数据研究成果:白皮书《分析:大数据在现实世界中的应用》,重新定义和完善大数据“4V”理论,深度剖析了“分析”为要的大数据解决之道,结合众多行业实践,提出五大关键性建议,为企业在不同阶段实践大数据提供战略性指导。IBM宣布将以“智慧的分析洞察”为核心推进在华的大数据战略。

    针对甲骨文而言,则采用了“数据库+大数据机”的这种清晰策略,以Oracle大数据机与Oracle Exalogic中间件云服务器、Oracle Exadata数据库云服务器以及Oracle Exalytics商务智能云服务器一起组成了甲骨文最广泛、高度集成化系统产品组合,为企业提供了一个端到端的大数据解决方案,满足企业对大数据治理的所有需求。通过甲骨文大数据机可以使甲骨文-Sun分布式计算平台与Cloudera的Apache Hadoop发行版、Cloudera管理器管理控制台、R分析软件的开源发行版以及甲骨文NoSQL数据库结合起来。甲骨文还包括连接件,因而让数据能够在大数据机与甲骨文Exadata或传统的甲骨文数据库部署环境之间来回传送。

    大数据时代来临,老牌巨头惠普也不甘落后。今年6月24号,惠普扩展其大数据咨询服务,以帮助客户规划、实施和维护能够支持其大数据计划的IT基础设施,从而在降低成本的同时提高IT效率。惠普大数据咨询服务提供战略、规划和实施服务,帮助客户在简化IT管理的同时,降低基础设施的维护成本,并确保其遵循行业标准和政府法规。主要包括:惠普Hadoop企业规划服务、惠普Hadoop实施服务、惠普Hadoop参考架构实施服务、惠普大数据保护与合规分析,以及面向系统管理员的Hadoop课程等。

    谷歌一直是科技行业的领军者,通过对其拥有的海量数据进行深入挖掘,对于提升谷歌搜索乃至所有谷歌服务的价值无可估量。BigQuery是Google推出的一项Web服务,用来在云端处理大数据。该服务让开发者可以使用Google的架构来运行SQL语句对超级大的数据库进行操作。BigQuery允许用户上传他们的超大量数据并通过其直接进行交互式分析,从而不必投资建立自己的数据中心。Google曾表示BigQuery引擎可 以快速扫描高达70TB未经压缩处理的数据,并且可马上得到分析结果。大数据在云端模型具备很多优势,BigQuery服务无需组织提供或建立数据仓库。而BigQuery在安全性和数据备份服务也相当完善。

    SAP面对大数据更加注重数据的交互和开放性,SAP推出了基于内存计算的高性能分析应用软件(SAP HANA),利用SAP HANA可以构建一个公开的平台,开放给不同领域、不同行业的合作伙伴,联手合作伙伴共同运作,让更多用户通过HANA得到真正的收益。SAP 实时数据平台基于其旗舰产品SAP HANA平台,涵盖SAP Sybase IQ、SAP Sybase ESP、SAP Sybase ASE 和 SAP Enterprise Information Management 的数据管理功能。该平台拥有对大数据进行分析、存储和处理的强大功能,可以充分挖掘大数据的商业价值,帮助企业紧抓机遇,进行实时决策。

    除上述公司外,包括Cloudera、Clustrix、Informatica这些与Hadoop以及大数据相关的企业也都积极开拓大数据市场,提升自身竞争能力。

    面对国外厂商在大数据领域的活跃表现,国内市场由于在数据库、数据仓库、商业智能等领域基础薄弱现在还处在建设初期,但不乏积极的发展态度。华为在2013年7月推出了面向企业级数据中心,实现智能的数据布局;面向海量数据存储,融合架构简化生命周期管理;面向全球数据中心,打造高效的全球数据共享模式的“存以智用、融以致远”的存储解决方案,通过存储业务发力大数据技术创新。此外,以百度、阿里巴巴、腾讯等国内互联网巨头也不断在大数据领域进行着探索。

    通过对大数据进行提取和分析能帮助企业更好的做出决策,问题是如何能够开发出经济实用的大数据应用解决方案,使得用户能够利用手中掌握的各种数据,揭示数据中所存在的价值从而为企业带来市场上的竞争优势。在这种从传统IT系统到大数据系统的过渡过程中,上述IT业界领导厂商采用的均为渐近式的改进模式为客户进行大数据解决方案部署,因为如若需要用户搭建一套从硬件到软件的全新IT系统,这样的代价对于大多数用户来说都难以接受,更可行的方案是在现有的数据平台基础上,逐渐使现在的IT系统具备处理和分析大数据的能力。

    IDC在《2020年的数字世界》中提到,从2005年到2020年,数字世界将增长300倍,从130EB增长到40ZB。相比2010年所作出的预测35ZB又高出了14%。对于IT厂商而言,如何整合企业现有资源提供一体化的大数据解决方案,为企业真正实现大数据的价值,将是今年的核心课题。由于大数据技术横跨多个技术领域,从数据存储、虚拟化和云计算,到数据库管理、并行计算和数据挖掘,覆盖了IT诸多领域,相信关于大数据交响乐中的任何一个变奏都会带来信息领域里诸多方面的突破性发展。

责任编辑:王聪
本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。
读者评论 (0)
请您登录/注册后再评论