相信今天已经没有多少人还会固执地认为“互联网+”,“大数据+”只是个热点或是“噱头”。正所谓千淘万漉虽辛苦,吹尽狂沙始到金,大数据带来的产业革命正在倒逼传统产业革新,数据经济正在成为企业新的增长引擎。
“为什么大数据现在会这么热?是因为它能够真正解决一些实际的问题。比如,更有效地处理数据。也正因为如此,大数据的应用软件就变得非常重要。对于用户而 言,他并不在乎用什么样的硬件,甚至都不在乎用什么样的Hadoop或者是Spark的产品。只要给我一个高性能的、有效的应用程序、应用软件就好了。所以应用软件在一定程度上决定了Spark,包括Hadoop的整个生态系统的未来走向。而这一层的数据平台的未来走向又决定了硬件应当怎样更好的发展,来适应大数据的要求。”英特尔软件与服务事业部大数据技术中心全球总经理马子雅,在一次采访中如此谈到大数据。
在中国这个市场相来不缺领先的技术和应用。今天要盘点的正那些涵盖了数据采集,数据存储,数据分析,数据可视化以及数据安全等领域的老牌厂商,以及生来就 具有互联网大数据的互联网企业。看看他们是如何利用自身优势地位冲击大数据领域,并将新产品及新方案推广到新一轮技术浪潮当中的。
百度:让大数据成为商业新能源
“让大数据成为商业新能源”成为了百度世界大会大数据分论坛上,百度高级副总裁王劲的演讲主题。百度将通过大数据连接3600行,让大数据成为商业新能 源,提升3600行的核心竞争力。王劲表示,过去3600行在很多时候如同盲人摸象,依赖于单一的数据和片面的经验,而未来大数据将成为商业新能源,让传统行业做到洞若观火,推动其发展。
百度在大数据方面称得上是先行者,如今的百度大数据又发展到了一个新阶段。比如,在大数据提炼方面,百度已拥有超大规模的实时计算能力,多端跨屏用户精准识别能力,深度学习与挖掘,智能预测,推荐算法等能力。
在数据上,覆盖全网6亿网民,每天响应60亿次搜索请求,每天响应150亿次定位。这让百度拥有了比之前更全面、更立体、更丰富的数据源。
在技术上,百度具备了实时、深度洞察的数据智能。大数据可以做到对城市、用户、商户、企业、APP全面的多维度刻画。
在应用上,百度从创新探索的阶段走到了实现多种应用场景和对服务的沉淀。更重要的是,百度可以助力行业形成大数据应用的闭环,不断创造价值。比如助力O2O行业大商户具备大数据的能力,对到店客户数据采集、分析、深度调查等。
在生态上,百度也从内部探索走向了多种应用场景和服务沉淀。
在今天的大数据论坛上,来自零售行业的朝阳大悦城、保险行业的新华保险、旅游行业的大地云游都分享了在百度大数据+的应用成果。
而据王劲介绍,百度除了助力零售行业变革,提升用户体验方式,王劲也提到大数据将为互联网金融带来新的方向和突破口,实现金融行业的弯道超车。通过互联网线上数据与金融行业数据的结合,运用大数据技术,金融行业在基金选股、风险控制以及信用评估等方面的能力都将会得到大幅提升。
如今百度已与国金证券在大数据金融方面进行了合作,并取得了很好的效果,未来还将与国金证券建立新的量化基金,规模将会在50亿到100亿之间。
APIStore:连接数据服务商与应用开发者的桥梁
在当天的世界大会上,百度大数据部高级总监郭谢再一次强调了,百度大数据要通过开放数据、模型、服务能力释放大数据的价值,培育大数据的生态。
APIStore 不仅是百度的技术开放平台,同时也是连接数据服务商与应用开发者的桥梁。2014年10月,百度推出了第三方数据分发平台——APIStore。平台致力 于帮助服务商开放服务,以及为开发者提供最全面便捷的API服务。百度通过APIStore首次对外开放了文字识别(OCR)、人脸识别、百度糯米、百度 数据体检中心、百度网址安全中心等核心自有技术或数据,并集合了LBS、翻译、语音等已经开放的技术。
APIStore半年便吸引了50万开发者,汇集了800余个服务,日调用量过亿。单个产品对行业产生的价值是非常有限的,而开放技术与数据,能被众多产品使用,从而使数据价值最大化,形成数据流通生态。
大数据带来的价值千人千面,还是用范伟的一句来总结吧:大数据就是要帮助我们知道你想要啥,在什么时间和地点需要它。
英特尔大数据同样玩的是生态
在大数据领域,英特尔正在通过推动开源发展,建立和扩大其大数据生态系统。数据为证:在Hadoop开源社区中,英特尔的贡献排在 Hortonworks、Cloudera和Yahoo之后,位居第4。在Spark 生态系统中,英特尔的贡献也名列前茅。Spark是目前继Hadoop之后比较火的大数据处理开源社区。英特尔公司从2012年开始向Spark开源社区 贡献。在Spark生态系统里,英特尔一方面与本地行业开展了大量合作。比如提供咨询服务,帮助优化Spark生态系统平台。同时,英特尔也为此开展了一 系列的参与会议、培训等等。
英特尔软件与服务事业部大数据技术中心全球总经理 马子雅
英特尔软件与服务事业部大数据技术中心全球总经理马子雅,在接受记者的采访时这样概括她的团队主要职能:一是持续推进基于英特尔架构的硬件与软件技术的研 发和彼此的优化,充分释放硬件性能;二是通过加强开源社区的各领域的合作,优化英特尔的硬件平台,并通过与业界合作,完善在IA架构上的用户体验;三是, 加强和深化在应用分析领域里的各方合作。
这两年,“释放大数据潜能”成为了普遍需求,如何真正释放大数据的潜能,各家却做法不一。马子雅在采访中表示,开源与合作是英特尔在大数据方面的明确方 向。而围绕开源社区的推进工作,英特尔也确立了五大投资方向:首先是分析,其次是Spark,第三是SQL,四是存储,五是云实现。
对于Spark成为英特尔的重点投资对象之一,马子雅这样谈到:“在开源里面有很多很多的项目。我们具体去做哪一个呢?几年之前Hadoop是特别热的, 慢慢的Hadoop加入了Spark的成份,为什么?因为Hadoop的数据处理的模块叫MapReduce,它的运行速度不是特别令人满意。而 Spark是利用对内存直接进行运算,所以它在特定的情况下运行速度甚至可以达到MapReduce的上百倍。”
怎么样把大数据跟云计算更好的结合在一起,是目前非常明显的发展趋势,把“云实现”作为重点投资就不难理解了。
“在物联网、大数据方面,还没有哪家企业能够具备统一化的技术平台,也没有一个产品是可以完全主导一个市场的。所以我们在开源里还是要做一些具有普遍意义 的具体事情,比如API。具体而言,就是提供在英特尔平台上的JAVA Library,通过这种方式让更多的使用者,在需要用英特尔优化一些产品时,可以直接通过英特尔的硬件,包括固件提供的API、 JAVA Library来达到对整个应用程序,或者Hadoop跟Spark产品在英特尔平台上的优化。”马子雅具体介绍说。
值得一提的是,英特尔长期以来与Oracle都保持着非常良好的,对JAVA进行优化的合作关系,这对大多数习惯用JAVA来写大数据应用程度的开发者来说更加便利。
在很多采访中,英特尔的发言人都在传递一个相同的观点,在英特尔内部,英特尔架构部门与软件与服务部门,一个更偏重硬件产品的设计,另一个是让软件能够与硬件结合得更紧密。
的确,用这一观点去反观英特尔目前的发展路线图你会发现:英特尔的两大主要阵营一端是高性能计算,另一端是消费电子,将计算平台向两端延伸是这些年英特尔 比较清晰的路线。如今,英特尔正在通过可扩展的软硬件产品路线图,促进传统系统与云的连接,实现端到端的解决方案,以确保设备和现有基础设施产生的数据在 云端安全共享,用于分析目的,并从大数据中挖掘商业价值。
IBM大数据在中国落地有声
IBM的投资和发展,最重要的战略之一就是大数据。刚刚离任的IBM前大中华区首席执行总裁钱大群,在IBM的大数据峰会上言词垦切地谈到:“市场清楚地告诉我们,数据对于国家、对于企业、对于个人都可以变成很重要的资产。IBM的定位是协助你,把数据变成多种的能力并为你所用,提升竞争力。”
在中国,IBM以全新的开放联合创新的姿态面对新环境发展,在大数据领域,先后与宝信科技、华胜天成、浪潮、用友、数慧科技、南大通用、正通汇智等本土合 作伙伴展开合作,并拥有了包括鲁能集团、万得数据、上海虹桥机场、乐友孕婴童、飞鹤乳业、驴妈妈、民生银行、深圳儿童医院等各行业大数据客户。IBM还推 出了U100计划,向100所中国高校捐赠价值1亿美元的大数据及分析软件。并与香港中文大学市场学系对外贸易大学国际商学院、西南交大经济管理学院等联 合推出“百企大数据『A100』”计划,免费为100所拥有B2C数据的企业提供大数据分析服务。IBM与慧科科技合作在“开课吧”网站上提供免费的 MOOC项目。IBM在大数据努力和成就得到业界的广泛认可。
IBM大中华区全球咨询服务部副合伙人,大数据与分析中国区负责人谢国忠,在IBM《分析:速度的优势》白皮书发布之时接受记者的采访中也谈到:“最近两年IBM和中国企业有很多合作,我们已经做了很多相关的大数据的项目实践。”谢国忠在白皮书发表之际展示了IBM在十三个重点领域的应用场景,同时也着重 介绍了诸如上汽集团等企业大数据应用的情况。
IBM大中华区全球企业咨询服务部副合伙人,大数据与分析中国区负责人 谢国忠
比如,IBM帮助上汽集团成功打造中国汽车市场首个O2O电子商务平台——车享网。该平台将基于线上客户数据,有效判断客户潜在需求,提高运营分析效率, 为客户提供及时的、个性化的服务与信息。通过全面的客户洞察做到精细化营销,车享网平台将大幅提升会员管理水平。通过数据分析提升汽车消费者全生命周期服 务能力,真正做到高品质的客户体验。目前该公司从访客变成线下的成交客户,提升了1%。1%的提升很不简单,这需要庞大的数据量,而这个1%所带来的总订 单量则提升了11.3%,客户流失率降低了3%。
在新互联网时代下,随着大数据、云计算、社交及移动趋势的快速崛起,IBM正在构建自身全新的服务能力。在大数据应用领域,IBM一直引领着创新和发展, 并不断融合自身在各行业与全球化发展中的经验,不断帮助中国客户紧抓新时代下的发展机遇,以稳健的步伐成长为全球企业的领导者。
联想大数据有点不一样:不拼阅历拼实践
要说联想大数据业务最大的客户,正是联想自己。可以说,联想大数据业务正是在自家试验田中培育和发展起来的。业内有人形容说联想身上一直冒着“互联网”的 热气,联想的转型之路也是围绕设备、智能互联和互联网基础设施的三方面展开。为了实现这一使命,未来联想从五大环节全面推进实现智能互联。其中包括:把人和设备以更自然的方式连接在一起;让设备和网络之间的连接更牢固、更无缝;让设备和设备在共同的平台和标准下实现互联和互动;通过个人云和大数据实现用户 和用户数据的连接;实现设备与应用、与服务的无缝互联,让用户以最自然的方式一站式地得到所需要的服务。要实现这一愿景,大数据责无旁贷。
一直负责联想云计算基础架构、大数据分析、自然语言分析及机器智能的研究和实施的黄莹。在很多场合都会表达一个观点——企业未来成功与否,关键就看它能不能很地好利用大数据,这是时代的大势。
联想作为一个传统企业巨头,在硬件方面几乎含盖了所有终端设备,另一方面,联想也提供个人云应用。对于黄莹的团队来说,让数据可以在不同设备之间相互传 递,从IT基础设施(服务器、存储等)到移动终端(智能手机、平板等)的,端到端的解在决方案能够为亿万网民提供全新的应用体验,建立内部整体方案是联想 做大数据的第一步。
联想大数据具备哪些能力
搭建整体数据平台,联想兼顾了两方面的需求。一是大数据底层的收集数据和大批量处理的能力,二是上层利用大数据平台的分析能力。
做大数据必然会遇到数据来源的问题。在企业内部,有些部门有数据,但他们不一定知道自己有这么多数据,或者知道但不想分享,同时数据最大的来源还在外部。
“那么我们做大数据首先就要从质量源处理做起。但是在进行情感分析时,我们发现这些数据是抓取不到的。怎么办?这时候就需要开始从网上爬数据。大家可能会很熟悉爬虫技术,而我们在爬虫技术方面有我们自己的创新。” 联想集团研究院大数据总监的郭炜补充说。
总结而言,联想大数据平台具备与传统企业系统对接的能力,增强了非结构化、智能硬件、自然语言、视频等处理能力。同时,大数据也在驱动着企业的流程优化。 比如,大数据驱动倾听客户声音,改善用户体验,改变企业内部质量控制方法与流程。联想也充分利用了社区力量,紧跟开源社区,充分利用社区力量推陈出新。
联想大数据的商业价值
如果说联想做大数据的初衷一开始只是希望通过大数据和软件服务增强客户黏性和互动性。但是如今,因为用户价值的深挖却衍生出了更多应用场景。
在国际大数据大会上,联想就展出了其经过内部实践而推向商业市场的两款解决方案:企业网络数据分析解决方案和NLP舆情分析解决方案。
其中,联想企业网络数据分析解决方案,联想采用单点部署网络分析应用,采集联想全球近几十个网络中心的数据并分析,实时分析应用流量以及潜在故障,并给出网络优化建议。比如站点监测,带宽使用率,哪些应用正在运算,情况如何,多少用户在使用等等。
在大数据领域,联想是个新兵,但他的步伐很快。用郭炜的话说,大数据前沿的技术创新和实际业务如今已经能够快速地相结合非常快,这也是大数据健康发展的标志。
联想本身就是其大数据应用最好的案例。研究院每推出一个新工具,都会在内部试用。这时黄莹的团队就会观察它的使用率和使用数量,当一个新工具的使用从几个到上百个直至上千个时,也就体现出了研究成果的生命力和价值。而在内部使用成功之后就是联想推向市场的时机了。
大数据分析仅为赢得新客户?推动整合转型是关键
IBM在今年年初发布的《分析:速度的优势》白皮书,就企业在分析生命周期的三个关键阶段提出了快速将数据转变为洞察并驱动行动的建议,帮助企业在竞争中保持领先优势。
IBM大中华区全球企业咨询服务部高级合伙人兼副总裁 Steven Davidson
IBM 大中华区全球企业咨询服务部高级合伙人兼副总裁Steven Davidson 表示:“随着大数据应用的不断深入,新的发展与变化已经产生。通过此次《分析:速度的优势》白皮书的发布,我们可以看到,速度优势对企业在竞争取胜至关重 要。一部分企业正通过速度驱动的数据和分析实现差异化发展,对业务绩效和竞争地位产生了显著的影响。这一趋势对于全球企业高管,尤其是那些致力于利用创新 技术推动自身发展的中国企业的领导尤为重要。IBM一直致力于与中国企业紧密合作,分享自身丰富的大数据分析洞察与资源,共同携手推动业务的创新与增 长。”
从IBM此次发布的《分析:速度的优势》白皮书,其核心内容则是领跑者数据分析驱动实践,速度成为了关键。该白皮书指出要跟上当前的发展速度,企业需要全 面地采用分析技术。基于企业现阶段分析能力,白皮书将企业分为四个组别:领跑者、慢跑者、参与者和旁观者。占10%的领跑者最有能力满足速度需求,并创造 了巨大的商业价值。超过一半的领跑者都表示分析对业务表现和收入产生了显著影响并且使他们获得了显著的竞争优势。但大中华区在分析对业务、收入和竞争力方 面产生影响的表现仍与全球领跑者存在着较大差距。为了创造业务价值,中国企业需要仿效领跑者,并且加快速度管理数据和分析,并依据数据洞察采取行动。
|