当企业盲目编译大量不同的数据 不知道如何处理时
去年,我参加了GigaOm的结构数据会议。这次会议的主题是Hadoop、大数据和非结构化数据的承诺,这对名为“结构”的活动来说是一个讽刺。今年的活动(3月19日至20日)涉及更多交付内容,包括案例研究、用户体验以及大数据大计划的实际预期范围。从承诺到现实的转变值得欢迎。这是我参加活动第一天以来的五大收获。
1.大数据和Hadoop基础设施的部署涉及技术和流程。关于客户的大数据湖,填了很多数据,然后再想办法处理。“H脚”只是其中之一。这个词来自科林科尔曼,前火箭科学家,现在是特纳广播公司的分析师。
他指的是建立基于Hadoop的数据基础设施,然后将各种形式的数据倾倒到系统中的诱惑,没有很多关于数据是否需要、如何提取所需内容以及提取后如何分析数据的计划。
过去的商业智能技术专家应该关注对人才的迫切需求,而不仅仅是在你学习交易的平台上。一个更好的案例研究侧重于开发人员如何获得自上而下的批准,以重新思考他们公司对数据及其方法的使用,包括大都会人寿引人注目的隐私保护计划和福特使用开源的计划,以使开发人员能够基于大量汽车数据创建新的应用程序。然后获得在通常的新产品限制之外操作的自由。
2.Hadoop仍然没有那么容易实现。在与MetaScale的讨论和Alpine Data Labs的演示中,重点是采用(或至少掩盖复杂性),并使需要答案的业务主管更容易积累、集成和查询非结构化数据。
不幸的是,Hadoop获得了神奇术语的光环,可以满足您所有的数据需求。今年,很明显,Hadoop及其相关模块正在迅速发展成为一个平台,对客户来说非常有吸引力,但它仍然需要平台在企业中成功运行所需的属性。
安全性、易于学习的工具以及与现有公司系统的链接都在不断发展,但尚未完全成熟。Alpine数据实验室产品副总裁Steve Hillion表示,“(Hadoop)将脱离科学项目,开始产生实用且有价值的见解和分析。
郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。
标签: