微软在其支持文档中将这项技术描述为分布式技术 允许您实时处理数据
在纽约举行的Strata Hadoop世界大会上,微软升级了其云分析游戏,在该公司基于云的Hadoop发行版HDInsight中宣布支持Apache Storm,这是一个受欢迎的开源大数据处理平台。该公司副总裁TK Rengarajan宣布:“今天将提供预览,我们将在HDInsight中支持Apache Storm,这样我们的客户就可以使用完全托管的Hadoop服务,以近乎实时的方式处理来自其物联网设备的数百万条Hadoop数据。”在10月15日的一份声明中,微软数据平台总裁。“通过将实时分析引入HDInsight,我们正在探索新的客户场景,例如实时分析运营数据以进行预测性维护的能力。”
Apache Storm是一个开源项目,可以实时处理大型数据流。微软将这项技术描述为“一个分布式、容错、开源的计算系统,允许你实时处理数据。”。Storm解决方案还可以提供有保证的数据处理,并具有重放数据的能力。第一次未成功处理。"
根据Apache软件基金会的说法,Storm做的是“实时处理,而Hadoop做的是批处理。”Twitter、Spotify和阿里巴巴等公司目前正在使用Storm来帮助满足他们的大规模数据处理需求。
随着今天的宣布,微软也加入了这一趋势。Rengarajan表示:“HDInsight中风暴的预览版将延续微软对Hadoop生态系统和HDInsight的投资。”
HDInsight Storm可以作为Azure中的托管集群使用,也可以集成到其他Azure服务中。微软解释说:“例如,Storm可能会使用来自ServiceBus队列或事件中心等服务的数据,并使用网站或云服务来提供数据可视化。”
除了实时大数据分析,微软还希望客户使用HDInsight Storm来支持他们的在线机器学习。
根据HDInsight Storm的常见问题,“Storm可以与之前通过批处理训练的机器学习解决方案一起使用,例如基于Mahout的解决方案,”Apache的机器学习和数据挖掘项目。“然而,它的通用分布式计算模型也为基于流的机器学习解决方案打开了大门。”
Azure HDInsight Storm支持。NET、Java和Python。微软承认,尽管Storm支持其他语言(任何基于Apache的编程),但启用其他编程支持将需要更改HDInsight集群配置。
在相关消息中,微软透露,Hadoop提供商Hortonworks的大数据软件平台将具备微软Azure集成功能。公司的Azure机器学习生态系统也新增了一些功能,包括推荐引擎、异常检测服务和一批R包(数据科学家的首选编程语言)。
Rengarajan说:“这些公告以及我们参与[Strata Hadoop World]活动,是我们通过利用云的功能、灵活性和规模为每个人带来大数据的承诺的一部分。”
郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。
标签: