利用SAP HANA和Hadoop给大数据分析涡轮增压[翻译后转载]
原文链接:https://www.experiencesaphana.com/docs/DOC-2125
对于能源效率的古老答案是“测量和管理”。一旦我们确定一个人或一个建筑用了多少能源,那么消耗就可以减少。当大量能源数据从传感器,智能仪表等设备出现,利用好整个能源数据需要大数据工具,作为一个根本的途径来帮助管理能源消耗。一些公共事业公司已经转向大数据工具,通过在能源数据上运行大量的分析来提供能源效率的关键方面。
为什么关于能源的大数据重要
电网开始增加更多信息,使计算机、传感器、智能仪和软件能够收集有关消耗、可用的洁净能源以及能源效率的能源数据。
有效能源计划的第一步是安装每15分钟可以读取能源消耗的智能电表。随着这些设备的传播,他们会生成共用事业公司可以使用的数据,从而更好地网络上的负载并且执行先进的预测分析。
多年以后,当电网完全数字化,会有大量能源数据帮助管理能源效率。管理如此巨大的数据量需要利用下一代大数据工具。
SAP HANA和Hadoop作为大数据工具
SAP HANA和Apache Hadoop框架结合的能力,使得客户可以用SAP HANA快速部署数据分析解决方案,同时也利用Hadoop进行海量数据处理、存储和大数据分析所需要的计算能力。
企业已经使用Hadoop生态系统来研究社会媒体内容、博客以及其他点击流数据,并从中获益,因为它可以处理字节信息,而这在任何传统数据库上处理通常是有挑战性的。
SAP HANA另一方面将数据存在内存里而不是在磁盘一级,这带来了巨大的性能提高。
因此,Hadoop可以被用作一种存储机制,其数据可以被SAP HANA高速分析。SAP HANA与Hadoop的结合可以几乎无穷尽地衡量一个企业的需求。
该集成架构的优势:
- 大数据集成能力
- Hive和Hadoop分布式系统为“读取”和“加载”提供了更快的性能和可扩展性
- 大数据应用和分析(分析更多历史数据)
- 数据密集的分布式应用
- 通过执行语言分析以及从文件、网络日志、社会媒体提取相关内容来分析各种数据源
- 允许企业可以在一个大型Hadoop数据簇中采用非结构数据,赋给它结构,然后将它提高到一个HANA的数据库,交易可以快速访问
- 让人和企业可以更有效地一起工作,允许他们有大量数据并且收到实时决策信息
【参考视频】
SAP HANA和Hadoop的结合赢得客户、提供创新、以及驱动卓越