Skip to Content

原文链接:http://scn.sap.com/community/developer-center/hana/blog/2013/02/14/from-harvard-with-sap-hana–a-success-story

前段时间,一位名叫Hung Tran的哈佛学生联系了我。Hung当时正在做一个SAP HANAR 的项目,他需要一些存储过程的指导和帮助。当然,我帮他的时候并不知道这个项目的规模。

过了不久,Hung给了我第一份可以现场测试的演示我当时就被迷住了我从未期望过这样的事情

在我们开始之前,请先允许我介绍下“TEAM4Solutions”,由一群正在做一个非常好的项目的学生组成。

从左至右:Greg Zheng, Hung Tran, Julio Silveira, Michael Chepkwony 和Ryan Talabis.

那么,是什么使得该项目变得如此有趣?他们在项目中使用的技术有:

1.      SAP HANA设备(内存数据库和分析引擎)

2.      SAP HANA Studio(数据建模和管理工具)

3.      R分析引擎和文本挖掘包

4.      基于JAVA的中间件

5.      基于Flex的用户界面

6.      Crystal Reports报表

7.      Active Directory

相当令人印象深刻。为了提供对项目更好的理解,我向团队提了几个问题:

Blag:请告诉我你们团队建立这个项目的初衷。

团队:这个项目是我们哈佛大学扩展信息管理系统毕业设计的课业要求的一部分,旨在向人们展示我们团队可以开发一个设计良好系统的能力,将功能性、技术性和操作性要求考虑到企业环境中。

Blag:你能简短地介绍下应用程序吗?

团队:我们团队创建的应用程序是一个分析型程序,整合并分析不同的结构型和非结构型生产数据。项目的目标是提供一个平台,供用户实时访问、关联以及分析产品问题的数据。具体来说,我们的程序主要集中于以下用例:

  • 提供现场技术人员实时访问问题和解决方案的信息,便于更快地解决产品问题。
  • 根据产品风险率提供用户投诉的主动分析,降低产品召回数量和频率。
  • 提供业务单位中的非结构化数据的分析,如投诉处理、维修报告、知识库、产品文档和质量保证报告。
  • 提供一个帮助台,以及易于搜索相关信息的中央存储库,以协助查询产品和问题。
  • 为不同客户的投诉和问题提供可见性,以促进更好的产品开发和增强。

Blag: 你为什么选择SAP HANA?

团队:选择SAP HANA主要是因为

1.      利用一个内存数据库的性能优势。SAP HANA很明显在这方面是领军人物之一。

2.      利用R语言的内置整合。因为这个项目主要是基于一个分析项目之上,所以R的弹性和广阔的数据挖掘包对这个项目来说至关重要。

3.      在SQL中嵌入R脚本的能力。我们团队认为,这种方法的易用性和灵活性将有助于更高效的开发,并能更容易地加入新的分析功能。

4.      SAP HANA所提供的列式存储结构对于项目中所使用的非结构化数据来说是有利的。

      

       Blag: 你们使用哪家云供应商?

       团队: 亚马逊网络服务。

   

       Blag: 你能谈下你使用SAP HANA的集成R接口的经验吗?

       团队: SAP HANA内置整合的R是本项目中很重要的一点。鉴于项目本身是一个分析和数据挖掘系统,将SQL Script和R脚本结合就使提取和分析数据效率更高。R语言和其中丰富的数据挖掘包、内存运营数据集、以及为非结构化的文本度身定做的数据库环境的结合,使RSAP HANA成为这个项目的理想环境。 在这个项目中,我们团队使用了R中的一个自然语言处理库,从非结构化的数据列中抓取常见语句,这只要几行就能实现。

Blag: 你是怎样在SAP HANA 上实施模糊搜索的?

团队:模糊搜索利用了SAP HANA中内置的文本引擎,这使得它可以在SQL语句中使用。只要同时”,简单地在SELECT语句的WHERE子句中运用“CONTAINS()”函数和“FUZZY”可选项,就可以使用模糊搜索了。由于只是做项目,我们只使用了模糊搜索中最少的可选项。

Blag:你能告诉我你使用SAP HANA, R, FLEXJAVA的整体经验吗?

团队:正如上文提到的,SAP HANA+R对项目来说是很重要的。在电脑及手机的使用中,除了拖曳/下拉功能之外,更多地应用了FLEX以提供干净时髦的外观、以及增加应用的可用性Java主要作为中间件,以便实施可扩展性的解决方案。我们的团队成员已经使用过Flex+ Java以及使用JDBC简单地实现连接到SAP HANA。我们碰到的唯一的问题是如何在HANA中嵌入R,但我们发现Alvaro Tejado Galindo已经写了一个内容非常丰富的教程。

Blag:在什么情况下你会推荐SAP HANA呢?

团队: 我们当然会特别针对分析型的应用推荐SAP HANA。整合了的R框架和内存环境的速度给实时数据分析提供了传统的应用所无法企及的巨大的可能性。

说了很多了。他们的项目被评为学期最佳,这为之后的学期项目提高了标准。

说了这么多之后,我相信你肯定想看一下运行中的应用程序。很高兴,该团队提供了一个视频演示,请欣赏。

视频链接:http://www.tudou.com/programs/view/Xcz17Jer-iU/

To report this post you need to login first.

Be the first to leave a comment

You must be Logged on to comment or reply to a post.

Leave a Reply