SAP HANAプラットフォーム エバンジェリストの松舘です。

 

SAP ERPに代表される基幹系業務データと、昨今話題のビッグデータ分散フレームワークHadoopのデータを連携したいというニーズがあるかと思います。

 

しかし、ERPのデータはデータベースに格納されているためSQLを使ってアクセスする必要があり、一方で、Hadoopで分析を行っているデータサイエンティストはScalaやRといったオープンソース言語を日々扱っています。両者がデータのやり取りを行おうと思うと、ERP管轄のITに依頼したり、一筋縄ではいかないのが現実です。

 

そこで、SAPは、このERPとビッグデータを結びつけるべく、SAP HANA Voraをリリースしました。

 

SAP HANAの特徴はインメモリのリアルタイムプラットフォームです。Hadoopの高速分散フレームワークとして、インメモリのSparkがあります。

 

SAP HANA Voraは、このSparkのプラグインとして動作するため、両者でインメモリ環境が活用できます。

 

/wp-content/uploads/2016/04/276931_jpg_adapt_450_255_false_925970.jpg

 

Hadoopにビジネス分析の機能を

 

Hadoopの世界では、基幹系で格納され分析される売上のデータなどのように階層構造で格納されているケースはほとんどなく、データの階層を深掘り(ドリルダウン)や分析軸の切り替え(スライス&ダイス)といった、ビジネスデータの分析では当然のように行われているOLAP分析を行うことができません。

 

SAPの代表的なセンサーデータの事例である、F1チームマクラーレンの事例を考えてみても、センサーといっても、車体から、エンジンユニット、タイヤユニット、末端のブレーキテーブルの温度センサやタイヤの摩耗センサーまで、階層構造になっていることに気がつきます。

 

そこで、SAP HANA Voraは、上記で説明した両プラットフォームをつなぐだけではなく、以下の機能をSparkに対して提供します。

 

  • Hadoopデータに対する階層機能の提供
  • OLAPモデラーによるモデリング *SAP HANA VORA1.2新機能
  • Hadoopデータへの通貨換算・数量単位変換(将来リリース対応予定)

 

Sparkに対して、上記のビジネスデータ分析に必須の機能を提供することにより、Sparkのパフォーマンスを損なうことなく自然なビジネス分析を可能にします。

 

また、言語に関しても、RおよびScalaの文法で直接SAP HANAのデータにアクセスできるため、新たな言語スキルを習得する必要がありません。

 

すべてのHadoopディストリビューションに対応

 

SAP HANA Voraは、以下の代表的なHadoopの商用ディストリビューション(アルファベット順)に対応しています。インストーラも各ディストリビューションごとに用意されていため、既存のHadoopクラスタに追加してインスールが可能で、各社のGUIの管理ツールのコンポーネントとして追加が可能です。

 

  • Cloudera
  • Hortonworks
  • MapR Technologies *SAP HANA VORA1.2新機能

 

外部ストレージ

  • Amazon S3

 

SAP HANA VoraのDeveloper版(英語版のみ)を提供しています。

すぐ触ってみたい方はぜひご登録ください。

 

SAP HANA Vora Developer Edition – YouTube

 

※Amazon EMRを利用

 

SAP HANA Vora 1.2の新機能については、以下のブログもご参照ください。

 

Introducing SAP HANA Vora1.2

To report this post you need to login first.

Be the first to leave a comment

You must be Logged on to comment or reply to a post.

Leave a Reply