Additional Blogs by SAP
cancel
Showing results for 
Search instead for 
Did you mean: 
Former Member
0 Kudos

          刚刚过去的2012年互联网电商应该算是既得名又得利的一年,几家电商的价格战在“双十一”烧到了一个小高潮,阿里系单日成交额191亿人民币,其中天猫132亿,淘宝59亿,这几个数字都不仅创下了新的记录,并且以同行都敬佩的成绩开拓了人们的视野和想象空间。未来的几年,互联网电商又会如何发展,以京东商城、当当网为代表的零售类电商,以携程、艺龙、驴妈妈、去哪儿等为代表的在线旅游服务类电商,以大众点评、到到网等为代表的内容服务电商等又会如何发展也是我对今年关注的重点。 


          在过去的几年里,有一类应用特别引起我的关注,那就是“个性化推荐”,在很多以上提到的电商的产品宣传,产品销售页面中都有一类属于“商家推荐”,有的叫做“猜你喜欢”,有的网站叫做“为你推荐”,“为你精选”……等等。


          电商的推荐通常按照难易程度和有效程度,有:基于群体性的行为分析的推荐,例如:根据其他用户也看了这款商品后还看了什么(简称为“看了又看”),来猜你也可能喜欢的商品。以京东商城上一款399元的ACA品牌面包机为例,我们可以看到浏览这一款面包机的用户一般会相关浏览围绕做面包所需的一系列商品,如电子秤,打蛋器,电烤箱等,也可能在面包机类别中浏览其它品牌和价位的商品。



          也有基于其他用户浏览了这款商品后最终购买了什么(所谓的“看后买”),来引导用户参照其他用户的行为来做出购买的决定。在上面的面包机的案例中,我们看到用户最终选择在同品牌、相似价位上的可能性较大,也有选择了稍低价位的其他品牌产品。



          在用户购买的决定做出之后,仍然存在交叉销售的各种机会,给用户推荐面包机以外的周边商品就成了电商最应该使用的一类推荐原则。 


 

         

     这样的推荐在大数据的层面已经是一个不小的挑战,为了统计出这些相关比例,就必须搜集并保留所有用户的所有行为,不仅是购买行为,还包括购买动作以前的浏览行为、讨论行为、关注行为、比价行为、加入购物筐(但没有付款)等等细粒度的行为。我们从日常生活中就可以体会到,一个真正的购买行为之前会有大量的、看似无序的浏览行为,这是一个消费者决策之前正常的信息收集、被教育、验证、比对、比价等等过程,还可能夹杂着大量站外的、非结构化的(语音、图像、视频)的信息。这些信息如果都搜集存储起来,并加以分析利用,当然会是一个有效的推荐的数据基础。


     从大数据的4个V的角度来看,首先挑战的就是Volume(数据量),这里有令人难以想象的数据量,据专业从事个性化推荐的睿广智能科技公司(http://www.ruiguangtech.com/) CEO郭曦(@睿广智能郭曦)透露,一个类似驴妈妈(http://www.lvmama.com/)这样的旅游网站,每天大约28万UV,228万PV(参照http://alexa.chinaz.com/?domain=lvmama.com),每天产生的用户行为信息经过加工就超过GB,一年将近500GB,为了真正掌握用户的行为基因,必须搜集跟踪用户几年的行为信息,这样一个中型网站的行为数据量就至少有TB级,而像京东商城或者阿里巴巴系的超大型电商的数据量更是轻易上百TB,在这样的数据量规模上进行数据管理和对数据进行多层次、多维度的统计、汇总、分析对数据库的挑战是极高的。

     其次对Variety(数据种类)也有明显的挑战,一旦把类似微博、微信等社交媒体里面的信息,到到网、图钉一类的位置信息拿进来,数据量又会上一个量级,分析使用的复杂度亦会成倍增加。正因如此,目前对个性化推荐来说,真正有效使用这类非结构化信息的电商几乎没有。


     Value(价值)是整个基于用户行为分析的个性化推荐的核心所在,也是大家追求的目标。


     Velocity(速度)是一个变数,大多数的个性化推荐对速度的要求不高,但是其实如果想真正捕获最优的销售机会,速度是相当重要的。假设你了解到用户的喜好是某品牌的冰激凌,也了解到该品牌冰激凌刚好在打折促销,当然提前通过短信、邮件的方式通知相关的客户是常用的方法,但是不如实时掌握用户恰好在冰激凌店附近的时机进行实时促销更好。我们见过很多案例,促销短信和邮件的内容非常吸引人,但是我已经离开了那家冰激凌店,也不可能因为哪怕是买一送一的促销而专程赶过去,这次明明是优秀的促销就被浪费了。


     这就是大数据的技术对电商领域个性化推荐业务的重要性。

但是以上的推荐完全不能称为“个性化”,因为这些推荐背后是基于一个集体行为的总结,只是把现在浏览一款商品的人归类为“可能购买这款商品的人群”中,对该个体的重要的人文特征(Demographic),如:性别、收入状况、婚否、有无子女、家庭几口人、兴趣、爱好、消费能力等等,没有任何考虑。这类推荐只能算做电商个性化推荐中的初级阶段,初级性经常表现在出错或者不准确性上。


     例如:以某旅游网站团购的一款酒店为例,用户关注的维度可能有很多,例如:价格、原价格、折扣、节省金额、已售出份数、地点、品牌、可否退款等等。例如:对花园饭店2990元一晚降价到558元感兴趣的用户,为什么你会认为他对6公里以外,原价1840元/晚降到350元晚的银河宾馆,或者2.1公里以外,138元/晚的久悦商务酒店感兴趣呢?


          又如:某零售电商的网站仅仅因为过去的浏览历史为:

就推断他感兴趣的是:

          这样的简单基于用户过去行为而做的判断明显地是不准确而且经常是可笑的,这样的“个性化推荐”多了,给用户的体验往往起到适得其反的作用,倒不如拿这些宝贵的页面空间去做简单的商品关联推荐了。


          下一期,我来谈谈一个好的个性化推荐可以做到怎样。