您的位置:首页 >房产频道 > 科技 >

这是OLAP的时代吗?

导读 曾经,分析是商业智能的同义词,商业智能是OLAP在线分析处理的同义词。这个词的意思是与更常见的在线事务处理(OLTP)形成对比,涉及到创建多

曾经,分析是商业智能的同义词,商业智能是OLAP在线分析处理的同义词。这个词的意思是与更常见的在线事务处理(OLTP)形成对比,涉及到创建多维“立方体”而不是二维表。每个维度都是不同的类别,用于对数值数据进行深入分析,称为测量。

现在你在BI101上了速成课,看看很多像Tableau这样的分析产品,你会发现维度和度量的范式是活的。OLAP从未消亡,尽管它的底层技术经历了一些变化。

然而,OLAP一直困扰着它的可扩展性。大多数OLAP服务器运行在一台功能强大的服务器上,这限制了可以实现的并行性,从而对数据量施加了事实上的限制。达到这些可扩展性限制的客户可能会考虑使用大数据技术,如Hadoop和Spark,但这些客户通常不会采用OLAP用户使用的维度范式。

怎么办?嗯,一些供应商已经决定采用Hadoop和Spark,并使用它们作为平台,在这些平台上运行和构建大型OLAP立方体。供应商,即AtScale、Kyvos Insights和Arcadia Data,对部分企业的大数据采用模式进行了研究,发现这一趋势已经停滞。他们的方法是让这些企业的员工在他们觉得舒适的OLAP环境中工作,同时利用他们的Hadoop集群。

AtScale首席执行官大卫?马里亚尼是微软几个最大的OLAP项目(雅虎和克劳特)的幕后黑手。尽管他可以在微软的OLAP平台——SQL server analysis Services(SSAS)上做大事,但他确实克服了可伸缩性的限制,包括立方体再处理时间长达一周。他创建一个更灵活的OLAP平台的动机非常明确,所以他建立了AtScale。

有三种方法可以让商业智能客户端看起来像是SSAS立方体。因此,兼容性高.同时,在查询AtScale多维数据集的度量和维度时,AtScale会生成相应的SQL查询,以从Hive和Spark SQL中的底层表中获取数据。从这个意义上说,AtScale在Hadoop中存储的表上实现了一种ROLA P(关系OLA P)。

如果是你想要的物理立方体,但你仍然想要Hadoop的分布式处理和存储,Kyvos Insights的产品可能会吸引你。它实现了一个持久的多维数据集,作为底层数据的维度缓存,并通过存储的聚合来完成。立方体本身由几个“长方体”组成,Kyvos称之为“长方体”,每个立方体都存储在集群中不同的节点上。

如果你想熟悉OLAP,你不需要显式地建模一个立方体。在进行任何分析之前,定义所有的度量和维度?然后,您可以查看ArcadiaData,它允许您执行特定的分析,生成引擎可以查询的派生结构(实际生成的立方体)。然后,您可以将这些派生结构的设计细化为完整的多维数据集,并且始终可以使用更传统的模型优先方法来设计多维数据集。阿卡迪亚还提供了自己的可视化设施,而不是使用其他BI工具作为前端。

目的地还是过渡期?有一系列选项,其中任何一个都肯定会帮助那些努力采用Hadoop的组织。然而,尽管这些技术确实有助于使用熟悉的OLAP方法进行分析并克服其规模限制,但它们并不能指导客户在其本地“栖息地”使用Hadoop和Spark。

有些客户可能觉得这是好事。其他人可能认为这些产品是一种过渡技术,在一段时间内会有用。在过渡期间,员工可以习惯使用非结构化数据,并在建模之前对其进行分析,而不是相反。其他客户可能希望以更“本地化”的方式与大数据公司合作。最重要的是用户得到的功能,企业得到的投资回报,以及两者共同产生的结果。

爆料:我工作的公司Datameer提供了一个没有OLAP隐喻的使用大数据的商业用户工具和平台。

免责声明:本文由用户上传,如有侵权请联系删除!