1. 概述

本文为您介绍图表的趋势线、聚类分析、时序预测三种分析方式。支持从多个角度对当前数据进行分析,通过该功能您可以直观了解数据的变化趋势和异常点。

2. 趋势线

有时候为了让图表更加清晰易懂,通常需要为图表添加趋势线,进而辅助分析工作,提高图表的可读性。通过趋势线可以展示当前数据的整体发展趋势。

趋势线类型分为线性、对数、指数和多项式四种,您可根据需要进行选择。

类型 说明
线性 适用简单线性数据的最佳拟合直线,表示数据是以稳定的速率增加或减少。
对数 适用以最佳拟合曲线显示稳定前快速增加或减少的数据值。对于对数趋势线,数据可以包含负数和正数。
指数 适用曲线显示,以越来越高的速率上升或下降的数据值。对于指数趋势线,数据不应该包含零值或负数。
多项式 适用数据波动较大时的曲线,可用于分析大量数据的偏差。选择此项后在“度”框中输入一个2到10之间的整数,以确定曲线中出现的弯曲数(峰值数和峰谷数)。如果将“度”设为2,则图表通常只显示一个峰值或峰谷;设为3显示一个或两个峰值或峰谷;设为4最多可显示三个峰值或峰谷。

当您的图表满足以下任一条件时,可以添加趋势线。

条件一:X轴和Y轴有至少1个连续度量字段,如下图所示:

我们可以在分析模块进行趋势线的设置,如图所示,这里我们选择“多项式”类型趋势线,并将趋势线的度设置为3。

另外我们可以选择趋势线不受颜色的影响,则会针对所有点计算出1根趋势线,如图所示。

条件二:X轴(Y轴)为连续日期字段,Y轴(X轴)为连续度量字段,如下方示意图所示。

我们在图表的分析模块进行趋势线设置后,效果如图所示。

阅览界面下,鼠标移动至趋势线时,还会出现提示框显示趋势线的相关信息。

3. 聚类分析

给定一组数据点,我们可以使用聚类算法将每个数据点分类到特定的组。理论上,同一组中的数据点应具有相似的属性和/或特征,而不同组中的数据点应具有高度不同的属性和/或特征。例如,您可以打开“聚类”以确定产品何时在特定地理区域非常受欢迎。

(1)您在图表控件的分析面板勾选聚类分析后,系统将根据kmeans++算法对图表上的数据进行分类,会生成“群集”字段,并放置在“颜色”属性区,用不同颜色来区分不同群集;

(2)在分析面板,我们可以设置群集的个数、聚类分析时依据的指标;

(3)点击“聚类详情”后,我们可以看到更详细的描述,并可以对群集进行重命名;

(4)完成聚类分析后,可将自动生成的群集pill生成新的自定义维度字段;

(5)您可利用该新字段绘制其他可视化图表。

4. 时序预测

时序预测通过考虑水平趋势和季节性趋势,对一段时间内、等时间间隔的采样数据进行分析,以预测未来一段时间的数据。即根据已知的历史数据,预测未来的数据。

您在图表控件的分析面板勾选时序预测后,系统将对图表上的数据按照时间预测,并放置在“颜色”属性区,用不同颜色来区分实际值、预测值。

使用前提

预测要求:数据面板上有且只有1个日期字段

日期字段的粒度要求需要满足:年、年—季度、年—月、年—月—日

配置介绍

(1)预测长度:输入要预测的长度,与图表的粒度保持一致,比如图表的粒度是年,用户输入预测的长度为n年

(2)选择预测模型:可选择“趋势”、“季节”模式,可下拉选择“无”、“相加”、“相乘”

  • 无趋势,无季节,使用一次指数平滑

  • 有趋势,无季节,使用二次指数平滑

  • 有季节,无论是否有趋势,使用三次指数平滑

(3)若最后n项数据不完整,可以选择忽略最后n个月数据

(4)数据中存在缺失,但不影响预测,可勾选用零填充缺失值

(5)显示设置:选择是否显示置信区间,提供90%、95%、99%三种

(6)可勾选显示完整预测线,不勾选的情况下如下图所示,只显示预测的趋势线

(7)提示框中显示预测情况

(8)预测详情:点击后显示预测结果的描述详情

取消预测

配置完成后,在“颜色”一栏,放置了一个“预测”的维度字段,移除后,即取消预测