分析预测
1. 概述
本文为您介绍图表的趋势线、聚类分析、时序预测三种分析方式。支持从多个角度对当前数据进行分析,通过该功能您可以直观了解数据的变化趋势和异常点。
2. 趋势线
有时候为了让图表更加清晰易懂,通常需要为图表添加趋势线,进而辅助分析工作,提高图表的可读性。通过趋势线可以展示当前数据的整体发展趋势。
趋势线类型分为线性、对数、指数和多项式四种,您可根据需要进行选择。
类型 | 说明 |
---|---|
线性 | 适用简单线性数据的最佳拟合直线,表示数据是以稳定的速率增加或减少。 |
对数 | 适用以最佳拟合曲线显示稳定前快速增加或减少的数据值。对于对数趋势线,数据可以包含负数和正数。 |
指数 | 适用曲线显示,以越来越高的速率上升或下降的数据值。对于指数趋势线,数据不应该包含零值或负数。 |
多项式 | 适用数据波动较大时的曲线,可用于分析大量数据的偏差。选择此项后在“度”框中输入一个2到10之间的整数,以确定曲线中出现的弯曲数(峰值数和峰谷数)。如果将“度”设为2,则图表通常只显示一个峰值或峰谷;设为3显示一个或两个峰值或峰谷;设为4最多可显示三个峰值或峰谷。 |
当您的图表满足以下任一条件时,可以添加趋势线。
条件一:X轴和Y轴有至少1个连续度量字段,如下图所示:
我们可以在分析模块进行趋势线的设置,如图所示,这里我们选择“多项式”类型趋势线,并将趋势线的度设置为3。
另外我们可以选择趋势线不受颜色的影响,则会针对所有点计算出1根趋势线,如图所示。
条件二:X轴(Y轴)为连续日期字段,Y轴(X轴)为连续度量字段,如下方示意图所示。
我们在图表的分析模块进行趋势线设置后,效果如图所示。
阅览界面下,鼠标移动至趋势线时,还会出现提示框显示趋势线的相关信息。
3. 聚类分析
给定一组数据点,我们可以使用聚类算法将每个数据点分类到特定的组。理论上,同一组中的数据点应具有相似的属性和/或特征,而不同组中的数据点应具有高度不同的属性和/或特征。例如,您可以打开“聚类”以确定产品何时在特定地理区域非常受欢迎。
(1)您在图表控件的分析面板勾选聚类分析后,系统将根据kmeans++算法对图表上的数据进行分类,会生成“群集”字段,并放置在“颜色”属性区,用不同颜色来区分不同群集;
(2)在分析面板,我们可以设置群集的个数、聚类分析时依据的指标;
(3)点击“聚类详情”后,我们可以看到更详细的描述,并可以对群集进行重命名;
(4)完成聚类分析后,可将自动生成的群集pill生成新的自定义维度字段;
(5)您可利用该新字段绘制其他可视化图表。
4. 时序预测
时序预测通过考虑水平趋势和季节性趋势,对一段时间内、等时间间隔的采样数据进行分析,以预测未来一段时间的数据。即根据已知的历史数据,预测未来的数据。
您在图表控件的分析面板勾选时序预测后,系统将对图表上的数据按照时间预测,并放置在“颜色”属性区,用不同颜色来区分实际值、预测值。
使用前提
预测要求:数据面板上有且只有1个日期字段
日期字段的粒度要求需要满足:年、年—季度、年—月、年—月—日
配置介绍
(1)预测长度:输入要预测的长度,与图表的粒度保持一致,比如图表的粒度是年,用户输入预测的长度为n年
(2)选择预测模型:可选择“趋势”、“季节”模式,可下拉选择“无”、“相加”、“相乘”
无趋势,无季节,使用一次指数平滑
有趋势,无季节,使用二次指数平滑
有季节,无论是否有趋势,使用三次指数平滑
(3)若最后n项数据不完整,可以选择忽略最后n个月数据
(4)数据中存在缺失,但不影响预测,可勾选用零填充缺失值
(5)显示设置:选择是否显示置信区间,提供90%、95%、99%三种
(6)可勾选显示完整预测线,不勾选的情况下如下图所示,只显示预测的趋势线
(7)提示框中显示预测情况
(8)预测详情:点击后显示预测结果的描述详情
取消预测
配置完成后,在“颜色”一栏,放置了一个“预测”的维度字段,移除后,即取消预测