跳转到主要内容

有一天,我的同事问我,他应该如何做一个快速预测模型而不是Excel,并产生比线性回归或Excel图中的那些简单方程更好的结果。这是我的答案。

TableCurve 2D (Image by author)

 

Sigmaplot很早以前就推出了这个软件。它已被广泛用于在数据中寻找最佳曲线拟合。运行时间很快,方程数量也相对较高(5.01版本中有3500多个方程)。与Python和其他复杂的软件相比,用户界面对初学者来说非常容易。只需上传任何支持格式(xls、dat、txt、sys等)的数据,只需单击一次,软件就会自动尝试拟合所有可用的公式(包括您可以生成的自定义公式),并将其报告为按R^2值排序。

这套软件有两个主要部分。第一个是TableCurve2D,用于建模两个变量,另一个是TableCurve3D,用于建模三个变量。

TableCurve3D (Image by author)

不幸的是,对于超过3个变量的数据集,不可能在人类可以看到的图表中可视化数据。也许,这就是他们不为4或5个变量开发进一步应用程序的原因。此外,该曲线拟合软件往往会对数据进行过度拟合,因为它有太多复杂的方程需要尝试。此外,它无法在训练和测试数据集之间分离(如果需要,您需要手动进行)。尽管如此,如果使用模型来预测因变量在模型范围内的新数据,结果通常是准确的。

这也不是开源软件,但它的成本非常低。它还提供有限的免费试用期。只需一次性购买500美元,您就可以获得快速分析和良好的模型拟合结果。曲线拟合图形易于理解,并且在不同的方程之间进行比较非常有效。

Snapshot of prediction and analytic work from Power BI (Image by author)
Visualization generated from the line chart and Key Influencer in Power BI (Image by author)

Microsoft Power BI是一款功能强大的交互式数据可视化软件。他们最近刚刚嵌入的一个模块是进行简单预测的能力和告诉关键影响者的能力。通过插入数据并点击几下,结果非常惊人。还有一些可用于预测区间的调整,例如调整置信水平或季节性参数。

Adjustment for the prediction confidence interval and seasonality (Image by author)

虽然您可以调整的建模参数不多,但如果使用Power BI,结果相对不错,而且为任何分析师进行分析都非常简单快捷。

据betterbuys.com报道,Power BI有三个定价计划。

  • Power BI Desktop:此产品对任何单个用户都是免费的,包括数据清理和准备、自定义可视化以及发布到Power BI服务的功能。
  • Power BI Pro:Pro计划每月花费9.99美元/用户。它包括数据协作、数据治理、构建具有360度实时视图的仪表板,以及在任何地方发布报告的能力。用户可以在购买订阅前免费试用60天。
  • Power BI高级版:高级版计划每个专用云计算和存储资源每月4995美元起。
Forecasting from TIBCO Spotfire (Image from the official Spotfire blog)

作为Power BI的主要竞争对手,TIBCO Spotfire也提供了良好的预测功能。只需点击几下,就可以轻松设置预测线和曲线。然而,由于其高昂的许可成本,我没有尝试过那么多,但他们的官方博客“一键预测”是一个非常好的探索来源。

关于价格,TIBCO提供30天的免费试用期。之后,费用从每月25美元到125美元不等,具体取决于您可以选择的套餐。官方网站在这里。

KNMIE Overview snapshot (Image by author)

KNIME Analytics Platform是一款开源应用程序,专为数据科学工作而构建,无需任何编码技能。它可以从Python或R等CUI(编码用户界面)转换为GUI(图形用户界面),这对不具备编码技能的人来说更友好。它只需拖放即可作为图标使用。然后,工作就可以简单地开始了。与上面的快照一样,csv阅读器图标将在KNIME中执行此任务,而不是用Python编写“pd.read_csv()”。

我非常喜欢KNIME的一个好处是,它允许用户对参数调整进行建模,因此它可以帮助初学者学习如何真正有效地建模。与Power BI和Spotfire不同,KNIME中的模型参数调整可以像R或Python中一样进行自定义。尽管与Python或R相比,KNIME不太受欢迎,但专业人士在实际项目中使用KNIME。KNIME还有大量的支持库,您可以下载、安装并像Python或R一样使用它。这个youtube链接中提供了KNIME的良好教程。此外,他们的博客有人回答你的问题。

总之,您可以选择的每个软件选项都有优缺点。这完全是基于我的意见。它们的一些功能对于快速评估非常有用,我已经在现实世界的项目中使用了它们,这取决于我完成项目所需的情况和可用时间。如果你有空的话,所有这些都值得一试。如果你对此有任何建议,请随时告诉我。

Image by author