亚马逊在 re:Invent 大会上宣布新的机器学习产品

2024-10-10 00:00:29 生活 >
导读 随着许多行业对使用机器学习算法来提高效率和降低运营成本感兴趣,ML 产品已成为大型科技公司之间的主要竞争前沿之一。在过去的几年里,出

随着许多行业对使用机器学习算法来提高效率和降低运营成本感兴趣,ML 产品已成为大型科技公司之间的主要竞争前沿之一。在过去的几年里,出现了各种各样的服务,这些服务促进了不同组织的机器学习模型的创建、培训、微调和部署。

亚马逊也不甘示弱,在今年的 AWS re:Invent 大会上宣布了新的机器学习产品,包括无代码 ML 工具、数据标记平台以及用于优化机器学习模型部署的服务。新工具的好处是双重的。对于没有内部人才和资源来开发自己的 ML 模型的组织,这些工具将使他们有机会开始机器学习并将其数据存储投入生产。对于已经在运行机器学习项目的组织,新的应用机器学习工具将提供提高机器学习开发周期的速度和生产力的机会。

无代码机器学习

亚马逊 SageMaker 画布

对我来说,最激动人心的发布是Canvas,这是 AWS 的机器学习开发平台 SageMaker 的无代码界面。Canvas 是一种可视化工具,可让您无需编写任何代码即可管理整个机器学习管道。如果您对机器学习的元素有基本的了解,您将能够使用 Canvas 创建、训练和测试您自己的模型。

在幕后,SageMaker Canvas 负责处理许多细节,包括清理和整合数据、测试不同的模型和算法以及运行单个或批量预测。

与所有机器学习应用程序一样,在 Canvas 中,您首先要导入数据。Canvas 支持直接从您的计算机上传、存储在 Amazon S3 云中或驻留在数据湖和仓库(如 RedShift 和 Snowflake)中的文件。

如果您导入多个文件,Canvas 会帮助您将它们合并为一个数据集并提取每列的均值、数据类型以及缺失值和无效值等信息。如果您不手动调整它们,Canvas 将自动填充空白。

数据集准备就绪后,您可以通过选择要预测的目标列来创建监督 ML 模型。Canvas 会自动检测您需要的机器学习任务类型(二元/多类分类、回归)。它还提供重要信息,例如每个数据集列与目标值的相关性,这对于降维和模型优化非常有用。

在准备好数据和目标后,Canvas 开始训练数百个不同的 ML 模型,测试不同的算法和超参数,直到找到问题的最佳解决方案。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

热门文章

热点推荐

精选文章