自动化机器学习平台

产品介绍:

机器学习与人工智能技术目前已经广泛应用在各个行业,然而机器学习和人工智能技术门槛较高,目前主要依赖专业人员的人力和经验。数据分析人员不仅要熟练掌握和使用各种算法模型,而且还要熟悉每个算法的超参数调优技巧。因此,即使是专业人员,分析建模和调参也是十分费力费时的工作。为此,目前国际上出现了自动化机器学习(AutoML)研究热潮,即用机器去自动化地完成模型选择和超参数调优,让模型设计自动化,替代人工方式进行模型设计的过程,从而大量节省人力,降低机器学习算法设计的门槛,提高建模的效率。

本产品提供了一个端到端的AutoML算法和系统,支持机器学习流水线自动化设计, 能够自动化地构建涵盖数据预处理、特征工程、算法选择、超参调优、模型评估等多个阶段的全流程数据分析模型。本产品在不需要数据分析人员干预的情况下,能够自动化地设计一个性能接近甚至超越人工设计算法的算法模型。

产品功能:
  • ● 机器学习流水线自动化设计:

    能够自动化地设计机器学习流水线,包含数据预处理、特征工程、算法选择、模型评估等阶段,全程自动化,无需数据分析人员参与。

  • ● 机器学习任务多样化:

    支持多种常见的机器学习任务,包括分类任务(二分类、多分类、多标签分类)、回归任务、聚类任务等。

  • ● 超参数调优:

    不仅支持传统机器学习模型的超参数调优,而且也支持面向深度神经网络的超参数调优。

  • ● 计算平台无关的算法接入层:

    用户可以灵活地接入不同计算平台下的算法,如scikit-learn、Spark MLlib、TensorFlow等。用户也可以接入自定义的算法模型作为AutoML过程中可选的算法模型。

  • ● 元学习:

    无缝对接元学习,实现模型选择阶段的热启动,加速模型选择过程,提升AutoML效率。

  • ● 集成学习:

    对性能Top-K的模型进行集成学习,降低过拟合风险,提升AutoML的稳定性。

产品界面:
产品优势:
  • ● 较好的预测性能:

    采用基于强化学习的三阶段AutoML策略。与基于贝叶斯优化的方法相比,该产品在公开通用的数据集上能取得更好的预测性能,其性能已也得到华为等公司的测试和认可。

  • ● 支持丰富的业务场景:

    不仅能够支持二分类、多分类、多标签分类等各种分类业务场景,同时也支持回归分析和聚类分析场景。

  • ● 易用的高层API

    通过设计高层抽象API编程接口减少编程的复杂性,进而提升系统的易用性。

  • ● 可扩展性:

    通过计算平台无关的算法接入层,用户可以灵活地接入不同计算平台下的算法,提升系统可扩展性。

  • ● 灵活易配置:

    用户可以快速灵活的配置机器学习流水线上每个阶段可选的算法,以及每个算法的超参数取值类型和范围。

  • ● 全面的模型评价指标:

    针对特定业务场景,如分类、回归及聚类,提供了更加全面的模型评价指标。用户可以灵活地选择合适的评价指标开展AutoML。

产品示例图:
使用场景:

大适用于AI需求大,但受限于AI较高的技术门槛,导致AI模型开发周期长或者AI模型预测性能差的企业。通过本产品,可以降低AI门槛,使得普通的数据分析人员也能享受AI带来的红利。

应用案例:

华为,360