视频长度为 53:51

小迈步之 MATLAB 数据科学系列讲座(一): 使用AutoML和模型可解释性打破机器学习应用壁垒

概览

随着大数据时代的到来,机器学习在各行各业的应用都越来越广泛,包括医疗诊断、预测性维护、能源生产等领域,科研工作者和工程师可以借助机器学习从数据中发掘规律和模式,从而更好地制定决策,然而较高的理论要求对领域专家和工程师带来诸多应用上的挑战。

MATLAB提供了一系列工具简化机器学习工作流,帮助您更快更好地进行数据分析与建模。您可以选择分类学习器和回归学习器App进行交互式操作,也可以使用AutoML技术进行自动化机器学习。此外,MATLAB中还包含诸多成熟的方法实现模型可解释性,如LIME、Shapley值等来帮助您打破机器学习的黑盒,验证模型的预测是否正确,找出训练期间的模型偏差。

本次讲座将通过实例演示,介绍MATLAB在机器学习中的功能和优势,包含如下亮点:

  • 机器学习全工作流简介
  • 使用分类和回归 App,交互式训练模型
  • 使用自动机器学习 AutoML,进行特征选择和超参数调优等
  • 基于不同方法进行模型可解释性分析

背景知识

MATLAB® 统计与机器学习工具箱提供了一系列函数和 App,可用于数据描述、分析和建模。工具箱提供了有监督、半监督和无监督机器学习算法,包括支持向量机 (SVM)、提升决策树、浅层神经网络、k 均值和其他聚类方法。针对多维数据分析和特征提取,工具箱还提供了主成分分析 (PCA)、正则化、降维和特征选择方法,让您能够识别预测能力最强的变量。

关于演示者

陈炜博士,MathWorks 中国高校团队工程师,负责高校教学与科研方面的支持,毕业于吉林大学与澳大利亚斯文本科技大学。博士期间研究方向为多功能材料的拓扑优化,曾在力学专业期刊发表多篇学术论文。

录制日期: 2022 年 9 月 27 日