Select Language

AI社区

AI技术百科

482浏览
0点赞

没有免费的午餐定理(No Free Lunch Theorem,简称 NFL)

我们经常听人谈论“什么算法更好”或者“A算法比B算法好”这样类似说法,其实这样的说法忽略了一个前提,那就是在解决某一个具体的问题(任务)上。为什么这么说呢,因为如果考虑所有潜在的问题,所有的学习算法都一
351浏览
1点赞

什么是欠拟合与过拟合?

我们希望通过机器学习学得的模型的泛化能力比较强,直白来说就是使得学得的模型不仅仅在在训练样本中工作得很好,更应该在新的样本中工作很好。通常我们把分类错误的样本数占总样本数的比例称为错误率(error rate)
318浏览
1点赞

7个重点的机器学习的方法

机器学习里面究竟有多少经典的算法呢?在这个部分我会简要介绍一下机器学习中的经典代表方法。这部分介绍的重点是这些方法内涵的思想,数学与实践细节不会在这讨论。  1、回归算法  在大部分机器学习课程中,回
395浏览
2点赞

结构风险最小化 Structural Risk Minimization

结构风险最小化(Structural Risk Minimization)是指把函数集构造为一个函数子集序列,使各个子集按照VC维的大小排列;在每个子集中寻找最小经验风险,在子集间折中考虑经验风险和置信范围,取得实际风险的最小化。即SR
289浏览
0点赞

宽度模型 (wide model)

一种线性模型,通常有很多稀疏输入特征。我们之所以称之为“宽度模型”,是因为这是一种特殊类型的神经网络,其大量输入均直接与输出节点相连。与深度模型相比,宽度模型通常更易于调试和检查。虽然宽度模型无法通过
225浏览
0点赞

权重 (weight)

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。
233浏览
0点赞

验证集 (validation set)

数据集的一个子集,从训练集分离而来,用于调整超参数。与训练集和测试集相对。
291浏览
0点赞

非监督式机器学习 (unsupervised machine learning)

训练模型,以找出数据集(通常是无标签数据集)中的模式。非监督式机器学习最常见的用途是将数据分为不同的聚类,使相似的样本位于同一组中。例如,非监督式机器学习算法可以根据音乐的各种属性将歌曲分为不同的聚类
236浏览
0点赞

无标签样本 (unlabeled example)

包含特征但没有标签的样本。无标签样本是用于进行推断的输入内容。在半监督式和非监督式学习中,无标签样本在训练期间被使用。
898浏览
0点赞

真正例率(true positive rate, 简称 TP 率)

是召回率的同义词,即:真正例率 = 真正例数 / ( 真正例数 + 假负例数 )真正例率是 ROC 曲线的 y 轴。
240浏览
0点赞
258浏览
0点赞
244浏览
0点赞
222浏览
0点赞
282浏览
0点赞

时间序列分析 (time series analysis)

机器学习和统计学的一个子领域,旨在分析时态数据。很多类型的机器学习问题都需要时间序列分析,其中包括分类、聚类、预测和异常检测。例如,您可以利用时间序列分析根据历史销量数据预测未来每月的冬外套销量。
243浏览
0点赞
238浏览
0点赞
233浏览
0点赞
265浏览
0点赞
我要发帖
机器学习术语表
2021-05-15 22:22:51加入圈子
  • 171

    条内容
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。