Candidate是什么

Candidate是什么参考了网上的一些博客以及文章,并没有得到很满意的解释,这里说一说自己对Candidate的理解Candidateclass,中文译为“候选集”,其作用是作为一种特殊的训练集而存在

参考了网上的一些博客以及文章,并没有得到很满意的解释,这里说一说自己对Candidate的理解

Candidate class,中文译为“候选集”,其作用是作为一种特殊的训练集而存在。

首先看candidate class的定义:

候选集是一种特殊的训练集,换而言之,是训练集的子集。数据处理的过程,为了满足一些特殊条件而分化出来的子集,用于训练起到了加强样本特征的作用。

在分化出candidate class的过程中,数据处理者需要对原始的数据进行一些处理,为了模型的训练效果更好,需要额外筛选出一部分数据。候选集的诞生时间一般是在数据处理之后,特征工程之前。

Candidate是什么候选集还强调一定程度的覆盖率,覆盖率 = 候选集样本数量/总体样本数量。

这里再讲讲正样本、负样本的理解

正样本就是你需要的,需要依托这种样本来训练出你的模型,对你的模型的训练有正向帮助的样本

负样本就是你不需要的,对你最终要训练出的模型有bad performance,或者说跟你要训练的目标根本不想关的样本

那么是不是负样本就应该在训练的过程中消失掉呢?

NO!因为在做真实环境下应用的场景,负样本是不可能避免的。

eg:

在做CNN进行猫狗识别的模型训练过程中,有价值的训练数据是猫或者狗图形所占的像素点,没有价值的训练数据类似于背景环境等等,会对模型的训练有一定的干扰(因为真实的猫狗所存在的环境,什么场景都有可能,房间啦,花园啦等等)。所以还需要一定的负样本来对模型进行辅助的训练

今天的文章Candidate是什么分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/63197.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注