首頁 » 如果没有数据点高于某个

如果没有数据点高于某个

在标记几次迭代之后,根据特征分布, exploration 策略通常会变得 如果没有数据点高于  越来越没用,因为我们已经探索了大部分密集区域。尽管如此,随着你不断提供新的标签,模型的性能应该会提高。这意味着 exploitation 策略将变得越来越有用,最终正确地放置决策边界。为了确保利 如果没有数据点高于  用正确的技术,你可以实现平稳过渡,以便在第一次迭代中 epsilon 小于 0.5,当你看到模型性能的提高时,epsilon 会大于 0.5。

就是这样

在主动学习中,我们可以使用潜在分数从探索走向开发:从发现特征空间中专家感兴趣的新案例,到关注模型需要人工输入的关键案例。但问题是:我们什么时候停止?

主动学习应用程序可能会为潜力设置一个阈值。 阈值,则意味着我们已经探索了整个特征空间,并且模型在每个预测中都具有足够的确定性(不太可能)。因此,我们可以结束人机交互循环。

停止应用程序的

另一种方法是,如果您有足够的新标签来构建测试集,则通过测量模型的性能来停止应用程序。如果模型的性能已达到一定的准确性,我们可以自动结束循环并导出模型。尽管有这些停止标准,但在大多数主动学习应用程序中,专家应该尽可能多地标记并自由退出应用程序并保存输出,即模型和迄今为止收集的标签。

返回頂端