首頁 » 到目前为止发生了什么 

到目前为止发生了什么 

 

第 1 集 引入主动学习采样,将人类重新带入流程,帮助指导算法。
第 2 集 讨论了标签密度方法,该方法遵循这样的策略:在标记数据 到目前为止发生了什  集时,您需要标记具有密集数据点簇的特征空间。
第 3 集 转向模型不确定性的话题,将其作为一种快速将我们的决策边界移动到正 到目前为止发生了什  确位置的方法,使用尽可能少的标签,并尽可能少地占用我们昂贵的人工专家的时间。

今天,我们探索和利用特征空间

使用 不确定性抽样 我们可以 利用 特征空间的某些关键区域,这将确 电报数据库 保决策边界的改进。使用标签密度,我们 探索 特征空间以找到模型从未见过的新东西,这可能会完全改变决策边界。现在的想法是同时使用两种方法——标签密度和不确定性采样——来增强 配置您的公司数据 们的主动学习采样。为此,我们将密度分数和不确定性分数结合在一个我们可以称为潜力的单一指标中。

公式 潜在得分

P(x i ) 定义为密度得分 D(x i ) 与不确定性 系统 印度尼西亚号码列表 已经 得分 R(x i ) 之和,其中 Ɛ 是 0 到 1 之间的固定参数,它定义了两个独立得分的贡献。
我们现在可以使用这个潜在排名对仍然可以标记的数据点进行排序。epsilon 参数定义了两种策略中的哪一种贡献最大。一开始,只有几个标签,模型性能会很差。这就是为什么使用不确定性分数(R(x) 或 exploitation)是不明智的。相反,特征空间仍然未被探索,因此利用密度分数(D(x) 或 exploration)是完全合理的。

返回頂端