作者:吴伟宁 日期:2017-08-19 07:41:26
本书共分为5章.**章概述了主动学习中样例选择方法,并对噪声-标注主动学习模型进行定义,给出了多标注者或大规模未标注样本环境下的主动学习问题。第2章主要讨论了多标注者环境下的准确度估计问题,给出了如何从收集到的噪声标注中判断和选择可靠标注者的方法。第3章考虑了大规模未标注样本集中的噪声数据和样本分布不均衡对分类模型的影响,给出了如何利用分类模型风险来选取信息含量*高的未标注样本。第4章考虑了从大规模未标注样本集选取样本的效率问题,给出了基于哈希技术的快速主动采样方法。*后一章是对主动采样策略做了一些总结性的工作。