现有的领域自适应方法在定义领域间分布距离时,通常仅从领域样本的整体分布上考虑,而未对带类标签的领域样本分布分别进行考虑,从而在一些具有非平衡数据集的应用领域上表现出一定的局限性.对此,在充分考虑源领域样本类信息的基础上,基于结构风险最小化模型,提出了基于类分布的领域自适应支持向量机(Domain adaptation support vector machine based on class distribution,CDASVM),并将其拓展为可处理多源问题的多源领域自适应支持向量机(CDASVM from multiple sources,MSCDASVM),在人造和真实的非平衡数据集上的实验结果表明,所提方法只有优化或可比较的模式分类性能.
传统Takagi-Sugeno(T-S)模糊系统模型因模糊规则使用样本全部特征,导致模型的可解释性较差,冗余特征的存在还会导致模型的过拟合,降低模型的泛化性能。针对该问题,提出了一种模糊系统联合稀疏建模新方法L2-CFS-FIS(L2-common feature selection fuzzy inference systems),从而提高模型的泛化性能和可解释性。该方法充分考虑存在于模糊规则间的公共特征信息,同时引入模型过拟合处理机制,将模糊系统建模问题转化为一个基于双正则的联合优化问题,并使用交替方向乘子(alternating direction method of multipliers,ADMM)算法来进行求解。实验结果表明,该方法所构造的模糊系统不仅能够获得较为满意的泛化性能,而且通过有效地挖掘规则间重要的公共特征,可以确保模型具有较高的可解释性。