您的位置: 专家智库 > >

国家自然科学基金(31371047)

作品数:13 被引量:56H指数:4
相关作者:辛涛刘彦楼康春花田伟刘笑笑更多>>
相关机构:北京师范大学曲阜师范大学浙江师范大学更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
相关领域:哲学宗教自动化与计算机技术文化科学更多>>

文献类型

  • 13篇中文期刊文章

领域

  • 11篇哲学宗教
  • 1篇自动化与计算...
  • 1篇文化科学

主题

  • 4篇认知诊断模型
  • 3篇自适
  • 3篇自适应
  • 3篇项目反应理论
  • 2篇题目
  • 2篇计算机
  • 2篇计算机化
  • 2篇计算机化自适...
  • 2篇计算机自适应...
  • 2篇估计方法
  • 2篇EM算法
  • 2篇参数估计
  • 2篇参数估计方法
  • 1篇心理
  • 1篇心理特质
  • 1篇信息矩阵
  • 1篇性能比较
  • 1篇学业
  • 1篇影响因素
  • 1篇神经网

机构

  • 12篇北京师范大学
  • 2篇曲阜师范大学
  • 2篇浙江师范大学
  • 1篇四川师范大学
  • 1篇泰山学院
  • 1篇天津师范大学
  • 1篇沈阳市教育研...
  • 1篇教育部基础教...
  • 1篇北京第五中学

作者

  • 8篇辛涛
  • 2篇刘彦楼
  • 2篇田伟
  • 2篇康春花
  • 1篇叶萌
  • 1篇陈平
  • 1篇刘拓
  • 1篇毛秀珍
  • 1篇陈孚
  • 1篇衷克定
  • 1篇李令青
  • 1篇杜佳萱
  • 1篇汪玲玲
  • 1篇林喆
  • 1篇刘笑笑
  • 1篇刘拓
  • 1篇曾平飞

传媒

  • 4篇心理科学进展
  • 3篇北京师范大学...
  • 2篇心理学报
  • 2篇心理学探新
  • 1篇南京师大学报...
  • 1篇心理科学

年份

  • 1篇2019
  • 1篇2018
  • 2篇2017
  • 2篇2016
  • 4篇2015
  • 2篇2014
  • 1篇2013
13 条 记 录,以下是 1-10
排序方式:
认知诊断计算机自适应测验中选题策略的新进展被引量:3
2013年
本文主要从提高测量精确性、控制题目曝光率、平衡测验内容三个方面总结了认知诊断计算机自适应测验的选题策略。文章首先简单回顾以往提出的选题策略,分析这些选题策略的不足,再分别介绍了三种改进方法。它们分别是毛秀珍提出的改善PWKL方法精确性的平均PWKL方法,陈平提出的控制曝光率方法,崇伟峰提出的通过后验概率到0.5的距离来平衡属性测量程度的方法。将三种方法与以往的选题策略比较,结果均显示三种新的选题策略效果更好。最后,作者探讨了认知诊断计算机自适应测验的选题策略中这三方面的平衡问题,以及选题策略以后的发展方向。
辛涛刘拓
多维计算机化自适应测验:模型、技术和方法被引量:11
2015年
多维计算机化自适应测验(multidimensional computerized adaptive testing,MCAT)以多维项目反应理论为基础实现同时估计被试在测验每个维度上的能力水平,并通过计算机化自适应测验提高诊断评估的准确性和效率,因而具有广阔的应用前景。基于对MCAT的模型基础、能力估计方法、选题策略和终止规则的详细介绍和评价,提出了MCAT未来研究方向的几点思考。
毛秀珍辛涛
关键词:计算机化自适应测验
项目反应理论与认知诊断模型的参数估计:模型整合视角被引量:4
2017年
将极大似然期望最大化(maximum likelihood estimation via the expectation maximization,MLE-EM)算法拓展到了广义诊断模型估计中,并详细描述了如何使用期望最大化算法计算模型参数的极大似然估计值.从理论上明确指出,在认知诊断模型中存在的2类参数,即项目参数和结构参数,都是从观察数据中自由估计获得的.据此对项目反应理论和认知诊断模型中所用的边际极大似然估计期望最大化(marginal maximum likelihood estimation via the expectation maximization,MMLE-EM)算法理论进行了澄清,指出以往一些研究出现错误结论的原因.最后从模型整合的视角上为后续的研究提出了4条建议.
刘彦楼辛涛田伟
关键词:项目反应理论认知诊断模型参数估计方法
HO-GDINA模型的EM算法参数估计被引量:3
2017年
Generalized DINA Model(G-DINA)为认知诊断模型提供了一个一般性的理论框架,而高阶诊断模型不仅能描述被试的总体水平,还能描述被试对属性的掌握情况(微观的认知状态)以及被试掌握属性与能力的关系,提供更丰富的信息。如果能把这两者结合起来,可能对实际诊断工作的操作有较大帮助。文章首先对考虑高阶结构的整合性模型——HO-GDINA模型的形式进行讨论,探讨其参数估计EM算法的实现,并用模拟过程对模型的估计精度进行研究,结果验证了HO-GDINA的EM算法的正确性,并且说明该算法对该模型有较高估计精确度。然后用饱和模型在约束条件下的特殊形式HO-DINA模型对"分数减法"这一经典数据进行EM算法参数估计和具体分析,展示了HO-GDINA在实际情况中的具体使用,并与de la Torre之前用MCMC估计算法得到的研究结果做比较,基本一致,进一步表明HO-GDINA模型的参数估计EM算法在实际情境中的特殊形式下仍然适用。
易芹田伟杨涛辛涛刘彦楼
关键词:认知诊断模型EM算法
项目反应理论中潜在心理特质“填补”的参数估计方法及其演变被引量:3
2014年
在心理与教育测量中,项目反应理论(Item Response Theory,IRT)模型的参数估计方法是理论研究与实践应用的基本工具。最近,由于IRT模型的不断扩展与EM(expectation-maximization)算法自身的固有问题,参数估计方法的改进与发展显得尤为重要。这里介绍了IRT模型中边际极大似然估计的发展,提出了它的阶段性特征,即联合极大似然估计阶段、确定性潜在心理特质"填补"阶段、随机潜在心理特质"填补"阶段,重点阐述了它的潜在心理特质"填补"(data augmentation)思想。EM算法与Metropolis-Hastings Robbins-Monro(MH-RM)算法作为不同的潜在心理特质"填补"方法,都是边际极大似然估计的思想跨越。目前,潜在心理特质"填补"的参数估计方法仍在不断发展与完善。
田伟辛涛康春花
关键词:项目反应理论EM算法
认知诊断模型资料拟合检验方法和统计量被引量:1
2016年
认知诊断模型界定了测验题目和所考察属性之间的关系,通过被试的作答反应获取被试对属性或知识技能的掌握情况。认知诊断模型资料拟合检验可以从项目拟合、模型绝对拟合、模型相对拟合和个人拟合方等方面进行。通过对认知诊断拟合检验方法和统计量的详细介绍和评价,可为认知诊断实践提供借鉴和参考。未来研究可在更丰富的研究条件下对各统计量的性能进行评价和对比,完善已有的拟合检验方法,提出新的拟合统计量。
陈孚辛涛刘彦楼刘拓田伟
关键词:认知诊断模型
改进的认知诊断模型项目功能差异检验方法——基于观察信息矩阵的Wald统计量被引量:14
2016年
Hou,de la Torre和Nandakumar(2014)提出可以使用Wald统计量检验DIF,但其结果的一类错误率存在过度膨胀的问题。本研究中提出了一个使用观察信息矩阵进行计算的改进后的Wald统计量。结果表明:(1)使用观察信息矩阵计算的这一改进后的Wald统计量在DIF检验中具有良好的一类错误控制率,尤其是在项目具有较高区分能力的时候,解决了以往研究中一类错误率过度膨胀的问题。(2)随着样本量的增加以及DIF量的增大,使用观察信息矩阵计算Wald统计量的统计检验力也在增加。
刘彦楼辛涛李令青田伟刘笑笑
关键词:项目功能差异认知诊断模型
垂直量尺化中的参数标定方法及其性能比较被引量:2
2014年
在使用项目反应理论进行量尺化的语境下,参数标定方法是垂直量尺化结果的一个至关重要的影响因素。目前的参数标定研究就部分标定方法的相对性能获得了较一致的结果,就如何实现更佳量尺化也提出了很多新的标定方法。除了在既有框架内继续探索,以形成完整的研究体系,未来的研究应结合相关学科,在深入了解学业增长的性质的基础上探究标定方法的性能,并应考察特定的标定方法和特定的研究条件、量尺化语境之间的最佳匹配关系。
叶萌辛涛
认知诊断计算机自适应测验中平衡属性收敛的新方法被引量:4
2019年
提出两种认知诊断计算机自适应测验下平衡属性收敛的新方法(MABI、RTA),模拟研究系统探讨和比较了此二者与已有方法(ABI、IABI和RABI)的表现。结果发现:(1)新方法较不考虑属性收敛的方法有更高的准确率以及更均衡的题目使用率;(2)新方法较ABI和RABI有稍低的准确性,但有更平衡的题目使用率;(3)新方法与IABI的准确性和题目使用率在不同选题策略下各有优势。总之,两种新方法较好地兼顾测量准确性、题目使用率以及题库曝光情况。
孙小坚王钰彤张世夷辛涛
基于IRT的决策一致性系数在大规模教育测量中的应用被引量:4
2015年
在一个大规模教育测量中,以小学四年级和初中二年级的数学测验为例,使用基于项目反应理论(item response theory,IRT)的测验决策一致性系数作为评价测验信度的标准之一,并比较在测验中选取不同分界分数、分数量尺时决策一致性系数的差异.结果发现:相比经典测验理论(classical test theory,CTT)下的信度系数,基于IRT下的测验整体信度要高于CTT下的信度;划定的分界分数(cut score)个数越少,决策一致性系数越大;分界分数位置会影响决策一致性系数,能力水平在分界分数附近的考生更容易被划分到不同类别中;将测验原始分数转换成量表分数后,多个原始分数对应一个转换分数的规则会增大决策一致性系数.
杜佳萱陈平辛涛
关键词:项目反应理论
共2页<12>
聚类工具0