乔治亚大学的一项新研究旨在通过人类评分和人工智能来改进我们评估儿童创造力的方式。
玛丽弗朗西斯早期教育学院的一个团队正在开发一种人工智能系统,可以更准确地对小学生创造力评估的开放式回答进行评分。
该研究的作者、教育心理学副教授丹尼斯·杜马斯说:“就像医院系统需要病人的良好数据一样,教育系统也需要学生的良好数据,以便做出有效的选择。”“创造力评估具有政策和课程相关性,没有评估数据,我们无法完全支持学校的创造力。”
这些测试通常用于识别有天赋的学生,他们需要额外的教学资源,以得到学校的充分服务。而且由于它们需要大量的时间来评估——大多数开放式的回答需要由多个训练有素的人类评委打分——它们不像数学、阅读或智商测试那样被广泛使用。然而,通过创建一个人工智能系统,创造力评估可能会成为学校更容易使用的工具。
为了改进人工智能的功能,Dumas和他的合作者在30分钟的创造力评估中分析了1万多个个人的回答。他们发现,某些类别的学生和某些类型的回答导致评委对创造力的评价不太一致。所有可识别的学生信息都从评估中删除,评委只收到学生的回复。
“我们的评委不知道这些孩子是谁,也不知道他们的具体人口特征,”杜马斯说。“并没有明显的偏见,但一些学生的回答方式让我们的团队很难对他们的回答进行可靠的评分。”
评委们被要求在1分(最缺乏独创性)和5分(最具独创性)之间打分,当回答的独创性较低或来自年龄较小的孩子或男学生时,他们更有可能不同意评分。
杜马斯说:“我原以为评分者在独创性方面会有更多的分歧,但我们发现,由于评委们看重的是独创性,所以当答案不同寻常、令人惊讶和聪明时,他们更有可能同意。”“但当一个答案在原创性方面得分较低时,就会引发更多的分歧。”
例如,当被问及帽子的惊人用途时,一个三年级的学生说:“你把遮阳的部分剪掉,看起来会很傻。”对这个回答的判断范围从1到4,研究强调了这个例子,说明年龄较小的学生的回答很难评价。一些评委认为这不是原创,因为这顶帽子仍然是戴在头上的可穿戴物品。然而,其他人则认为帽子外观的改变有趣、令人惊讶,适合一个有创造力的三年级学生的年龄。
天赋异禀的学生的原创回答也出现了更大的分数范围,拉丁裔学生被认为是英语学习者,而亚裔学生在任务上花费了更多的时间。所有这些因素导致了更多的评级分歧。
“会说两种语言的孩子,他们会写出不同的回答;他们的反应方式与只会说一种语言的孩子不同。”“尽管我们的许多读者也会说两种语言,但这很难应用到评级方面。似乎我们一次又一次地发现,那些更可能会说两种语言的学生也更难被评价。”
Dumas说,了解评级分歧出现的地方有助于重新训练人工智能系统,使其更加准确,这有助于减少评估结果的误差范围。杜马说,这些误差范围是学校常用的评估标准,但在创造力评估中,误差范围可能比数学或阅读测试更大。范围越窄,学校在根据分数做出决定时就越有信心。
Dumas说,这项研究是朝着提高这些评估的准确性,从而提高信心迈出的一步。
“学校评估的往往是教师在教学中关注的内容。因此,可以从他们选择的评估中观察到学校系统的价值和优先事项。”“我希望能够在学校心理学家的工具包中更多地建立创造力评估,让他们有机会观察幼儿的创造潜力,并将其解释为一种优势。”
这项研究发表在《创造性行为杂志》上。
本文来自作者[admin]投稿,不代表耕航号立场,如若转载,请注明出处:https://www.yghhs.cn/wiki/202506-387.html
评论列表(4条)
我是耕航号的签约作者“admin”!
希望本篇文章《人工智能有助于提升儿童创造力评估的准确性》能对你有所帮助!
本站[耕航号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:乔治亚大学的一项新研究旨在通过人类评分和人工智能来改进我们评估儿童创造力的方式。...