用AI预测人们的生活结果并非如此简单 普林斯顿大学研究人员与包罗弗吉尼亚理工大学在内的许多机构的研究人员合作进行的一项大规模研究表白,科学家们用来预测大型数据集结果的机器学习技术可能无法达到预期的目标。 这种大规模的合作称为“脆弱的家庭挑战”,代表了一批科学家,他们建立统计和机器学习模型,以预测和衡量美国儿童,父母和家庭的生活成果。 由112位合著者在《美国国家科学院院刊》上颁发的研究结果表白,社会学家和数据科学家在使用预测模型时应谨慎行事,尤其是在刑事司法系统和社会项目中。 即使使用了最先进的建模和包含4000多个家庭的13000个数据点的高质量数据集,最佳的AI预测模型也不是很准确。 弗吉尼亚理工大学弗雷林生命科学研究所的研究科学家Brian J. Goode参加了“ 脆弱家庭挑战”活动中的数据和社会科学家。 “这是试图在数据和模型中捕捉构成人类生活结构的复杂性和复杂性的一项努力。但是,必需采取下一步办法,并按照如何应用模型来对模型进行上下文化。更好地预测预期的不确定性和局限性,这是一个非常困难的问题为了应对这一挑战,我认为“脆弱家庭挑战”表白我们需要在这一领域提供更多的研究支持,特别是因为机器学习对我们的日常生活产生更大的影响。” Goode的建模是通过弗吉尼亚州的发现分析中心进行的在那儿,他与发现分析中心的主任,托马斯·L·菲利普斯(Thomas L. Phillips)的工程学教授纳伦·拉玛克里希南(Naren Ramakrishnan)和工程学院计算机科学系的德班扬·达塔(Debanjan Datta)合作,他们别离是有助于收集和分析数据。 弗吉尼亚理工大学的研究小组还在《社会学》(Socius)的特刊上颁发了研究成果,这是美国社会学协会的新开放获取期刊。为了支持在该领域的其他研究,向挑战赛提交的所有材料,包罗代码,预测和叙述性解释,都可以公开获得。 “这项研究还向我们表白,我们还有很多东西要学习,而这样的大规模合作对研究界来说非常重要,” PNAS研究的共同主要作者,普林斯顿大学社会学教授,该中心临时主任马特·萨尔加尼克(Matt Salganik)说。普林斯顿大学伍德罗·威尔逊公共与国际事务学院的信息技术政策专业。 该项目的灵感来自于Wikipedia,它是世界上最早的大规模协作之一,于2001年作为共享的百科全书创建。萨尔加尼克(Salganik)思考通过新的合作形式还可以解决其他哪些科学问题,那就是他与萨拉·麦克拉纳汉(Sara McLanahan),普林斯顿大学社会学和公共事务教授William S. Tod以及普林斯顿大学研究生伊恩·伦德伯格和亚历克斯联手金德尔,都在社会学系。 麦克拉纳汉(McLanahan)是普林斯顿大学和哥伦比亚大学脆弱家庭与儿童福祉研究的主要研究者,该组织一直在研究1998年至2000年之间在美国大城市出生的约5,000名儿童,其中未婚父母所生的儿童过高。纵向研究旨在了解未婚家庭中孩子的生活。 通过六次收集的调查(孩子出生时,然后当孩子达到1、3、5、9和15岁时),该研究已经获得了有关儿童及其家庭的数百万个数据点。22岁时将捕捉另一波浪潮。 在研究人员设计挑战时,尚未公开提供15岁以下的数据(研究人员在论文中称其为“保留数据”),这使人们有机会要求其他科学家预测该人群的生命结局。研究中的人们通过大规模协作。 联合组织收到了来自全球68个机构的457份申请,其中包罗普林斯顿大学的几个团队。使用脆弱家庭数据,要求参与者预测15岁时六个生命结局中的一个或多个。这些结果包罗平均儿童成绩(GPA);儿童沙粒 家庭搬家;家庭物质困难;初级护理人员裁员;和初级护理人员参加工作培训。 挑战基于通用任务方法,这是一种在计算机科学而不是社会科学中经常使用的研究设计。这种方法发布了一些但不是全部数据,使人们可以使用他们想要确定结果的任何技术。目标是准确地预测保留数据,而不管达到该状态所需的技术如何。 该小组目前正在申请拨款,以继续在这一领域进行研究。 PNAS于3月30日颁发了论文“通过科学的大规模协作来衡量生命结局的可预测性” 。 本文来源:https://www.wddqw.com/doc/3eba69dc00020740be1e650e52ea551811a6c924.html