发布时间:2024-07-19 13:41来源:盖世汽车 阅读量:13663
盖世汽车讯 基础模型是大规模深度学习模型,已在大量通用、未标记的数据上进行了预训练,可应用于各种任务,例如生成图像或回答客户问题。这些模型是ChatGPT和DALL-E等人工智能工具的支柱,但它们可能会提供错误或误导性的信息,在安全攸关的情况下这些错误信息可能造成严重后果。
据外媒报道,为了帮助防止出现此类错误,麻省理工学院和MIT-IBM沃森人工智能实验室(MIT-IBM Watson AI Lab)的研究人员开发出一种技术,可以在将基础模型部署到特定任务之前评估其可靠性。
研究人员考虑通过一组彼此略有不同的基础模型来实现这一目标,然后利用其算法来评估每个模型学习到的关于同一测试数据点的表示的一致性。如果这些表示一致,则意味着模型可靠。
与最先进的基线方法相比,这种技术能够更好地体现在各种下游分类任务中基础模型的可靠性。人们可以利用这种技术来决定是否可以在特定环境中应用模型,而无需在真实数据集上进行测试。当数据集可能因隐私问题而无法访问时,这可能特别有用。此外,该技术还可用于根据可靠性评分对模型进行排名,从而使用户能够为其任务选择最佳模型。
研究人员Navid Azizan表示:“所有模型都可能出错,但知道自己什么时候出错的模型更有用。对于这些基础模型来说,量化不确定性或可靠性的问题更具挑战性,因为它们的抽象表示难以进行比较。这种方法允许人们量化表示模型对于各种给定输入数据的可靠性。”
声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。
岩山科技旗下的自动驾驶科技公司Nullmax于7月16日举办了主题为“AI无止境智变新开端”的技术发...
发布公告称,公司与GC、Synaptic及46名韩国籍自然人股东(下称“个人卖方”)签署《股份购买协...
随着中汽中心汽车极端环境测试国家标准体系的搭建与应用,汽车测试的规范化成为了行业关注焦点。近日,中汽...
“联合国可持续发展气候目标中有范围一和范围二的碳排放目标。在范围一及范围二(运营过程)中,我们在20...
作为人体的第一道屏障,肌肤持续不断地承受着环境因素的侵袭。不良生活习惯和错误的肌肤保养方法均会加速肌...
在位于武汉国家航天产业基地的航天科工火箭技术有限公司,“鸣凤”团队的研发人员正在角逐最前沿的商业航天...
7月17日晚,极氪汽车宣布,右舵版极氪X在香港上市开售,起售价约合人民币23.26万元。 在此前一...
随着环境和生活方式的变化,敏感肌人群逐渐增多,肌肤问题也愈发复杂多样。据《中国敏感性皮肤诊治专家共识...
火热的巴黎奥运会开幕在即,世界性体育盛会的召开也让国民运动氛围持续升温。而在全民运动热潮下,具备独特...
7月17日下午,市药品监督管理局党组书记、局长徐徕,党组成员、副局长赵燕君带队来青浦走访调研生物医药...