发布时间:2024-11-01 01:45:28 来源: sp20241101
近日,深圳计算科学研究院首席科学家、中国科学院外籍院士樊文飞应邀出席2024世界人工智能大会,并在投融资主题论坛上发表了“AI=机器学习+逻辑推理”的主旨演讲,同与会嘉宾分享了AI领域前沿趋势和在垂直领域应用的重大机遇。
樊文飞院士认为,通用大模型推动了行业的变革,引起社会的广泛关注,但也存在局限性。做为辅助工具,大模型表现优异;但在智能制造的应用前景还有待观察。当下的大语言模型是基于统计类的机器学习模型,无法满足结果的可解释,且无法同时满足模型的“准确性”“公平性”和“鲁棒性”要求,逻辑推理能力不强,训练成本高(算力、数据、能耗),而且经常产生“幻觉” (hallucination)。可否应用大模型在生产关键环节做出实时“决策”,解决行业痛点,提高生产效率?如何确保大模型在智能制造决策中的准确性和可靠性?如何减少它们所产生的幻觉?能否增强机器学习的逻辑推理能力?所以要讨论大模型的远景,首先要确定大模型的定位,不能企望大模型做到其所不能。
在人工智能技术的发展大潮中,中国应发挥在制造业规模大、垂直领域数据积累多等优势。樊文飞院士提出,以“机器学习+逻辑推理”的“AI+”发展思路,在提高模型结果准确度的同时赋予结果可解释性;与此同时,通过逻辑规则融入行业(小)模型预测,大幅降低模型的落地成本。
樊文飞院士表示,目前社会广泛聚焦的是大模型以及与其相关的算力,忽视了大模型训练必需的语料准备这一关键环节。大模型的精度和可用性取决于所训练的语料数据,如果致力于打造一个具备产线实时应用的大模型决策系统,那么语料清洗的重要性和算力同等重要。基于“大数据质量保证模型与方法”原创理论,深算院研发的采石矶数据质量系统,为上海数据交易所的数据评估和数据交易流程提供底层能力支撑,落地国内首创的大数据精准量化质量评估,实现了自动化的数据质量评估和数据质量增强,真正打通数据要素进入流通的关键节点。下一步,将继续为大模型的训练提供优质的语料数据和行业调优数据,以提升行业大模型的准确性。(记者 党文婷)
(责编:曹淼、李源)