百度CTO王海峰：文心一言是技术积累和产业实践的水到渠成

封面新闻记者孟梅欧阳宏宇

“文心一言是百度多年技术积累和产业实践的水到渠成，尤其是飞桨深度学习平台和文心大模型的联合优化，为文心一言提供了坚实的技术支撑。”3月16日，百度首席技术官王海峰在北京表示，新一代知识增强大语言模型文心一言，是在ERNIE及PLATO系列模型的基础上研发的。其关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

在人工智能时代，IT技术栈可分为“芯片层、框架层、模型层、应用层”四层。据介绍，在框架层，飞桨是百度自主研发的开源开放的产业级深度学习平台，能够标准化、自动化地支撑模型生产和应用；在模型层，文心大模型包括NLP、CV、跨模态等基础大模型，具备知识增强和产业级两大特色。

在王海峰看来，飞桨有效支撑了大模型的灵活开发、高效训练和推理部署。文心大模型从2019年发布以来，已经从最初的自然语言理解大模型，发展成了跨语言、跨模态、跨任务、跨行业的能力完备的大模型平台。

相较于OpenAI研发的ChatGPT等生成式AI产品，王海峰提到，知识增强、检索增强和对话增强是文心一言基于百度现有技术优势的再创新，也会是其未来越来越强大的基础。

在知识增强方面，文心一言主要有知识内化和知识外用两种方式。在检索增强方面，来自以语义理解与语义匹配为核心技术的新一代搜索架构。在对话增强方面，基于对话技术和应用积累，文心一言具备记忆机制、上下文理解和对话规划能力，实现更好的对话连贯性、合理性和逻辑性。

“文心大模型加上飞桨深度学习平台，夯实了产业智能化基座。”王海峰预测，随着文心一言与飞桨平台的进一步融合发展，人工智能技术和应用的研发将越来越标准化、自动化和模块化，加速人工智能的工业大生产，同时也反哺文心一言加速迭代进化，落地更多场景和行业。