百度文心大模型上车如何赋能智能化？

[本站行业] 关于“ChatGPT”，相信很多人都已经不陌生了。一众大佬的背书，加上媒体的炒作，让这一新生事物瞬间成为继元宇宙之后的又一“科技宠儿”。国内的头部科技公司也迅速跟进，出现了文心一言、通义千问等类似产品。

有人把它当成聊天机器人，也有人将其称之为开启新一轮科技革命的钥匙。它们的出现改变着人类与机器的交互方式，同时也影响着其他产业的发展进程。360集团创始人周鸿�t曾说，ChatGPT不仅仅是搜索引擎的加强版，也不仅仅是一个聊天机器人，它通过SaaS方式所提供的人工智能服务将重塑所有的数字化应用和所有行业。

5月23日，百度Apollo汽车智能化业务展示了以文心大模型为基础的新一代AI智舱探索成果。其中包括出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力，另外还有在当前智舱命令式交互下覆盖全车多音区、毫秒级响应、免唤醒全时交互的体验。

百度阿波罗智舱业务部产品架构师徐嘉南表示：“大模型的能力给汽车加上了智商和情商，这也是过去系统不具备的能力。”

从交互工具到智能助手

随着新能源汽车的快速渗透，汽车智能化的步伐也在加快。过程中，主机厂、科技公司、一级供应商等玩家纷纷下场，开展智能座舱、自动驾驶方面的研发和应用。而在整个智能化的拼图中，智能座舱俨然已经成为排头兵，考验着每家企业的技术和产品实力。

据本站研究院《2023中国智能汽车发展趋势洞察》报告显示，智能座舱相关配置近年来渗透率均处于增长态势，特别是网联化配置。其中车联网每年稳步保持上升十个百分点以上，至2022年市场渗透率已超过70%。OTA升级2022年达到近50%，较2018年提升了19倍。

百度也对进智能座舱进行了不少用户调研和拆解分析，结果显示，智能化的功能搭载率排在首位的是语音交互。“语音交互未来的覆盖量还会快速拓展，从我们原来的高技术，到后面的普及率是越来越高。预计到2025年会超过95%的车搭载。”徐嘉南说道。

同时，百度认为未来智能汽车不是有四个轮子的大号手机，而是一个真正可以互动、可以学习的“汽车机器人”。语音交互是智能机器最重要的交互方式。

实际上，语音交互在汽车上的应用已经有接近10年的发展历程，从最开始命令式的语音摇控器，到后来成为准确率越来越高，理解能力越来越强的交互工具，它可以替代手去点击屏幕。在百度看来，语音交互接下来的发展方向就是理想态的智能助理，它不再是单向下命令，而是可以双向互动、对话，理解复杂的需求表达。同时它还会具备更有智商、情商的创造能力。

“它不再是交互工具，而是真正能够陪伴用户的一个助手。接下来五年会朝这样的方向去进行发展。我们接下来的语音会有大语言模型，推动真正地对话式交互。”徐嘉南介绍道。

相比而言，这会产生两方面变化。一个是用户体验，过去的语音交互纯靠人工设计，堆产品经理、堆研发、堆设计师，这也导致语音交互所能实现的功能还是非常有限的。而大语言模型能真正把通用的语音模型带到设备上，可以在不同的场景下化身不同的助手，解决用户专业的问题。

其次是产业层面。过去车企需要培养一批语音开发人员，去具体进行功能设计。而未来车企会配备提示词工程师这样的岗位，专门调教大模型，让车机有更好的响应和结果，满足用户需求。

“想要达到这样的变革，就需要更坚实的技术支撑。百度在整个行业里有非常好的AI技术积累，拥有全栈自研的AI架构，从底层的芯片――昆仑芯，到上层深度学习架框――飞浆，以及模型层。我们是基于文心大模型的能力达到这样的体验。”徐嘉南表示。

大模型赋能后的优势

正是基于这样的判断，百度在智能座舱上开展了多项产品化探索。

目前百度的智能座舱分成两大部分，一部分是小度车载SDK，另一部分是小度车载OS。2019年，百度推出了小度车载OS，已在多个车型上实现300多万的搭载量。

据徐嘉南介绍，根据市场行业发展，目前车企更多希望做个性化、定制化的智能化产品，以便突出自身的品牌调性。为了满足这些客户的需求，百度推出了小度车载SDK，其具备更开放性的设计，可以让车企进行差异化设计。整体内容分为三部分，一是语音SDK，其次是车载生态，第三部分是核心的智慧增强包。

其中小度车载语音基于大模型本地化技术开发。所谓的大模型本地化，是把云端参数非常大的模型通过蒸馏和裁剪方式，把整个体积和运行资源占用变得更小，然后移动到端上，利用本地化算力去做加速运行，从而带来更极致的语音交互体验。

这样做有以下优势，首先是体验更流畅，用户可以在任何位置、任何时间直接交流，没有交互屏障，不像原来要不断进行唤醒，真正做到全时免唤醒，不需要再唤醒。另外，小度车载语音还支持多路同时交互，车内每个位置都有专属的服务语音交互，其背后比较大的挑战就是拒识能力，具体来说就是区分人是不是在和车说话，如果是和车说话，就应该有响应，如果不是和车说话，就应该忽略。

目前，小度车载语音通过语音加语义的多模拒识，可以达到非常高的拒识准确率，并且是全时。

其次是极速、更快的响应，小度车载语音可以做到全领域毫秒级响应，速度会达到端到端的800毫秒。只有做到全领域才能带来持续的交互体验。

据徐嘉南介绍，“相比于整个行业的主流产品来说，我们提升了一倍速度。如果是唤醒，最快的速度是接近1.5秒，这基本上是极限了，而我们真正可以做到全领域。同时，因为它具备本地化能力，可以把大量的人机交互数据保存在本地，极大地保护了用户隐私。”

第三是全场景。一直以来，更多车企会将语音交互集中在自研应用上，很多第三方应用是无法使用的。这主要是因为整个开发过程中有非常高的适配成本，车企需要生态，就需要跟应用方进行深度开发和合作，付开发费。一旦页面改变，以前的工作都可能全部推倒重来。

现在通过本地注册能力，小度车载可以通过自动识屏方式，自动识别屏幕上的按钮，帮助OEM节省成本，给用户带来全场景体验。车里所有的功能都可以语音交互，而不是只在某些应用里面才能使用。

第四，小度车载语音在文心大模型的加持下变得更聪明了。

为车企提供两种方案

这里不得不提到百度推出的车载智慧增强包。相对于原来命令型、任务型的智能，车载智慧增强包给其加上了真正的智商和情商，可以让每个车载场景更智慧，更能够去帮助用户解决实实在在的用车需求。其背后需要强大的逻辑理解能力，包括对话式交互能力、策略规划和知识问答。

总结下来，车载智慧增强包含有两个基础功能和两个结合功能。两个基础功能是指超级闲聊、灵感画画。基于此可以实现百变人设，用不同人设的风格进行语音回复，其次是AI新车导购，可以通过一个模拟导购员的方式与人进行互动。

“从整个发展角度来看，我们认为未来文心大模型会重塑车内的应用和交互，基于文心这样的能力，把过去可能我们想到的体验，但是过去的技术做不到的能力，去进行一次优化，一次重构，给大家带来全新体验。”徐嘉南说道。

据他透露，目前很多车企都很感兴趣，在和百度进行探索。车企感兴趣的主要包括几个方面，第一是大模型的整个能力能不能快速上车，这是车企最关注的。

第二部分是上车合作的方式。目前主要有两种方案，一是小度车载智慧增强包，这是标准化产品，可以快速给到车企，车企可以直接放到车上和系统进行融合。其次是满足车企的个性化需求，比如要自己去设计一些场景，设计一些能力，百度则通过引擎的方式和车企进行合作。

当然，百度基于大模型能力还在进行更多功能探索。比如在出行场景下的行程规划、个性化的驾驶空间、用车顾问、儿童益智场景等等。从某种程度上说，大模型已经成为汽车智能化的核心驱动力，而百度Apollo也将作为一个“赋能者”，持续助力车企在智能化赛道上获得领先。

相关文章

奇瑞超级618：999元抢风云A9L终身免费基础保养，全维礼遇加码

智享生活广汽昊铂首届用户日暨昊铂S600上市发布会定档6月12日

风云T9L版本选购指南，树立15万智能混动SUV新标杆

史上最难环塔收官！纵横2.0T解耦四驱称霸环塔极限赛场

智驭风云 从容破界｜风云T9L猎鹰700驾享品鉴会圆满落幕

打破出行边界，平衡烟火与热爱，BJ40增程定义全场景用车生活

智驭风云从容破界｜风云T9L猎鹰700驾享品鉴会圆满落幕