大模型上车究竟能发挥几成功力

中国汽车报网| 2023-08-02 10:30:59

(资料图片)

忽如一夜春风来，千车万车模型开。　　7月19日，创维汽车召开“励行致远-小维GPT发布暨二代产品上市研讨会”，会上发布了旗下大模型智能问答系统——小维GPT。官方表示，该系统由创维汽车基于人工智能语言模型技术，采用GPT模型进行语言学习和理解，旨在“为用户提供智能语音交互、智能问答等功能”。　　无独有偶，7月6日，吉利银河新能源在官方公众号正式发布了品牌首款轿车车型——银河L6。官方定位称其为“AI智能电混家轿开创者”“首款基于AI智能大模型全面开发的电混家轿”。　　在汽车同质化竞争严重的当下，大模型似乎成了车企追逐的新的差异化竞争力。不过，大模型真正能发挥多大的威力，尚需要打上一个问号。

大模型上车迎来加速度让人嗅到大模型上车气息的是今年上海车展。4月18日，2023上海车展开幕首日，在阿里巴巴新能源汽车发布会上，阿里巴巴集团副总裁、斑马智行首席执行官张春晖表示，大模型开启AI时代，将会重塑千行百业，而汽车是大模型交互的最大场景，智能汽车操作系统也会被重塑。　　张春晖宣布，AliOS智能汽车操作系统已接入通义千问大模型进行测试，并正式发布了“用户定义汽车”理念下的斑马智行第三代汽车AI能力体系Banma Co-Pilot，相关技术会率先在智己汽车上应用。　　Banma Co-Pilot拥有场景定制化、多源数据、专业知识、服务接入、行为预测等核心能力，为用户带来个性化体验。　　在上海车展的商汤绝影展台，与商汤大模型体系深度融合的绝影未来展示舱亮相，商汤科技推出的“日日新SenseNova”大模型体系拥有语言大模型以及数字人等多种生成式AI能力，可为车舱提供更智能和人性化的多模态人车交互体验。　　5月，百度Apollo汽车智能化业务展示了以文心大模型为基础的新一代AI智舱探索成果。据悉，这是国内首个大模型在汽车行业应用的成果探索，有望在未来推进量产。百度Apollo创新性地演示了基于文心大模型能力探索下，智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力，同时也展示了在当前智舱命令式交互下覆盖全车多音区、毫秒级响应、免唤醒全时交互的体验。　　第一个即将量产的搭载大模型的车型是吉利银河L6，它将于今年第三季度上市交付。其车机搭载的是高通骁龙8155芯片，同时，该车还配备生成式AI产品——Wow壁纸和依托AI智能语言搜索引擎而来的车外语音交互功能。　　今年6月，梅赛德斯-奔驰宣布与微软达成合作，将ChatGPT人工智能功能引入到汽车之中。对此，微软官方表示，这是ChatGPT首次应用到汽车环境之中。从本周五开始，美国的奔驰用户可以提前体验到ChatGPT语音助手的测试版本。　　同样是在6月，理想汽车在常州智能制造基地举办的家庭科技日上，正式宣布推出自家研发的认知大模型Mind GPT。据悉，在Chat-GPT发布之前，理想汽车的空间算法团队已经开始了整个大语言模型的训练。　　在自动驾驶领域，今年4月，毫末智行在第八届HAOMO AI DAY上，正式发布全球首个自动驾驶生成式大模型DriveGPT，中文名确定为“雪湖·海若”（海若，即北海若，古代中国传说中北海的海神）。　　据介绍，DriveGPT采用了与ChatGPT相同的Transformer模型和人类反馈强化学习RLHF技术。该功能通过引入真实驾驶场景和人驾接管数据，可对自动驾驶认知决策模型进行持续优化。　　毫末智行首席执行官顾维灏表示，毫末DriveGPT设计了五个大模型来挖掘自动驾驶数据价值并解决自动驾驶中的一些关键问题，包括视觉自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型和人驾自监督认知大模型。　　不难发现，大模型短期内在智能座舱领域应用最多，目前即将上车的大模型也都集中在智能座舱上，而至于自动驾驶领域，大模型发挥作用的周期会相对比较长。　短期内更适合智能座舱“现在的大模型更适合做车内个人助理，比如开个空调，订个路线。”一位从事汽车智能化开发的专业人士李飞鸿（化名）告诉《中国汽车报》记者，“我第一辆车就有语音识别功能。那时候，按一个按钮，随便发出个声音，系统会强行定位到一个功能，甚至咳嗽一下，系统都会说‘打开空调’。到后来，语音识别技术提升后，汽车能识别自然语音，拒绝无意义的声音。驾驶员不用说固定的几个命令，汽车有一定的语言理解能力。现在到大模型，驾驶员不是给汽车下达命令，而是很自然地进行交流，在交流中提出要求。智能座舱就像给驾驶员配了一个秘书，秘书理解驾驶员的话，帮驾驶员做一些事情。这个交流不是一句话里带所有命令的要素，而是能理解上下文。做的事情也不是事先预定的操作，而是比较开放多元的操作，甚至不限于汽车提供的驾驶和娱乐。譬如：它可以在打开雨刮器的同时去查找附近售卖雨伞的地方。”　　不过，大模型并不适合做安全驾驶相关的操作。在李飞鸿看来，现阶段的大模型看上去很像人，但容易睁着眼睛说瞎话。“如同一个爱吹牛的人，本事没多少，但让他做的事都会应承下来，并且去做，不管对不对。和驾驶安全相关的，还是要谨慎点。”他说。　　虽然大模型还不算可靠，可在顾维灏看来，大模型将加速自动驾驶时代的到来。最近他在接受媒体采访时表示：“过去20年对于自然语言理解可能由许多个很深入的模块去解决一个特定的问题，但如今有了ChatGPT这一种模型一个模式就够了。类比到自动驾驶也是一样，比如：包含感知、预测、规划、决策、控制几个环节，毫末在AI DAY上把后面的四个环节都合成一个环节，未来会把感知也合到DriveGPT当中。总之，把多个任务合成一个，然后用一个超能力去解决。在新的技术范式下，一切都会改变。自动驾驶产业发展也快20年了，到今天技术也没有成熟。我认为，用GPT技术范式来解决自动驾驶的瓶颈问题，自动驾驶时代会提早很多年到来，并且无人驾驶也一定会实现。”　消费者对大模型认知模糊新技术在汽车上的应用，往往会带来成本的增加。同样，大模型的应用可能会对汽车的售价产生一定影响。不过，具体影响程度取决于应用的具体方式和范围。大模型在汽车行业的应用包括自动驾驶、智能交通、智能网联等方面，这些应用可能会对汽车的设计、制造、配置等方面产生影响，从而影响汽车的售价。例如，自动驾驶技术的应用需要增加大量的传感器和计算设备，这些设备可能会增加汽车的制造成本和售价。另一方面，大模型的应用也可能会带来一些新的功能和优势，例如提高行车安全、改善驾驶体验等，这些功能和优势也可能会对汽车的售价产生影响。　　在李飞鸿看来，大模型能否成为消费者购车时的考虑因素，取决于消费者对大模型所带来的价值和功能的认知程度以及需求程度。从中长期看，大模型在汽车上的应用可以带来更高的安全性和驾驶体验，同时也可以降低成本和提高效率。如果消费者认为这些价值足以抵消购买成本，那么他们可能会选择支持大模型的汽车。此外，如果厂商能够提供足够的售后服务和保障及其他增值服务，也可以增加消费者的购买意愿。因此，消费者是否会为大模型买单，取决于多个因素的综合影响。　　据了解，目前，消费者对大模型的认知程度还比较低，可能存在一些误解或者不确定性的看法。一些消费者可能认为大模型只是汽车行业的未来趋势，还需要时间来证明其实际价值。另外，一些消费者可能认为大模型的应用会带来一些隐私和安全方面的风险，因此可能会有一些疑虑和担忧。总的来说，消费者对大模型的看法还存在一些不确定性。　　李飞鸿认为，大模型的应用对汽车售价的影响需要根据具体的应用方式和范围来具体分析。在应用大模型时，需要综合考虑其实际价值和增加的成本，以制定合理的价格策略，确保消费者的权益和企业的盈利。　　大模型上车面临现实挑战在智能座舱领域，大模型上车不存在明显的困难，最多就是使用体验上的差别。对于自动驾驶而言，大模型会是一个后期潜力大，但需长期投入的事情。　　今年6月，毫末智行联合清华大学智能产业研究院（AIR）举办了今年第二场自动驾驶精品公开课。在现场问答环节，面对网友“大模型到底能给自动驾驶带来什么样飞跃”的提问，毫末智行数据智能科学家贺翔解释说：“我们希望通过大模型非常强大的泛化能力，能够大规模提升自动驾驶对于corner case的处理能力，有了这种能力之后，自动驾驶可以去任何地方，适应任何路况，自动驾驶能处理的场景可能比现在大得多。”　　而当谈到自动驾驶的“ChatGPT时刻”会在什么时候到来时，贺翔也给出了自己的看法。在他看来，ChatGPT之所以带给大家如此大的震撼，在于它天然是多面手。但是，一方面，在自动驾驶领域，不同于ChatGPT只处理文本信号，自动驾驶还要处理图片、点云、交通法规、地图、驾驶行为等一系列信息，自动驾驶要处理的数据模态更复杂；另一方面，自动驾驶对模型的输出精度要求更高、可解释性要求也更强。面对这种特别复杂的模态、特别高的输出要求，实现自动驾驶大模型道阻且长，但行则将至。　　显然，大模型可以为自动驾驶赋能，但赋能到什么程度，是一个谁也说不清楚的问题。　　此外，高昂的成本也是一个巨大的挑战。在李飞鸿看来，通用大模型可以解决日常常识性问题、互联网相关行业的基础入门问题。如果要解决领域里较深的问题，需要对大模型进行二次训练，这就要求二次开发商有一定的能力，特别是AI评估能力。　　“大模型全量训练（完整的语料库训练）一次几周到几个月，投入以百万元计算。训练完，大模型就是个具备普通常识的模型。假设大模型是个高中生，就要通过训练让它变成本科生，了解一些专业知识。行业大模型不可能再从零训练，普通公司也没有相应的技术和财力，所以行业大模型只能进行增量训练，实际上就是一种二次开发。”李飞鸿打比方道：“就像养孩子，养活简单，养好难。大模型怎样用更少的语料做更准的训练，如何评价训练结果，这些都考验企业的能力。”　　另外一个从事大模型研发的业界人士王力（化名）认为，大模型上车面临多重挑战。一是计算资源需求大：大模型需要大量的计算资源，包括GPU、TPU等高速处理器和大量存储设备，这需要高昂的经济投入和复杂的系统设计。　　二是数据采集和标注难度大：大模型需要大量的数据进行训练，但数据的采集和标注是一项复杂且繁琐的工作，需要大量的人力和时间成本。　　三是模型优化难度大：大模型需要大量的计算资源进行训练和优化，需要耗费大量的时间和计算资源，同时还需要进行模型压缩和优化，以提高模型的效率和性能。　　四是容易出现数据隐私和安全问题：大模型需要处理大量的个人数据和敏感信息，需要采取严格的数据保护和安全措施，以保护用户的隐私和数据安全。　　五是会出现实际应用问题：大模型在实际应用中需要面对各种复杂的情况和问题，例如道路条件、天气变化、行人干扰等，需要对其进行精细的调整和优化，以确保其在实际应用中的可靠性和安全性。　　总的来看，大模型上车容易，但最终能发挥几成功力，恐怕连大模型自己都不知道。