人工智能正在重塑千行百業(yè)，在智能電動汽車領(lǐng)域，端到端正在改寫自動駕駛的競爭格局，大模型也正在重塑智能座艙的產(chǎn)品形態(tài)和用戶體驗(yàn)。

01

眼睜睜看著朱顏辭鏡花辭樹的人們經(jīng)常感慨，這個世界上唯一不變的就是變化。

不過，如果把時間段縮短一些，有一些東西還未曾發(fā)生改變，比如對電子系統(tǒng)的認(rèn)知方法論。

過去二十年，電子系統(tǒng)經(jīng)過了數(shù)字化、互聯(lián)網(wǎng)化和智能化的三次范式變革，傷透了電子專業(yè)授課老師的腦殼。

吃過的鹽比年輕老師走過的路還要多的老教師總會傳授準(zhǔn)確把握這類系統(tǒng)的黃金法則：在變化中尋找不變，以不變應(yīng)萬變，電子系統(tǒng)的分析和處理始終遵循輸入-處理-輸出的三段論。

只不過，到了人工智能時代，輸入變成了感知，處理變成了決策，輸出變成了執(zhí)行，表面上換了個馬甲，但內(nèi)里依然是換湯不換藥。

在端到端自動駕駛方案出現(xiàn)之前，感知-決策-執(zhí)行正是分模塊自動駕駛方案中的三大模塊。

包含自動駕駛系統(tǒng)在內(nèi)的智能系統(tǒng)雖然在實(shí)現(xiàn)形式上都在紛紛轉(zhuǎn)向全面AI化的端到端，但是，系統(tǒng)的底層邏輯和分析方法依然遵循感知-規(guī)劃-控制的三段論。

大模型對智能座艙系統(tǒng)的改造首先體現(xiàn)在感知層面，基于觸控的規(guī)則式反應(yīng)進(jìn)化到基于聽覺的語音小模型之后，再度進(jìn)化成了聽覺、視覺融合的多模態(tài)感知大模型。

融合聽覺、視覺信息的核心作用是擴(kuò)大人和智能座艙的交互帶寬。

據(jù)悉，人類通過視覺接收80%的信息，文字表達(dá)的信息只有20%。

之所以重要的事情不能在微信上通過文字進(jìn)行交流，而是要面對面交談，其主要原因就在這里，文字傳遞的信息太少了，不知怎么著，對方就會錯了意。

除了干巴巴的文字，其它各種各樣豐富的信息需要通過手勢、表情、語氣、肢體動作進(jìn)行傳遞，稍微有點(diǎn)人生的經(jīng)驗(yàn)，就知道這是一個顛撲不破的真理。

02

人世間最大的深情莫過于面對面，還在想著你，世上最大的薄情莫過于面對面，你卻說“我不懂你”。

之前的智能座艙經(jīng)常被稱為人工智zhang，核心原因就在于“它不懂你”。

之所以出現(xiàn)雞同鴨講、驢頭不對馬嘴的尷尬，核心原因有三。

第一，用戶之前只能通過語音或觸控單模態(tài)地表達(dá)需求，承載用戶意圖的更多豐富信息傳遞不過去，自然不可能“懂你”。

大模型的出現(xiàn)使得座艙可以融合語音、視覺、按鍵、觸控等多維度的信息，通過空間智能感知全方位地接收用戶表達(dá)需求的信息，理解用戶意圖。

第二，AI小模型缺乏大模型的注意力機(jī)制，只能處理用戶的即時需求，大模型可以生成連續(xù)時空信息，建立長時序處理能力，就可以將單一場景、單一任務(wù)的交互升級成為多場景、多任務(wù)的交互。

之前的智能座艙交互之所以有很強(qiáng)的機(jī)械感，主要原因就在于座艙滿足多場景多任務(wù)的能力有限，用戶體驗(yàn)被搞得零零碎碎，得不到連續(xù)的獲得感。

第三，座艙的認(rèn)知引擎不具備對自然語言的理解能力，沒有喚醒詞不行，方言聽不懂，口語不支持，理解不了用戶的詞不達(dá)意和臨時變更，無法滿足用戶對使用口語自然交流的需要。

空間感知在空間維度上增加了信息模態(tài)，長時序感知在時間維度上建立了連續(xù)一致性，空間感知和長時序感知綜合形成了連續(xù)時空多模態(tài)感知，增強(qiáng)了智能系統(tǒng)的感知能力，邁出了機(jī)械交互走向自然交互的第一步。

GPT大模型具備超強(qiáng)的自然語言理解和自然語言生成能力，增強(qiáng)了智能系統(tǒng)的認(rèn)知和決策能力，使得人類可以使用自然語言作為人機(jī)交互的內(nèi)容載體，邁出了機(jī)械交互走向自然交互的第二步。從機(jī)械走向自然，當(dāng)然會極大地提升用戶的體驗(yàn)。

03

自古以來，勞心者治人，勞力者治于人，如果說感知對應(yīng)眼睛和耳朵，執(zhí)行對應(yīng)手和腳，是智能座艙系統(tǒng)的勞力者，那么，認(rèn)知中樞大模型對應(yīng)大腦，是座艙系統(tǒng)的勞心者，在勞心方面，大模型最核心的能力便是自然語言交互和AIGC。

自然語言交互對應(yīng)大模型的理解能力，AIGC對應(yīng)大模型的生成和創(chuàng)造能力。

理解和生成顯然是兩種不同的能力，拿前面的認(rèn)知方法論來套的話，前者對應(yīng)感知，后者對應(yīng)執(zhí)行。

舉個例子，我理解老婆有錢花、隨便花的需求，但因?yàn)闆]有足夠的物質(zhì)實(shí)力，卻只能夸她一句“你真美”-想得美。

大模型強(qiáng)大的生成能力不僅在于它全面壓縮并灌注了人類世界的所有知識，可以做到上知天文、下知地理，更重要的是，它具備了以往互聯(lián)網(wǎng)搜索技術(shù)提供不了的生成能力。

早在PC互聯(lián)網(wǎng)時代，互聯(lián)網(wǎng)就已經(jīng)存儲了人類世界的所有知識，但是，互聯(lián)網(wǎng)自有一套匹配、過濾、隔離、排名機(jī)制，通過搜索自行尋找答案，遠(yuǎn)遠(yuǎn)比不上大模型即時反饋答案的效率。

更重要的，知識并不直接等于問題和答案，互聯(lián)網(wǎng)可以存儲所有知識，無法存儲所有問題，不具備生成能力的搜索技術(shù)顯然回答不了人類在千奇百怪的需求之下提出的各式各樣的問題。

大模型技術(shù)具備“無中生有”的能力，可以以相當(dāng)高的準(zhǔn)確度自行組織語言，以縝密的邏輯來回答你的問題，從而充當(dāng)懂車大師和百科老師。

作為超級大號移動終端，智能電動汽車內(nèi)部豐富的設(shè)備、系統(tǒng)和大模型的推理、規(guī)劃和執(zhí)行能力更是天作之合。

用戶在手機(jī)和PC上只能文生圖、文生視頻、圖生圖，但在智能電動汽車中，麥克風(fēng)、攝像頭、香氛機(jī)、氛圍燈、顯示屏、音響、座椅加熱和振動單元等為大模型充分發(fā)揮自身實(shí)力提供了廣闊的舞臺和想象空間。

大模型以其多模態(tài)感知、GPT認(rèn)知中樞和多智能體為用戶提供了豐富的交互框架，重塑了人車交互的范式，在這場轟轟烈烈的人工智能+、+人工智能的運(yùn)動中，智能電動汽車或許會成為所有智能終端設(shè)備中最亮的那一顆星。

大廠吃上大模型的熱乎飯，用戶是得給智能座艙點(diǎn)個贊

01

02

03

今日新聞更多>>

房產(chǎn)家居更多>>

汽車頻道更多>>

讀書樂趣更多>>

電子產(chǎn)品更多>>

財經(jīng)播報更多>>

大廠吃上大模型的熱乎飯，用戶是得給智能座艙點(diǎn)個贊

01

02