人工智能正在重塑千行百業(yè),在智能電動汽車領域,端到端正在改寫自動駕駛的競爭格局,大模型也正在重塑智能座艙的產品形態(tài)和用戶體驗。
01
眼睜睜看著朱顏辭鏡花辭樹的人們經常感慨,這個世界上唯一不變的就是變化。
不過,如果把時間段縮短一些,有一些東西還未曾發(fā)生改變,比如對電子系統(tǒng)的認知方法論。
過去二十年,電子系統(tǒng)經過了數(shù)字化、互聯(lián)網化和智能化的三次范式變革,傷透了電子專業(yè)授課老師的腦殼。
吃過的鹽比年輕老師走過的路還要多的老教師總會傳授準確把握這類系統(tǒng)的黃金法則:在變化中尋找不變,以不變應萬變,電子系統(tǒng)的分析和處理始終遵循輸入-處理-輸出的三段論。
只不過,到了人工智能時代,輸入變成了感知,處理變成了決策,輸出變成了執(zhí)行,表面上換了個馬甲,但內里依然是換湯不換藥。
在端到端自動駕駛方案出現(xiàn)之前,感知-決策-執(zhí)行正是分模塊自動駕駛方案中的三大模塊。
包含自動駕駛系統(tǒng)在內的智能系統(tǒng)雖然在實現(xiàn)形式上都在紛紛轉向全面AI化的端到端,但是,系統(tǒng)的底層邏輯和分析方法依然遵循感知-規(guī)劃-控制的三段論。
大模型對智能座艙系統(tǒng)的改造首先體現(xiàn)在感知層面,基于觸控的規(guī)則式反應進化到基于聽覺的語音小模型之后,再度進化成了聽覺、視覺融合的多模態(tài)感知大模型。
融合聽覺、視覺信息的核心作用是擴大人和智能座艙的交互帶寬。
據(jù)悉,人類通過視覺接收80%的信息,文字表達的信息只有20%。
之所以重要的事情不能在微信上通過文字進行交流,而是要面對面交談,其主要原因就在這里,文字傳遞的信息太少了,不知怎么著,對方就會錯了意。
除了干巴巴的文字,其它各種各樣豐富的信息需要通過手勢、表情、語氣、肢體動作進行傳遞,稍微有點人生的經驗,就知道這是一個顛撲不破的真理。
02
人世間最大的深情莫過于面對面,還在想著你,世上最大的薄情莫過于面對面,你卻說“我不懂你”。
之前的智能座艙經常被稱為人工智zhang,核心原因就在于“它不懂你”。
之所以出現(xiàn)雞同鴨講、驢頭不對馬嘴的尷尬,核心原因有三。
第一,用戶之前只能通過語音或觸控單模態(tài)地表達需求,承載用戶意圖的更多豐富信息傳遞不過去,自然不可能“懂你”。
大模型的出現(xiàn)使得座艙可以融合語音、視覺、按鍵、觸控等多維度的信息,通過空間智能感知全方位地接收用戶表達需求的信息,理解用戶意圖。
第二,AI小模型缺乏大模型的注意力機制,只能處理用戶的即時需求,大模型可以生成連續(xù)時空信息,建立長時序處理能力,就可以將單一場景、單一任務的交互升級成為多場景、多任務的交互。
之前的智能座艙交互之所以有很強的機械感,主要原因就在于座艙滿足多場景多任務的能力有限,用戶體驗被搞得零零碎碎,得不到連續(xù)的獲得感。
第三,座艙的認知引擎不具備對自然語言的理解能力,沒有喚醒詞不行,方言聽不懂,口語不支持,理解不了用戶的詞不達意和臨時變更,無法滿足用戶對使用口語自然交流的需要。
空間感知在空間維度上增加了信息模態(tài),長時序感知在時間維度上建立了連續(xù)一致性,空間感知和長時序感知綜合形成了連續(xù)時空多模態(tài)感知,增強了智能系統(tǒng)的感知能力,邁出了機械交互走向自然交互的第一步。
GPT大模型具備超強的自然語言理解和自然語言生成能力,增強了智能系統(tǒng)的認知和決策能力,使得人類可以使用自然語言作為人機交互的內容載體,邁出了機械交互走向自然交互的第二步。從機械走向自然,當然會極大地提升用戶的體驗。
03
自古以來,勞心者治人,勞力者治于人,如果說感知對應眼睛和耳朵,執(zhí)行對應手和腳,是智能座艙系統(tǒng)的勞力者,那么,認知中樞大模型對應大腦,是座艙系統(tǒng)的勞心者,在勞心方面,大模型最核心的能力便是自然語言交互和AIGC。
自然語言交互對應大模型的理解能力,AIGC對應大模型的生成和創(chuàng)造能力。
理解和生成顯然是兩種不同的能力,拿前面的認知方法論來套的話,前者對應感知,后者對應執(zhí)行。
舉個例子,我理解老婆有錢花、隨便花的需求,但因為沒有足夠的物質實力,卻只能夸她一句“你真美”-想得美。
大模型強大的生成能力不僅在于它全面壓縮并灌注了人類世界的所有知識,可以做到上知天文、下知地理,更重要的是,它具備了以往互聯(lián)網搜索技術提供不了的生成能力。
早在PC互聯(lián)網時代,互聯(lián)網就已經存儲了人類世界的所有知識,但是,互聯(lián)網自有一套匹配、過濾、隔離、排名機制,通過搜索自行尋找答案,遠遠比不上大模型即時反饋答案的效率。
更重要的,知識并不直接等于問題和答案,互聯(lián)網可以存儲所有知識,無法存儲所有問題,不具備生成能力的搜索技術顯然回答不了人類在千奇百怪的需求之下提出的各式各樣的問題。
大模型技術具備“無中生有”的能力,可以以相當高的準確度自行組織語言,以縝密的邏輯來回答你的問題,從而充當懂車大師和百科老師。
作為超級大號移動終端,智能電動汽車內部豐富的設備、系統(tǒng)和大模型的推理、規(guī)劃和執(zhí)行能力更是天作之合。
用戶在手機和PC上只能文生圖、文生視頻、圖生圖,但在智能電動汽車中,麥克風、攝像頭、香氛機、氛圍燈、顯示屏、音響、座椅加熱和振動單元等為大模型充分發(fā)揮自身實力提供了廣闊的舞臺和想象空間。
大模型以其多模態(tài)感知、GPT認知中樞和多智能體為用戶提供了豐富的交互框架,重塑了人車交互的范式,在這場轟轟烈烈的人工智能+、+人工智能的運動中,智能電動汽車或許會成為所有智能終端設備中最亮的那一顆星。