馭勢(shì)科技CEO吳甘沙
隨著國(guó)家智能駕駛相關(guān)政策法規(guī)逐漸成型、行業(yè)內(nèi)技術(shù)不斷完善,以及中國(guó)智能駕駛企業(yè)積極推動(dòng)應(yīng)用落地的情況下,中國(guó)智能駕駛市場(chǎng)規(guī)模呈現(xiàn)出持續(xù)擴(kuò)大趨勢(shì)。據(jù)悉,2020年中國(guó)智能駕駛產(chǎn)業(yè)市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)到1214億元人民幣,前景可期。
探索智能駕駛商業(yè)化之路
智能駕駛實(shí)現(xiàn)商業(yè)化需要在以下三個(gè)方面做出努力。首先需要前沿技術(shù)做支撐;其次是企業(yè)家精神,即創(chuàng)新、冒險(xiǎn)、協(xié)作;最后是復(fù)雜系統(tǒng)的管理經(jīng)驗(yàn)。汽車本身是一個(gè)非常復(fù)雜的系統(tǒng),需要管理者具有豐富的管理經(jīng)驗(yàn)。只有同時(shí)具備這三個(gè)條件,才可能實(shí)現(xiàn)智能駕駛的商業(yè)化。
馭勢(shì)科技于2016年3月開始探索、研究智能駕駛相關(guān)技術(shù)的發(fā)展,不斷加強(qiáng)與學(xué)術(shù)界的溝通交流,提升自身的創(chuàng)新水平和研發(fā)技術(shù),目前已具有前沿的無(wú)人駕駛技術(shù)、人工智能技術(shù)、系統(tǒng)工程技術(shù)和汽車電子技術(shù)。首先,開發(fā)軟件,重構(gòu)智能駕駛的軟件系統(tǒng),包括算法、中間件、操作系統(tǒng),尤其是中間件。經(jīng)過(guò)深入考慮,馭勢(shì)科技放棄了如今廣為使用的ROS操作系統(tǒng),改用美國(guó)軍方在武器中使用的輕量實(shí)時(shí)系統(tǒng)RCS。接著4月份,馭勢(shì)科技著手硬件的開發(fā),包括攝像頭、控制器等。5月,算法開始在模擬器上進(jìn)行測(cè)試,同時(shí)開始半閉環(huán)測(cè)試(半閉環(huán),即感知設(shè)備已經(jīng)在車上開始運(yùn)行,但還沒有控制車輛)。直到7、8月,研發(fā)出第一輛可以線控的車,并進(jìn)行了長(zhǎng)時(shí)間的測(cè)試。并在此基礎(chǔ)上開始進(jìn)行全閉環(huán)測(cè)試,也就是真正的路測(cè)。在這個(gè)過(guò)程中,我們遇到了很多困難和挑戰(zhàn),也獲得了諸多成長(zhǎng)經(jīng)驗(yàn)。
困惑之后來(lái)者的定位
當(dāng)前的智能駕駛,主要包括五類。第一類是駕駛輔助系統(tǒng)(driving assistant system),即人開汽車,機(jī)器起一定的輔助作用。第二類是自動(dòng)輔助駕駛,像特斯拉的AutoPilot,它有兩個(gè)要素,(1)在封閉的結(jié)構(gòu)化的高速路上,機(jī)器持續(xù)地實(shí)現(xiàn)自動(dòng)駕駛;(2)駕駛員仍然需要把注意力放在路上,甚至把手放在方向盤上。第三類是高度自動(dòng)駕駛。指不再局限于封閉的高速公路,能夠開到大街小巷。駕駛員可以做其他事情,只要能夠在5秒內(nèi)重新回到?jīng)Q策化,這是比當(dāng)前輔助駕駛更有用的一種自動(dòng)駕駛技術(shù)。第四類是限定場(chǎng)地的無(wú)人駕駛,能夠在城市區(qū)域里實(shí)現(xiàn)無(wú)人駕駛。沒有駕駛員,沒有方向盤、油門、剎車,限定在固定場(chǎng)景,最高時(shí)速在40公里以內(nèi)。第五類是全天候全區(qū)域的無(wú)人駕駛,我們相信在2030年,可能會(huì)出現(xiàn)。如圖1所示。
圖1 智能駕駛的分類
為此,馭勢(shì)科技也面臨著定位選擇。2016年,工信部發(fā)布的智能網(wǎng)聯(lián)汽車發(fā)展技術(shù)路線圖指出,到2020年,我國(guó)每年將有1500萬(wàn)輛車具備駕駛輔助或者輔助駕駛系統(tǒng),同時(shí)在目前的輔助駕駛形態(tài)中,技術(shù)還有很多可改進(jìn)的地方,國(guó)內(nèi)能夠有商業(yè)化技術(shù)的供應(yīng)商還很欠缺,因此我們決定將第二類輔助駕駛作為公司研發(fā)的切入點(diǎn)。
差異化發(fā)展策略
馭勢(shì)科技作為智能駕駛領(lǐng)域的新興企業(yè),一直在探索屬于自己的差異化發(fā)展之路,主要表現(xiàn)在技術(shù)、服務(wù)、成本三個(gè)方面。
1 視覺識(shí)別技術(shù)
今年五月,一輛開啟了Autopilot自動(dòng)駕駛功能的特斯拉Model S被卷入了一場(chǎng)嚴(yán)重的事故中,車內(nèi)的駕駛員在車禍中不幸身亡。這起事故發(fā)生在佛羅里達(dá)州中部的一段公路,當(dāng)時(shí)一輛拖拉機(jī)掛車正在橫穿高速公路,疾馳而來(lái)的特斯拉Model S迎頭撞上了掛車。自動(dòng)駕駛的過(guò)程中多種傳感器失效、未能發(fā)現(xiàn)掛車,導(dǎo)致悲劇。
這場(chǎng)事故更加突出了自動(dòng)駕駛在技術(shù)上存在一些缺陷。首先是視覺缺陷,事故發(fā)生時(shí),正處于典型的逆光狀態(tài),實(shí)際上從目前Autopilot的系統(tǒng)來(lái)看,它具備動(dòng)態(tài)曝光和自動(dòng)增益的能力,理論上在強(qiáng)逆光或微光情況下,仍舊能夠識(shí)別前車尾部。但是案發(fā)當(dāng)場(chǎng),卡車是橫在路上的,它的截面并不符合這套視覺系統(tǒng)識(shí)別的特征,因此當(dāng)時(shí)的視覺系統(tǒng)是失效的。或許有人會(huì)問(wèn),毫米波雷達(dá)為什么沒有起作用?雷達(dá)在遠(yuǎn)距離發(fā)現(xiàn)了橫在路面上的一排反射點(diǎn),但是為了避免誤剎車,它做了一個(gè)比較保守的分類,將障礙物分類為橫跨路面的一個(gè)交通標(biāo)志牌,并希望隨著距離的縮減能夠有更準(zhǔn)確的分類。但是,根據(jù)當(dāng)時(shí)的情況判斷,事故發(fā)生時(shí)毫米波雷達(dá)是放空的。
針對(duì)以上提及的視覺缺陷,首先可以改進(jìn)雷達(dá)的算法,這也是特斯拉正在做的。特拉斯通過(guò)與博世合作,挖掘更多的數(shù)據(jù),得到六倍之多的object,每個(gè)object也有更多的信息,同時(shí)實(shí)現(xiàn)了將3D的雷達(dá)影像在時(shí)間維度對(duì)object進(jìn)行correlation,這樣可以更好地區(qū)分動(dòng)態(tài)和靜態(tài)object,以及虛假反射。此外,還可以采取一種眾包的方式區(qū)別永久和臨時(shí)的障礙物。如果很多車經(jīng)過(guò)一個(gè)場(chǎng)景時(shí),都判定前方有一個(gè)靜態(tài)障礙物,那么就可以斷定確實(shí)存在一個(gè)障礙物;如果并不是所有車都能判定有障礙物,那么就可以將其稱之為臨時(shí)障礙物。
其次,通過(guò)基于深度學(xué)習(xí)的視覺算法提升感知能力。相比起傳統(tǒng)的視覺算法,它能從不同距離、不同角度進(jìn)行識(shí)別,既可以識(shí)別奇形怪狀的車輛,也可以識(shí)別被遮擋的車輛。在此基礎(chǔ)上,馭勢(shì)科技又利用立體攝像頭做了一個(gè)視覺雷達(dá),它能夠?qū)崟r(shí)識(shí)別出靜態(tài)、動(dòng)態(tài)障礙物的點(diǎn)云,并實(shí)時(shí)用暖冷色調(diào)標(biāo)識(shí)其距離和相對(duì)速度。視覺雷達(dá)與深度學(xué)習(xí)相結(jié)合,就能有效避免特斯拉遇到的問(wèn)題。對(duì)此,我們開始輔助駕駛系統(tǒng)的商業(yè)化。馭勢(shì)科技的這套視覺識(shí)別系統(tǒng)實(shí)現(xiàn)了100公里時(shí)速的高速輔助駕駛,并且具有自主超車能力,累計(jì)測(cè)試?yán)锍探咏?萬(wàn)公里。
2 高質(zhì)量的服務(wù)
目前國(guó)內(nèi)很多車廠若想實(shí)現(xiàn)輔助駕駛,需要找國(guó)際的廠商,這樣實(shí)現(xiàn)周期會(huì)很長(zhǎng),而且也無(wú)法獲得高質(zhì)量和及時(shí)的服務(wù)。馭勢(shì)科技希望用最快的響應(yīng)速度,降低客戶的時(shí)間成本。我們?cè)鴥H用兩周時(shí)間既在車廠的樣車上裝好了這套系統(tǒng),并且開始測(cè)試。另一方面,我們?cè)敢馔苿?dòng)技術(shù)創(chuàng)新的擴(kuò)散,與車廠和供應(yīng)商實(shí)現(xiàn)開放的、協(xié)同的創(chuàng)新,包括知識(shí)產(chǎn)權(quán)和源代碼、模型等的開放,測(cè)試數(shù)據(jù)的共享,并且?guī)椭蛻籼嵘灾餮邪l(fā)能力。
3 深度學(xué)習(xí)的成本
當(dāng)然,成本也是我們考量的一個(gè)因素,甚至是技術(shù)路線的約束元素。比如深度學(xué)習(xí)需要很強(qiáng)的計(jì)算能力,其硬件的選擇就面臨了性能和成本的權(quán)衡。目前嵌入式CPU的性能仍有一定差距,無(wú)法做到實(shí)時(shí)。而ASIC雖然功耗、成本最低,但缺乏靈活性,考慮到未來(lái)幾年深度學(xué)習(xí)算法仍在快速演進(jìn),ASIC也不是最佳選擇。GPU目前來(lái)說(shuō)是最好的選擇,英偉達(dá)已經(jīng)與多家車廠和一級(jí)供應(yīng)商開展合作,但對(duì)Level 2來(lái)說(shuō)價(jià)格偏貴。FPGA略便宜、功耗也較低,但是算法移植的成本也是可觀的。神經(jīng)網(wǎng)絡(luò)加速器NPU具有模型和算法的可定制能力,性能也最好,但作為新的硬件平臺(tái),符合車規(guī)尚需時(shí)日,而且車廠對(duì)新平臺(tái)以及供應(yīng)商的選擇偏保守。
DSP是目前的主流選擇,但在深度學(xué)習(xí)上性能還有差距,就CEVA等IP供應(yīng)商的技術(shù)路線圖來(lái)看,未來(lái)幾年性能上獲得突破的可能性很大。考慮成本的競(jìng)爭(zhēng)力,未來(lái)2~3年Level 2產(chǎn)品化的主要平臺(tái)還是以DSP為主,而Level 3以上則要依靠GPU和FPGA等。基于這個(gè)判斷,我們必須讓算法適配這些硬件平臺(tái)。比如,部分使用傳統(tǒng)視覺取代深度學(xué)習(xí),比如車道線檢測(cè)。雖然目標(biāo)檢測(cè)上,傳統(tǒng)視覺還不能做到深度學(xué)習(xí)那樣,但與雷達(dá)融合可以彌補(bǔ)視覺精確度的下降。另一方面,需要訓(xùn)練多任務(wù)網(wǎng)絡(luò),讓同一個(gè)網(wǎng)絡(luò)模型做不同事情,如行人識(shí)別、汽車識(shí)別、交通標(biāo)志識(shí)別等。此外,還可以做圖像壓縮、模型壓縮,優(yōu)化算法(減少region proposal,非深度學(xué)習(xí)與深度學(xué)習(xí)級(jí)聯(lián)等),針對(duì)定點(diǎn)處理器優(yōu)化等降低深度學(xué)習(xí)的復(fù)雜度。
激光雷達(dá)和視覺的融合
作為一個(gè)創(chuàng)業(yè)公司,馭勢(shì)科技希望可以找到特定的市場(chǎng)細(xì)分領(lǐng)域,比如安東尼·列文托斯基的Otto選擇的領(lǐng)域?yàn)樨涇嚒A硗庖粋€(gè)小的細(xì)分領(lǐng)域?yàn)樗接械缆贰⒋_定路線,如園區(qū)、景區(qū)、主題公園、高爾夫球場(chǎng)、機(jī)場(chǎng)等場(chǎng)地的無(wú)人駕駛。那么,在這樣場(chǎng)景的無(wú)人駕駛中,是否還需要激光雷達(dá)?有些廠商的回答是否定的。特斯拉Autopilot 1.0只用了一個(gè)前置攝像頭和一個(gè)前向的毫米波雷達(dá),而2.0用了八個(gè)攝像頭,前向有三個(gè)不同距離和視場(chǎng)角的攝像頭,兩邊的前側(cè)有兩個(gè),兩邊的后側(cè)有兩個(gè),后視有一個(gè),如圖2所示,它的理念是希望通過(guò)攝像頭的視覺加上毫米波雷達(dá)和超聲波能夠?qū)崿F(xiàn)無(wú)人駕駛。特斯拉聲稱,明年車上硬件部分已經(jīng)可以支持完全的無(wú)人駕駛,但是它的軟件算法還是需要逐漸迭代。
圖2 激光雷達(dá)與視覺的融合
但是后來(lái)經(jīng)過(guò)了幾個(gè)月的探索,我們轉(zhuǎn)變了研究思路。一是因?yàn)樯疃葘W(xué)習(xí)的技術(shù)同質(zhì)化以及它在魯棒性上的缺陷,使得純靠視覺存在很大問(wèn)題。二是因?yàn)榧す饫走_(dá)的成本問(wèn)題已經(jīng)不再是一個(gè)難題。
在未來(lái)很多車輛的設(shè)計(jì)中,基本都實(shí)現(xiàn)了包括激光雷達(dá)在內(nèi)的多種傳感器360度無(wú)死角多冗余的配置。基于此,我們也開始進(jìn)行激光雷達(dá)和視覺的融合。它一方面使其對(duì)環(huán)境的感知更加精準(zhǔn),也會(huì)產(chǎn)生新的使用模式,如激光雷達(dá)幫助視覺進(jìn)行校準(zhǔn),視覺利用激光雷達(dá)做ground truth等。另一方面,加入激光雷達(dá),會(huì)提高汽車的安全可靠性。馭勢(shì)科技設(shè)計(jì)了兩款針對(duì)私有道路的無(wú)人駕駛汽車,一款是由一輛低速的電動(dòng)車改造而成的,一款是完全自主設(shè)計(jì)的無(wú)人駕駛共享出行車。它是兩臺(tái)座椅對(duì)著坐,沒有方向盤、油門、剎車,已在北京一些園區(qū)開始常態(tài)化測(cè)試,即將進(jìn)入試運(yùn)行。特別值得一提的是,這款無(wú)人駕駛車還實(shí)現(xiàn)了無(wú)線充電的功能,當(dāng)汽車電量耗光后,它可以自己尋找?guī)в袩o(wú)線充電功能的停車位進(jìn)行充電。
此外,我們嘗試了一系列的算法提升感知和認(rèn)知能力,從簡(jiǎn)單的目標(biāo)識(shí)別到目標(biāo)理解和建立全面世界模型(World Model),從卷積神經(jīng)網(wǎng)絡(luò)到語(yǔ)義分割和實(shí)例分割,實(shí)現(xiàn)惡劣天氣和非結(jié)構(gòu)、半結(jié)構(gòu)道路上的可行駛區(qū)域檢測(cè)。未來(lái),馭勢(shì)科技希望通過(guò)立體視覺識(shí)別道路路面上的坑坑洼洼和障礙物(road hazards),通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)推理從前車掉落動(dòng)態(tài)物品的特性,通過(guò)Inverse Reinforcement Learning方法實(shí)現(xiàn)駕駛員駕駛風(fēng)格的學(xué)習(xí),還有基于強(qiáng)化學(xué)習(xí)和循環(huán)神經(jīng)網(wǎng)絡(luò)來(lái)判斷駕駛態(tài)勢(shì),評(píng)估他人的動(dòng)機(jī),預(yù)測(cè)其行為,合理獲取路權(quán)。
總之,智能駕駛是超級(jí)復(fù)雜的系統(tǒng)工程。就拿全速度自適應(yīng)巡航FSRA來(lái)說(shuō),不僅僅要考慮基本算法,還需要近千個(gè)參數(shù)的表達(dá),全面的實(shí)現(xiàn)和測(cè)試細(xì)節(jié),和完整的系統(tǒng)支持。真正的產(chǎn)業(yè)化不僅僅是對(duì)一些技術(shù)的研發(fā),從學(xué)術(shù)研究到產(chǎn)業(yè)化的“最后的十公里”往往是最困難的,需要學(xué)術(shù)界和產(chǎn)業(yè)界非常緊密的合作。
(本文根據(jù)作者在2016年中國(guó)智能車大會(huì)暨國(guó)家智能車發(fā)展論壇上所作報(bào)告整理)
作者簡(jiǎn)介:
吳甘沙,馭勢(shì)科技聯(lián)合創(chuàng)始人、CEO,致力于研發(fā)最先進(jìn)的自動(dòng)駕駛技術(shù),以改變這個(gè)世界的出行。個(gè)人定位:略通商業(yè)智慧的資深工程師,嘗試破壞式組織變革的技術(shù)管理者,用技術(shù)推動(dòng)社會(huì)創(chuàng)新的趕潮人。
摘自《自動(dòng)化博覽》2017年1月刊