• 金盛:基于車牌識別數據的城市交通管控

    2021-03-09 17:14:04 來源:ITS世界 評論:
    分享到:

    image.png


    金盛 副教授

    浙江大學智能交通研究所



    01


    研究背景



    1.數據賦能交通治理

    image.png

    現在大數據講得太多了,上圖是理想狀態,我們希望有多源感知,多源數據融合來實現協同控制并同時提高城市交通治理的信息化水平或科技水平。但現實并不如我們希望的那么好,雖然我們講多源數據協同,但真正哪個城市能做到所有數據協同?我覺得還是相對比較難,更多的還是利用自己的數據。從交警的角度出發,用車牌識別數據應該是相對質量比較高的手段,也可以獲得也比較穩定的數據,所以我今天主要是講一類數據。

    2.交通運行數據采集方式  

    image.png

    從數據采集方式來說,可以分為三類,不要拘泥于什么樣的檢測設備,而要看檢測設備能得到什么樣的數據。第一類是斷面的數據,不管是線圈、地磁、微波、紅外、雷達、視頻,實際上我們基本上都能得到。第二類是斷面有標識的數據,對交警來說它主要是電警卡口,可能是汽車電子標識、RFID,它對交通部門來說可能是ETC,如果我們以手機為單位,可能就是藍牙,因為他們都可以唯一確定標簽,但是樣本跟布設密度有關,密度越高能采集的數據量越大。當布設面積非常大的時候,基本可以等同于軌跡數據。第三類是軌跡數據,包括GPS、LBS、手機信令等等,但問題是抽樣率并沒有那么高。

    3.數據驅動的交通管控發展   

    image.png

    從管控發展來說是伴隨數據,從最開始沒有數據,到靜態數據,再到動態數據,我們交通管控的方式和方法都會產生變化。

    02


    數據特征



    1.交通數據采集的發展

    image.png

    下面我們來看一下數據的類型和特性,傳統的數據就不多說了,比如線圈,現在交警幾乎沒有采用,因為我們天天修路,修了挖,挖了修,這種方式穩定性并不那么好。但并不是說這種數據不好,可能說它并不完全適合我們的國情。第二類是標簽數據,這類數據在我們城市中是布設最多的,我們有大量的電警和卡口,這一點我跟很多交警溝通過,在南方城市的好多交叉口幾乎80%-90%的路口都布設了電警,這樣的電警布設密度其實已經非常大了。第三類是軌跡,這個互聯網公司用得很多,但是它可能也存在幾個問題,一是抽樣率并沒那么高,二是數據規模非常龐大,一般的公司和單位相對比較難處理,需要借助互聯網數據的處理能力,三是涉及到隱私的問題,因為在互聯網上,隱私的保護更重要,這類數據想做深度挖掘會帶來一系列障礙。但是我想在很遙遠的未來,或者說一段時間內,軌跡數據的出現肯定是趨勢。但是就現階段而言,我覺得車牌識別的數據是非常重要的。

    2.數據類型

    image.png

    再看一下車牌識別數據是干嘛的。其實電警也好,卡口也好,本意并不是為了采集交通數據,而是為了執法,為了治安防控。但是由于它的數據形式決定了我們可以用這種數據類型做交通管理的分析,它的基本類型其實我們都知道,首先要有經緯度,有車通過這個點的坐標、時間以及車型,這是最基本的數據,但最本質最核心的是離散斷面的時空大數據,有了這個數據我們可以干什么?同時這個數據有一些問題。我們現在所有的電警卡口都講自己的整車率有100%或99%,但這是不是真實的機動車全樣本數據呢?并不是。如果你綜合天氣和網絡的問題,可能也只能到80%-90%,這已經非常好了,這是第一點。

    3.數據質量

    第二點,車牌識別的準確性到底有多高?從產品檢測角度來說可能都很好,但是現實中我們通過數據分析,可能并沒有那么好,很多時候往往是沒有識別出來,而是通過一些其他的手段恢復過來,或者給它附一個值,所以準確率并沒有想象中的那么高。

    第三點,它并不是為了交通檢測而生的而是為了執法附帶的交通檢測功能,無論從復用的角度來說還是從經濟效益的角度來說,如果能得到一些更加精細化和結構化的參數,能更好地支撐管理應用,而不是執法應用那就更好了。

    最后是設備的優化,其實這個在很多城市已經不成問題了,它幾乎是百分之百的布設,如果是這種情況的話那不是大問題,但如果成本有限,我甚至覺得只要有50%-60%路口的布設,基本上就能實現后面所有的應用。

    03


    四個典型應用


    1.通勤模式識別

    大家知道我們的交通擁堵基本都發生在早晚高峰,這決定了整個城市擁堵最核心的機動車應該是通勤車,所以怎么通過車牌識別把通勤車精準地識別出來呢?前面很多朋友講的畫像,其實也可以認為是一種畫像。

    image.png

    我們通過車輛在路網上的一些時空特征把它構建為十個運行特征指標,包括出行距離的指標以及時間的指標等等,細節我不展開講了。

    image.png

    有了這個指標后,我們通過這個指標對車輛做聚類,就能把車輛精確分開。分開之后,通過決策樹的方法,能夠把通行車的規則識別出來,這是非常關鍵的。

    image.png

    這個規則是什么呢?其實到最后是非常簡單的規則,如果你是通勤車,并且滿足PPT上的兩條公式,那你就是通勤車。整個杭州市共有260萬輛機動車,但我們識別出在杭州市的限行區域內,只有10萬輛符合通勤模式的車。其實真正對城市交通擁堵起到最關鍵作用的就是這10萬輛車,如果我們把這10萬輛車剝離出來,下圖的早晚高峰特性會非常明顯。

    2.多態行程時間估計

    image.png

    由于卡口的好處,我們可以上下游做車牌匹配,那其實我們就得到了這個路段上車輛的行程時間,但這個行程時間其實是多態的。什么意思呢?要么你停一次車,要么你停兩次車,這是非常離散的。

    image.png

    根據這個特性,我們可以用密度聚類的方法,把車輛的行程時間分成不同的組,每一組代表停一次車還是停兩次車。如果是停兩次車的車,你的行程時間就比別人多了一個紅燈時間,相當于精確地把每個車的運行狀態刻畫出來,對于路段的狀態描述更加精準。原來我這個路段所有的車平均停車2.5次,但是通過這個方法你可以知道,有10%的車停了4次,20%的車停了3次,大部分車停了2次,這樣就可以更加精確地識別。

    3.新冠肺炎疫情對機動化出行的影響

    image.png

    第三個很有意思,疫情期間我們跟義烏做了合作,我們把疫情對交通的影響分成了四個階段,第一個階段是背景,我們把它定在2019年沒有疫情的時候。第二個階段本來是疫情期間,但那時正好趕上春節,所以這部分數據本來就有問題,所以我們把第二個階段定到剛開始復工復產的階段。第三個階段是全面復工復產,最后一個階段是常態化。我們看一下這四類對交通狀態有多大的影響,大概有5000多個電警和卡口,用了大概是八周的時間,有接近30億條數據。

    image.png

    先看總體情況,路網的總流量,看第二個階段,剛開始復工復產的時候,總體的路網需求比最高峰的時候降低了50%以上,按照路網載運數和車出行的不均勻度和出行強度來說,到第三和第四階段其實都沒有恢復。也就是說,大家出行的車輛數基本恢復到了疫情前,但是在出行強度以及運行的車輛數方面遠遠沒有達到疫情之前,這個影響還是非常大的,對出行的影響直接帶來的就是對經濟的影響。

    image.png

    我們識別出了非本地化的車,因為義烏是個比較特殊的城市,這兒有大量外地來的車,外地車的出行強度、出行總量及出行時間也可以看出在慢慢恢復,但其實沒有恢復。

    image.png

    如果我們分城市看,最上面的線是杭州的情況,其實到義烏的車幾乎沒有變化,而下面三條分別是浙江省內的臺州、溫州和湖北省,從這里你就能看出,在疫情復工復產之后,其實我們的管控還是非常嚴格的。我們之所以能這么快得戰勝疫情,其實從交通管控上就能看出來,在復工復產之后,從疫情嚴重區域過來的外地車基本減少了50%以上。

    image.png

    第三個是網約車、出租車,通過車牌識別數據把車輛類型識別出來,從出行總量、出行強度和時間來看也都沒有恢復。也就是說,我們的出租車和網約車每天平均的出行強度是疫情前的三分之二左右,影響還是非常大的。

    image.png

    為什么大家不坐出租車呢?主要是因為自己的私家車使用率非常高,把私家車使用率識別出來后你就會發現,在早晚高峰期使用私家車的比例會比第一階段高20%-30%,也就是原來通勤的出行可能會使用公共交通,可能會使用出租車、網約車,而現在的通勤出行都變成了小汽車。

    image.png

    image.png

    從出行的時間來看也是,疫情期間出行的時間變短,對我們不太需要的出行降低了很多。其實空間的分布也是這樣,與高峰出行相比,原來出行的點比較密集,到了疫情之后的階段,我們出行的點其實并沒有那么離散。也就是說,原來我們也許會有很多娛樂和其他類型的出行,但是現在都沒有了,都變成了通勤出行,最后看終點的情況,這樣一來其實我們的目的地會更加密集,這都是疫情的影響。

    image.png

    第四個,多路徑協調控制。其實之前有其他專家也講過,我們原來做干線協調的時候,就應該考慮整條線雙向直行,但是有了車牌識別數據之后,其實我們知道出行的OD和轉向比例之后,我們可以根據轉向比例做多路徑的綠波協調,我們建立的優化目標,既要考慮協調帶寬,也要考慮協調連接性,可以直行跟直行連接,也可以直行跟左轉連接,從而建立復雜的多目標優化方法。

    image.png

    這是杭州的一個連續的八路口,它有很多轉向需求,我國的路網跟國外不一樣,不是干線和支路相交,考慮到不同的左轉,我們需要把左轉和直行的協調構建起來,這種優化的路徑其實比單純考慮直行雙向的綠波協調效果要好。其實不管是總體的延誤還是左轉車的延誤都會大大降低,在這里我們其實利用了電警的數據。

    04


    總結



    總之,我們需要做數據賦能,可以通過數據挖掘出每個人的畫像。另外,靶向治理和數據的應用要聚焦到每一個應用場景,把每個場景做好,就能實現數據的價值。


  • 關鍵字: 車牌識別
  •    責任編輯:黑蘿莉
  • 每周新聞精選

  • 關于我們
  • 聯系我們
  • 廣告贊助
  • 日本漫画之无翼德男女主在各种地方做gif老湿机视频懂得 美国av蜜瓜电影网 欧洲老太70~80 一级a做爰片视频美国日本毛片高清