TrafficMaps.org
問題
這個周休二日我要載家人去宜蘭度假,不知道雪隧什麼時候比較不塞車?
到底需不需要禮拜六一大早就把全家人挖起床趕快出發?
禮拜天下午幾點前不回台北就會陷在車陣中動彈不得?
解答:交通時空圖譜 (Traffic Maps)
Traffic Maps 是基於 Heat Map 的概念呈現量化數據。
例如在高速公路即時路況資訊 中,
每個路段以綠 、
黃 、
橙 、
紅 、
紫 五種顏色區別平均車速由快到慢。
而在 Traffic Maps 中,我們把縱軸定義為空間,把橫軸定義為時間,
例如下圖是國道五號南下方向在2015年元旦一整天的小客車平均行駛車速,塞車的時段與路段清楚可見。
(原始數據來源:交通部臺灣區國道高速公路局「交通資料庫」 )
關於
Traffic Maps 是一個視覺化的交通觀測站,提供給終端用戶的服務包含了即時和歷史路況訊息,
可以讓用路人鑑往知來,不用搜尋及消化許多數據就可以一目了然的掌握整體趨勢,
快速做出聰明的旅程規劃,避開塞車時段與路段。
用路人請用手機由此進入玩App
或用手機掃描以下QR Code進入
原創貢獻
Traffic Maps 的原創貢獻是將 Infographic
的概念優化。Infographic倡議的是將數據、信息或知識以可視化的形式呈現 ,
而 Traffic Maps 所倡議的是進一步將數據以可視化的形式存在 ,
作為一個可以用來綜觀全貌的 Big Picture,立即產生 Visual Insight,
如此可以把 "Transforming Data into Information" 的概念向下扎根變成設計的 DNA,從而促進
"Transforming
Big Data into Big Understanding" 。
就電腦科學的術語來說,這裡的原創概念是指 Data
Serialization 與
Visualization 的融合。
要實現這個概念並不困難,就是將原始數據儲存在影像檔的像素中。
此設計模式有以下兩個特點,
提供資料科學家及應用程式開發者搭配雲端數據中心打造高效能的應用程式:
使用接近於信息的數據。 數據本身存在的格式可以立即顯示或是很快映射到人類直覺易懂的色彩空間。
除了提供視覺洞察外,還可以迅速抽取出來做其它應用,例如動態播放歷史路況,或是分析車速於流量臨界點的變化。
使用信息含量密度高的數據。 只要簡單應用現有成熟的影像壓縮演算法,
就可以使得數據的儲存空間與傳遞時間大幅降低,並且讓所需的計算資源極小化,軟體工具的支援度極大化。
在大數據的時代我們可以使用 End-to-End Application-Specific Data Codec
將格式固定的結構化數據做高效的 Content Delivery,從而避免
用卡車運送大數據的窘境 。
研究人員請用電腦與滑鼠由此進入 體會什麼是接近於信息、
且信息含量密度高的可視化數據。應用範例是分析車速於流量臨界點的變化。
通用設計概念
以上應用程式雖僅以平均車速 介紹 Traffic Maps 的概念,
但其它量化數據也可以用 Traffic Maps 呈現,
例如大客車、大小貨車與聯結車的交通量 可以作為旅遊業及物流業經濟景氣的溫度計。
Traffic Maps 的設計概念也可以應用到智慧公車,以台北e-Bus 為例,
每條公車路線的站牌就相當於虛擬的ETC門架,
我們將相鄰站牌間的路徑長度除以到站時間差就可以得到此路段的平均車速,
另外再搭配載客人數的 Traffic Maps,就可以輕鬆的找到應該聚焦的問題所在,改善交通瓶頸與經濟效益。
在其它沒有e-Bus系統的地方也可以用智慧型手機的應用程式以 Crowdsourcing 搭配 Geofencing
的方法來建構類似的信息。
這種設計模式不僅限應用於交通的領域,當中也不是一定要包含時間軸才行。各式各樣的 Heat Maps
像是溫度、濕度、雨量等氣象資料也可以用這種設計模式加以儲存及傳遞。
(想要預測行車速度,我們最好混搭中央氣象局開放出來的降雨量統計,進行歷史數據分析。)
以中央氣象局的溫度分布圖 為例,
假設某時刻的原始數據是由許多包含經緯度與溫度值的紀錄組合而成,
以 XML、JSON 或 CSV 等格式存檔壓縮後開放出來。
我們可以改成以更小的影像檔發布,其中原始數據的經緯度被映射到點陣圖的位置,
每一點像素的RGB空間用來儲存溫度值,在應用程式中將此資料當作
Heat Map Layer 覆疊在地圖上顯示即可。
此處我們僅用 ETC M05A 上下游偵測站間各車種平均行駛車速的小客車數據來呈現 Traffic Maps 的概念,
其它由高公局彙整的ETC大數據 ,
例如
(1) M03A 各類車種通行量統計、
(2) M04A 站間各車種平均旅行時間、
(3) M07A 各類車種旅次平均長度、
(4) M08A 各類車種旅次數量,也都可以用 Traffic Maps 的概念來設計。
設計模式效益
若某數據服務的接取網路是2G/3G/4G/LTE-M/NB-IoT等須付費的傳輸管道,
則其長期累積的數據資費會是成本結構中的主要支出。
就物聯網的時代而言,
1%效率的提升就可以使若干產業獲得巨大的價值 。即便一個接近於零的成本降低或利潤賺取,
乘上很大的基數 (系統內連網機器的個數,再乘上事件發生的次數),
就像是薄利多銷的獲利公式。
未來 5G Massive Machine Type Communications (mMTC)
的應用將以物聯網傳感器所採集的結構化數據為大宗,相信 Traffic Maps
的設計模式對於海量傳感器的信息匯流與交換等程序,可以帶來聚沙成塔的經濟效益。
舉一個具體的車聯網應用來說,
如果我們把 Usage Based Insurance (UBI) 所需的 On Board Diagnostic (OBD) 結構化數據以
Traffic Maps 的設計模式做出一個
End-to-End Application-Specific Data Codec ,
長時間下來將可省去不少無線數據傳輸費用。
(車聯網是發展最成熟的物聯網之一,UBI 是現在已經發生的車聯網+大數據的商業模式,
隨著科技與商業模式的演進,未來智能聯網車所產生的原始數據將會非常龐大,據估計約每小時
25GB ,
預料在人工智慧/機器學習蓬勃發展下的潮流下,
大量的非結構化數據可以被轉換為結構化數據,伴隨既有類似 OBD 的數據一同傳到雲端,
進而實現聯網車 V2X 的理想境界。)
此應用程式是根據高速公路局交通資料庫之
使用手冊
,每五分鐘自動擷取新遞送的 M05A 報表,再依照
車速與顏色對應 (如下圖示Speed Lossy),
將一整天平均車速製作成一個靜態影像檔 (例如此圖 ),
檔案大小僅5KB。在顯示時,以類似 CSS Image Sprites 的設計概念選取必要的部分呈現即可。
如果有必要完整保存原始數據,在不考慮車速與顏色對應的可視化條件下,
我們可以把車速的數值放在紅綠藍三原色的任何一個 Byte 中
(例如此圖 數據僅放在紅色的 Byte 中),
檔案大小為34KB。但若車速必須與顏色對應,我們可以利用
HSV色彩空間
的色相 (Hue) 代表平均車速,以0°到180°線性映射成0到180km/hr (如下圖示 Speed Lossless) 所產生的圖像
(例如此圖 數據放在紅綠藍的三個 Byte 中),
檔案大小仍然是34KB,不會有顯著的增加。
以2015年元旦這一天為例,若按高公局資料庫現有的處理方式,將一整天的原始數據
(288個CSV檔,共28,896,681 Bytes) 壓縮成
1個.tar.gz檔
(3,517,640 Bytes),能節省約88%的儲存空間以及網路傳輸時間。
若改以下圖所示之無損失色彩空間映射的特殊設計,
搭配一個完整的ETC上下游偵測站列表作為 Traffic Maps 編碼演算法的
Dictionary ,
我們就可以用許多現成的影像函式庫將原始數據壓縮,成為這
1個內含有10個png檔的.tar檔 (1,028,608 Bytes),
如此可節省約96%的儲存空間以及網路傳輸時間。
兩相比較之下,使用 Traffic Maps 的設計模式可以得到8%的改善。
這就是如原創貢獻 所說的,
以可視化影像檔存在的數據不僅更接近於信息,而且信息含量密度更高。
使用PC者可按此鏈結 檢視上述的png檔,
橫向為5種車輛型態(小客車、小貨車、大客車、大貨車、聯結車),縱向為2種數據型態(平均車速、交通量),
個別檔案結構說明在此 ,
數據之分布可見於此 。
移動滑鼠可看見每個像素數據被即時解碼出來的信息,此無損失的還原結果與交通部高公局原始數據比對無誤。
紅色區域表示車速較為緩慢之路段與時段,用滑鼠點選紅色區域可以看到該路段的車速與流量在時間軸上的變化。
設計模式挑戰
想要把 Traffic Maps 這種設計模式應用到其它不同種類的數據上,主要有如下兩個挑戰:
須要針對個別數據的特性重新加以設計。除了上面速度的用例之外,我們日常生活中還可以常常見到諸如溫度、
雨量、電磁波等等的強度用顏色來表示,對於其數值大小與顏色之間的映射已經存在慣用的對應。
而對於不常見的或尚無普遍經驗的數據,在色彩對應上如何能夠設計得更直覺,
會牽涉到心理認知及藝術設計的範疇。
電腦的 RGBA 色彩編程空間有限。就色彩辨識的連續性而言,相近的數值要安排在相鄰的色彩空間位置;
就色彩視覺的分辨度而言,相近的數值彼此之間的距離要儘量大一些才容易做出區隔;
為達到無損失的數據壓縮,必須保證 HSV 到 RGB 的映射是一對一,
也就是說將不同數值編程到不同色彩空間的位置時,彼此之間的距離要足夠大,
才能避免 Hash Collision,如何將廣域的數值(例如浮點數)塞進有限的 RGBA 色彩編程空間,
既能有直覺性又能保持足夠的精確度,會需要許多的模擬實驗。
以下範例是專為 GPS 座標這種數據所設計的色彩空間映射。
先將 WGS84 的經緯度座標轉換為 Degrees, Minutes, Seconds, Sub-Seconds 這幾個部分後,
依下左圖進行第一階圖層 Degrees 的色彩空間映射,
也就是將-180~+180度的經度以 Hue 的漸層表示,而緯度在北半球0~+90度的部分是以 Saturation、
南半球0~-90度的部分以 Brightness 的線性漸層作為區隔
(相當於
CIE LAB color space 的二維簡化版本,省去了 Map Projection 的額外運算)。
之後依下右圖做-60~+60度的 Minutes (第二階圖層)、Seconds (第三階圖層)與 Sub-Seconds
(更多階圖層)的色彩空間映射。這種設計的好處有如下兩點:
色彩的映射同時具有絕對位置及絕對方向的視覺分辨效果,
將傳感器於不同時間的 GPS 座標並列在時間軸上所形成的軌跡數據,
不僅可以達到非常高的壓縮率,還可以對絕對位置及絕對方向的動態改變一目了然。
階層式的數據分割可用來彈性控制位置的精確度以及使用者的隱私度(資訊安全非常非常非常重要)。
結語
數據是二十一世紀的天然資源、是智慧城市的燃料。 Traffic Maps
這種設計模式的價值在於促進大量結構化數據的流動性、活化靜置的數據資源、
提升運行數字經濟的成效。如同 Social Network 是將人與人之間連結起來,
Traffic Maps 是促進數據與數據之間的連結,同樣可以基於
Network Effect
的概念提升數據關聯分析的效益。
聯絡作者