解決城市交通的有效途徑就是發(fā)展公共交通,而公交調(diào)度指揮著公交的正常營運(yùn),公交調(diào)度數(shù)據(jù)庫中記錄著大量的實(shí)時和歷史數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù)處理這些大量的數(shù)據(jù),并轉(zhuǎn)化成有價值的信息,用于分析營運(yùn)趨勢及各項(xiàng)指標(biāo),為管理者提供決策支持,從而提升企業(yè)效益。
1.什么是數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(Data Mining,DM)又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discover in Database,KDD),是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能、模式識別、數(shù)據(jù)庫、可視化技術(shù)等,高度自動化地分析企業(yè)的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助管理者做出正確的決策。

2.數(shù)據(jù)挖掘的特點(diǎn)
(1)數(shù)據(jù)量大:大量的數(shù)據(jù)通過數(shù)據(jù)挖掘算法能夠反映數(shù)據(jù)的規(guī)律及特征。
?。?)隱含性:數(shù)據(jù)挖掘是發(fā)現(xiàn)深藏在數(shù)據(jù)內(nèi)部的信息,而不是浮現(xiàn)在數(shù)據(jù)表面的信息。
?。?)價值性:通過數(shù)據(jù)挖掘?qū)楣芾碚咛峁Q策支持,從而提升企業(yè)效益。
3.數(shù)據(jù)挖掘常見算法
?。?)C4.5:C4.5算法是機(jī)器學(xué)習(xí)算法中的一種分類決策樹算法,其核心算法是ID3算法。
(2)k-means algorithm算法:k-means algorithm算法是一個聚類算法,把n的對象根據(jù)他們的屬性分為k個分割,k<n。
(3)Support vector machines:支持向量機(jī)算法是一種監(jiān)督式學(xué)習(xí)的方法,廣泛的應(yīng)用于統(tǒng)計(jì)分類以及回歸分析中。
(4)The Apriori algorithm:Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法。
(5)最大期望(EM)算法:最大期望(EM,Expectation–Maximization)算法是在概率模型中尋找參數(shù)最大似然估計(jì)的算法。
(6)PageRank:PageRank算法是Google算法的重要內(nèi)容。
(7)AdaBoost:Adaboost是一種迭代算法。
(8)k-nearest neighbor classification:K最近鄰(k-Nearest Neighbor,KNN)分類算法,是一個理論上比較成熟的方法,也是最簡單的機(jī)器學(xué)習(xí)算法之一。
(9)Naive Bayes:樸素貝葉斯模型有著堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ),以及穩(wěn)定的分類效率。
(10)分類與回歸樹(CART,Classification and Regression Trees):在分類樹下面有兩個關(guān)鍵的思想。第一個是關(guān)于遞歸地劃分自變量空間的想法;第二個想法是用驗(yàn)證數(shù)據(jù)進(jìn)行剪枝。
4.公交調(diào)度數(shù)據(jù)挖掘
數(shù)據(jù)挖掘技術(shù)的應(yīng)用是為了完善調(diào)度系統(tǒng),公交調(diào)度數(shù)據(jù)挖掘的對象是智能調(diào)度系統(tǒng)數(shù)據(jù)庫,根據(jù)營運(yùn)調(diào)度的實(shí)時上傳數(shù)據(jù),進(jìn)行數(shù)據(jù)挖掘。公交調(diào)度數(shù)據(jù)挖掘流程如下圖所示:

(1)數(shù)據(jù)準(zhǔn)備建立模型
數(shù)據(jù)準(zhǔn)備就是對智能調(diào)度系統(tǒng)數(shù)據(jù)庫中有關(guān)行車計(jì)劃數(shù)據(jù)進(jìn)行搜集,建立相應(yīng)數(shù)據(jù)模型,包括應(yīng)用時刻表、車輛使用計(jì)劃、配班計(jì)劃等,以支持公交調(diào)度方案的生成。
數(shù)據(jù)庫以O(shè)racle建立的,行車時刻數(shù)據(jù)表字段包括時刻表ID、發(fā)車時間、到達(dá)時間、發(fā)車間隔等字段;配班計(jì)劃表字段包括班次、上下班時間、班組等字段;車輛使用計(jì)劃表字段包括線路ID、車輛ID等字段。
(2)處理營運(yùn)調(diào)度數(shù)據(jù)
對搜集的原始信息進(jìn)行分析整理,對海量的數(shù)據(jù)信息進(jìn)行清算過濾,將無效數(shù)據(jù)、錯誤數(shù)據(jù)、重復(fù)數(shù)據(jù)等進(jìn)行詳細(xì)分類整理。同時進(jìn)行營運(yùn)調(diào)度問題與偏差分析,調(diào)度人員根據(jù)不同的問題采取相應(yīng)的調(diào)度措施。
根據(jù)車輛營運(yùn)實(shí)際,當(dāng)車輛發(fā)生故障、車輛臨時調(diào)出、串車、嚴(yán)重堵塞等問題發(fā)生時,車輛調(diào)度將與計(jì)劃出現(xiàn)偏差,數(shù)據(jù)挖掘?qū)⑦@些問題進(jìn)行挖掘整理便于及時調(diào)整車輛調(diào)度。

(3)數(shù)據(jù)分析構(gòu)建挖掘模型
公交調(diào)度是在營運(yùn)車輛偏離行車計(jì)劃后針對遇到的問題采取的調(diào)度措施,確保發(fā)車間隔、發(fā)車時間、發(fā)車次序等正?;?。數(shù)據(jù)分析構(gòu)建挖掘模型為了最大發(fā)揮數(shù)據(jù)信息的應(yīng)用價值,將數(shù)據(jù)信息進(jìn)行多樣式多方位分析,確保正常營運(yùn)的同時準(zhǔn)確預(yù)測未來一定時間內(nèi)各項(xiàng)營運(yùn)指標(biāo)。
在處理調(diào)度問題上,主要通過調(diào)整發(fā)車時間、發(fā)車類型、發(fā)車次序等措施確保車輛正常營運(yùn)。

(4)深入剖析挖掘數(shù)據(jù)的結(jié)果
根據(jù)結(jié)果并結(jié)合實(shí)際情況進(jìn)一步分析營運(yùn)狀況,進(jìn)而能夠根據(jù)智能調(diào)度系統(tǒng)進(jìn)行優(yōu)化調(diào)度,推動智慧公交的進(jìn)一步發(fā)展。

在智能調(diào)度系統(tǒng)中合理應(yīng)用數(shù)據(jù)挖掘技術(shù),通過各種數(shù)據(jù)挖掘算法完善調(diào)問題,進(jìn)而更好地做好營運(yùn)調(diào)度工作,合理制定排班工作。
參考文獻(xiàn):
[1]尹克堅(jiān) 淺談數(shù)據(jù)挖掘在智慧交通領(lǐng)域中的應(yīng)用 信息通信,2013(10)
[2]楊雪 數(shù)據(jù)挖掘在公交調(diào)度中的應(yīng)用研究 北京交通大學(xué)
[3]MBA智庫百科
Copyright 2004-2022 ChinaBus.Info All Rights Reserved 京公網(wǎng)安備 11010502038442號 京ICP備14048454號-2
版權(quán)所有:客車信息網(wǎng) 主辦單位:北京國脈中通文化傳媒有限公司