一种出行方案推荐方法及推荐系统与流程
个性化推荐算法:Amazon Kindle Unlimited,Kobo的推荐系统 #生活乐趣# #阅读乐趣# #电子书推荐#
本发明涉及视频图像处理技术领域和数学建模技术领域,特别涉及基于数字图像处理与多目标决策的出行方案推荐方法及推荐系统。
背景技术:
随着城市规模和人口的不断扩大、互联网和物联网的日趋成熟,我们的日常生活都在朝着智能化、信息化等方面多元发展,“智慧城市”概念成为城市建设的主流方向,而智能交通系统的蓬勃兴起不仅为每个人提供了便利,也已成为当前国际公认解决交通问题的最佳途径。目前,很多实时公交公众号和app相继推出,在抢占市场的同时,也表明未来智慧公交的发展大方向一定是符合民众需求,解决现存公交出行的“痛点”问题。在我国的山东、浙江等地区,依靠云计算和云平台的海量数据处理能力,开始试行“智能公交车站”来为乘客提供出行的信息服务。
在“智能公共交通”需求日益增多的今天,如何根据实时交通路况及用户查询信息以提供最优路线,是我们必须思考的重要问题。在城市公共交通智能化管理方面,如何提高乘客满意度及改善乘车体验是智能公共交通系统研究的核心内容。
目前的公共交通app如高德地图、百度地图等显示的公交出行方案包括线路信息(直达及换乘)、时间信息(到站时间及总时间)等。重庆城市综合交通枢纽(集团)有限公司和重庆交通大学的专利cn201810858818.5公开了一种公共交通出行诱导系统,西南交通大学的专利cn201610193300.5提供了一种一体化出行综合决策支持模型,但在乘车体验方面均考虑得不够周到,均未考虑到车厢拥挤程度对乘车体验的影响,如对于身体残疾或者带着大件行李出行的乘客,除了乘车时间外,往往更倾向于等待一辆拥挤度低的车。
另外,对于人流量的预测或监测大部分都是基于宏观角度的,即对一定时间,一定范围内的总人流量进行检测,从而在宏观的角度上进行调控。如在大型商场,火车站,汽车站,繁华道路等场景进行的人流量监控。由于其指向范围较广,对于普通用户来说,针对性不强,能够从中提取出的信息十分有限。
技术实现要素:
本发明的目的在于克服现有技术的缺点与不足,提供一种出行方案推荐方法及推荐系统,此方法及系统综合考虑车厢拥挤程度,提高乘客的出行质量。
本发明的目的通过以下的技术方案实现:一种出行方案推荐方法,包括步骤:
接收用户的查询信息;
预测站台候车人数:获取同一路线、同一站台、同一时间段上下车人数时间序列,预测站台候车人数;
预测车厢拥挤度:结合站台候车人数和车厢人数统计预测车厢拥挤度;
预测车辆到站时间;
最优方案判定:综合站台候车人数、车厢拥挤度、到站时间属性,建立标准化决策矩阵,对各属性赋予权值,计算出加权标准化决策矩阵,匹配用户查询信息后给出最优出行方案的推荐。本方法在考虑时间的因素上,创造性地加入了车厢拥挤度作为方案推荐的参考因素,提出将站台上下车人数以及车厢中部视频得到的信息量相结合作为拥挤度判定标准,较为精确地得到每辆公交车的实时拥挤度,以便能够适应更多人的需求,更加人性化。
优选的,所述预测站台候车人数的步骤为:
通过公交车前后门的摄像头采集上下车人数,在数据量达到一定程度后,提取出同一站台、同一线路、同一时间段的上车人数或下车人数,构成人数序列;
在检验其平稳性后,建立时间序列模型,利用arma模型对站台的上、下车人数进行预测,同时加入天气、节假日等参考因素,使预测结果更加准确。
更进一步的,所述arma模型的建模步骤下:
检验人数序列的平稳性:利用获取到的数据生成时序图,用观察时序图的方法来判定数据的平稳性,根据平稳性的定义,平稳序列具有常数均值和常数方差的性质,因此其时序图应该在一个常数值附近波动,且波动的范围有界;同时,根据实际情况推测,短时间内站台上下车人数不会有明显增长或者下降;
模型识别和定阶:arma(p,q)模型的形式为:
其中φ1,φ2,…,φp、θ1,θ2,…,θq和εt,εt-1,…,ε1分别是自回归参数、移动平均参数和白噪声序列,xt-1...xt-p为模型的输入自变量序列,即预测的历史依据;根据自相关系数和偏自相关系数来初步判断arma模型的阶数p和q,计算出样本自相关系数(acf)和偏相关系数(pacf);
模型的参数估计:根据识别的模型及其阶数,采用最小二乘法来对模型进行参数估计;
模型检验:经过模型识别、定阶和参数估计,需要对模型进行残差序列检验分析;当残差序列是白噪声序列时拟合模型才有效,方可用于预测;计算残差序列{ε(t)}的s步自相关系数ρ1、ρ2、...ρs,然后构造卡方统计量fs,如下式所示,fs服从自由度为s的χ2分布;式中,n为残差序列的容量;
利用arma模型计算结果进行预测;输入线路、站台、时间等数据后,即可得到预测的候车人数;将arma模型计算结果作为主要的预测依据,同时加入天气、节假日等参考因素,使预测结果更加准确。
优选的,所述预测车厢拥挤度的步骤为:
通过车厢中部摄像头,提取图像分区hog特征,预判定车厢的拥挤度;
通过车厢门摄像头,捕捉人头,统计上下车人数,通过将各站台上车人数累加,同时减去下车人数的方法,得出车厢内人数;
结合预判定结果和车厢人数,计算到站拥挤度。
人数统计和图像分析两种拥挤度分析互为补充,可提高拥挤度判定的准确性。
更进一步的,所述提取图像分区hog特征,预判定车厢的拥挤度具体为:
采用方向梯度直方图(histogramoforientedgradient,hog)特征提取、信息量计算,对输入的车厢中部视频图像,对每个图像分区提取其hog特征,设定一定阈值筛选出有效梯度值,从而统计有效梯度的角度直方图,对图像划分分区,每个分区取g个角度方向,并计算这g个角度的梯度值;结合有效梯度值的方差g2和图像信息熵h计算如下:
上式中h表示g个角度方向中的第h个角度方向;μ为平均梯度值;pij表示某像素位置上的灰度值与其周围像素灰度分布的综合特征;选择图像的领域灰度均值作为灰度分布的空间特征值,与图像的像素灰度组成特征二元组,记为(i,j),其中i表示像素的灰度值,0≤i≤255,j表示领域灰度值,0≤j≤255;f(i,j)为特征二元组(i,j)出现的频数;u、v分别为图像的长和宽;图像的信息熵为h;
计算最终的图像像素的混乱程度e=(g,h),当分区梯度值方差小且信息熵大,表明该分区的像素值分布比较混乱,则该分区拥挤程度大;站台候车人数和车厢人数统计的结果,与车厢中部拥挤度的判定结果相互补充,拥挤时,相应的人数统计值也应较大,因此,可人数统计与中部摄像头拥挤度计算结果,来协同判定最终的车厢拥挤度,作为出行方案的判定依据。
更进一步的,所述预测车厢拥挤度的步骤具体为:
计算实时拥挤度:主要根据发车后的上下车人数的累加值来判定,同时利用车厢中部摄像头计算的拥挤度来修正结果,其中,通过车厢中部摄像头,提取图像分区hog特征来辅助预判定车厢的拥挤度,计算如下:
其中,ereal_time是实时查询图像像素的混乱程度,即实时拥挤度;
计算到站拥挤度:由实时拥挤度ereal_time累加上查询车辆所在站点和乘客站点间的站台,这中间站点的上下车人数历史统计结果来预测得出,即可实现对到站拥挤度的预测,计算如下:
其中,egetin_station是到站拥挤度,
优选的,所述预测车辆到站时间的步骤为:
采用历史状态匹配的方法,在始发数据匹配的条件下,计算当前数据与历史数据的欧氏距离,从而对到站时间进行预测;
非参数回归方法通过对大量历史数据的搜索,寻找与当前输入状态最为相似的集合,以此来预测下一时刻的状态;假设公交车到达k-1站,其始发时刻对应的数据状态为s;用tkm和t'km分别表示历史数据库中所有数据状态为s的第m条记录对应的k-1站到k站的站间行驶时间和k站的停靠时间;取j为非参数回归的近邻数,d为非参数回归的维度;采用欧氏距离am将其与历史数据匹配,选取j个近邻,这里用a表示这j个近邻的集合,根据这些近邻点运用加权平均的方法预测公交车从k站到k+1站的行驶时间tk:
e是与m不同的a集合里的近邻点;同理,可以通过k-d,…,k-2、k-1站的停靠时间,利用上述公式预测该公交车在k站的停靠时间,d为与站点k相差的站点数。
更进一步的,预测车辆到站时间时,将公交车在当前站的预测停靠时间与到下一站的预测行驶时间的和为预测运行时间,作为卡尔曼滤波算法的输入参数,从而实现对预测结果的动态修正;
公交车在第k-1站的预测停靠时间与第k-1站到k站的预测行驶时间的和为预测运行时间,作为卡尔曼滤波算法的输入参数;
卡尔曼滤波算法是由建立的状态方程和观测方程对需要处理的信号做出满足最小均方误差的估计,结合上一时刻的估计值以及当前时刻的观测值完成对状态变量的估计,并求解当前估计值;公交车到站时间预测的卡尔曼滤波的状态方程如下所示:
其中t(k+1)、t'(k+1)分别表示公交车从起站点到达第k站点所经历的时间和观测时间,u(k)表示公交车从k到k+1站的站间行驶时间,s(k)、i(k)和m(k)分别为数据状态转移变量、输入变量、测量值系数,w(k)和v(k)分别为输入噪声和测量噪声,并设定卡尔曼滤波的状态转移变量、输入变量和测量值的系数都为1,输入噪声和测量噪声均是互不相关、均值为0的独立白噪声;
当公交车到达第k个站点时,卡尔曼滤波根据第k个站点的观测值tkm+1和前k-1个基础时间序列计算出第k个站点的最优估计值,进而得到第k+1站点的调整值,根据调整值依次更新后续站点的时间,并将本次更新后的时间序列加入到基础时间序列当中。
优选的,所述最优方案判定的步骤为:
标准化决策矩阵;设出行方案决策矩阵为z=(zxy)l·w,其中x为出行方案下标,y方案属性下标,zxy表示x方案y属性的值,l、w分别代表决策矩阵的长和宽,即方案的总数与各方案属性总数;方案属性包括车厢拥挤度、候车人数、到站时间、换乘次数等内容。设规范化决策矩阵b=(bxy)l·w,其中bxy表示规范化后的x方案y属性的值,则有:
计算加权规范决策矩阵;根据影响出行体验因素的重要程度设定权值,其中,到站时间的权值最大,候车人数的权值最小,构成权重向量q=[r1,r2,...,rw]t,进而构成加权规范矩阵c=(cxy)l·w,其中cxy=rx·bxy(x=1,2...,l;y=1,2...,w;r表示权重系数);
确定理想解和负理想解;确定正理想解cy+(正理想解的第y个属性)和负理想解cy-(负理想解的第y个属性)则:
正理想解
负理想解
其中,车厢拥挤度、候车人数、到站时间均为成本性属性,正理想解都取最小值,负理想解都取最大值;
计算每个出行方案到理想解和负理想解的距离;
到正理想解的距离为
到负理想解的距离为
计算各方案的排队指标值,即综合评价指数:由到正理想解和负理想解的距离共同给出,方案的综合评价指标排队值quex的计算方法如下:
按quex由大到小排列方案的优劣次序:将最终得出的各方案的综合评价指标值,即quex由小到大排列,其中,quex最大的方案即为最优方案,即本算法的最终输出。
更进一步的,所述推荐的出行方案为从最匹配至匹配度一般的一系列推荐方案。
一种出行方案推荐系统,包括交互模块、站台候车人数判断模块、拥挤度判断模块、到站时间判断模块、出行方案判定模块;
所述交互模块用于接收用户的查询信息,推送最优出行方案给用户;
所述站台候车人数判断模块,用于获取同一路线、同一站台、同一时间段上下车人数时间序列,预测站台候车人数;
所述拥挤度判断模块,用于结合站台候车人数和车厢人数统计预测车厢拥挤度;
所述到站时间判断模块,用于预测车辆到站时间;
所述出行方案判定模块,用于综合站台候车人数、车厢拥挤度、到站时间属性,建立标准化决策矩阵,对各属性赋予权值,计算出加权标准化决策矩阵,匹配用户查询信息后给出最优出行方案的推荐。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明在考虑时间的因素上,创造性地加入了车厢拥挤度作为方案推荐的参考因素,提出将站台上下车人数以及车厢中部视频得到的信息量相结合作为拥挤度判定标准,较为精确地得到每辆公交车的实时拥挤度,以便能够适应更多人的需求,更加人性化。
2、本发明预测站台候车人数时建立时间序列模型,利用arma模型对站台的上、下车人数进行预测,同时加入天气、节假日等参考因素,使预测结果更加准确。
3、本发明预测车厢拥挤度时,结合上下车人数和hog图像判断车厢拥挤度,二者互为补充,可提高拥挤度判定的准确性。
4、本发明给出的出行方案推荐是一系列从优到一般的出行推荐,充分考虑到乘客的需求的同时保证了其自由选择的可能。
附图说明
图1是本发明出行方案推荐系统示意图。
图2是本发明拥挤度判断模块判断流程。
图3是本发明出行方案推荐方法预测到站时间流程图。
图4是本发明出行方案推荐方法流程图。
具体实施方式
为了更好的理解本发明的技术方案,下面结合附图详细描述本发明提供的实施例,但本发明的实施方式不限于此。
实施例
当用户选择出行的目的地时,系统根据用户的出行习惯,如部分用户更偏向出行的舒适度,即希望车厢有较低的拥挤度,实时更新各属性的权值,为车厢拥挤度赋予较高的权重,通过获取各方案车厢的预测拥挤度以及到站时间后,利用topsis方法对所有方案进行排序,将最优方案推荐给用户。
本实施例公开了一种公交出行方案推荐方法,本实施例的所有步骤都是基于java开发环境、opencv函数库及mysql数据库完成的。本发明的具体实施技术方案是首先输入用户的查询信息至出行方案推荐系统的交互模块,出行方案推荐系统还包括站台候车人数判断模块、拥挤度判断模块、到站时间判断模块、出行方案判定模块,当用户输入乘车信息,即根据站台候车人数、车厢拥挤度和到站时间,来综合计算出最优的出行方案的实时乘车系统。
(1)拥挤度判断,主要采用方向梯度直方图(histogramoforientedgradient,hog)特征提取、信息量计算,并结合站台候车人数和车厢人数统计来判定车厢拥挤度。对输入的车厢中部视频图像,对每个图像分区提取其hog特征,设定一定阈值筛选出有效梯度值,从而统计有效梯度的角度直方图,对图像划分分区,每个分区取g个角度方向,并计算这g个角度的梯度值。结合有效梯度值的方差g2和图像信息熵h计算如下:
h表示g个角度方向中的第h个角度方向;μ为平均梯度值,上式pij表示某像素位置上的灰度值与其周围像素灰度分布的综合特征,选择图像的领域灰度均值作为灰度分布的空间特征值,与图像的像素灰度组成特征二元组,记为(i,j),其中i表示像素的灰度值(0≤i≤255),j表示领域灰度值(0≤j≤255),f(i,j)为特征二元组(i,j)出现的频数,u、v分别为图像的长和宽,则图像的信息熵为h。
由e=(g,h)计算出最终的图像像素的混乱程度,当分区梯度值方差小且信息熵大,都表明该分区的像素值分布比较混乱,则该分区拥挤程度大。站台候车人数和车厢人数统计的结果,与车厢中部拥挤度的判定结果相互补充,拥挤时,相应的人数统计值也应较大,因此,车厢前后门摄像头的人数统计与中部摄像头拥挤度计算结果,来协同判定最终的车厢拥挤度,作为出行方案的判定依据。
具体的,所述预测车厢拥挤度的步骤为:
计算实时拥挤度:主要根据发车后的上下车人数的累加值来判定,同时利用车厢中部摄像头计算的拥挤度来修正结果,其中,通过车厢中部摄像头,提取图像分区hog特征来辅助预判定车厢的拥挤度,计算如下:
其中,ereal_time是实时查询图像像素的混乱程度,即实时拥挤度;
计算到站拥挤度:由实时拥挤度ereal_time累加上查询车辆所在站点和乘客站点间的站台,这中间站点的上下车人数历史统计结果来预测得出,即可实现对到站拥挤度的预测,计算如下:
其中,egetin_station是到站拥挤度,
(2)在公交车到站时间预测部分,本实施例基于大量的公交车到站历史数据,通过非参数回归方法得到到站时间预测值,作为卡尔曼滤波算法的输入参数以实现对到站时间的动态修正以较为精确地预测公交到站时间。
非参数回归方法通过对大量历史数据的搜索,寻找与当前输入状态最为相似的集合,以此来预测下一时刻的状态。假设公交车到达k-1站,其始发时刻对应的数据状态为s。用tkm和t'km分别表示历史数据库中所有数据状态为s的第m条记录对应的k-1站到k站的站间行驶时间和k站的停靠时间。取j为非参数回归的近邻数,d为非参数回归的维度。采用欧氏距离am将其与历史数据匹配,选取j个近邻(这里用a表示这j个近邻的集合),根据这些近邻点运用加权平均的方法预测公交车从k站到k+1站的行驶时间tk:
同理,可以通过k-d,…,k-2、k-1站的停靠时间,利用上述公式预测该公交车在k站的停靠时间,d为与站点k相差的站点数。公交车在第k-1站的预测停靠时间与第k-1站到k站的预测行驶时间的和为预测运行时间,作为卡尔曼滤波算法的输入参数。
卡尔曼滤波算法是由建立的状态方程和观测方程对需要处理的信号做出满足最小均方误差的估计,结合上一时刻的估计值以及当前时刻的观测值完成对状态变量的估计,并求解当前估计值。公交车到站时间预测的卡尔曼滤波的状态方程如下所示:
其中t(k+1)、t'(k+1)分别表示公交车从起站点到达第k站点所经历的时间和观测时间,u(k)表示公交车从k到k+1站的站间行驶时间,s(k)、i(k)和m(k)分别为数据状态转移变量、输入变量、测量值系数,w(k)和v(k)分别为输入噪声和测量噪声,并设定卡尔曼滤波的状态转移变量、输入变量和测量值的系数都为1,输入噪声和测量噪声均是互不相关、均值为0的独立白噪声。
当公交车到达第k个站点时,卡尔曼滤波根据第k个站点的观测值tkm+1和前k-1个基础时间序列计算出第k个站点的最优估计值,进而得到第k+1站点的调整值,根据调整值依次更新后续站点的时间,并将本次更新后的时间序列加入到基础时间序列当中。
根据我们目前采集的历史数据来看,同一线路的公交车的站间行驶时间十分有规律可循,因此在有大量历史数据的前提下,我们能找到和当前输入状态最为相似的集合,以此来预测下一时刻的状态,进而预测出到站时间,并且卡尔曼滤波方法利用了最为邻近的历史数据进行修正,有较好的实时性,一定程度上避免了使用到相对久远的数据带来的预测误差,两者方法相辅相成,以便能预测到较为精确的到站时间和乘客到达目的地的总行驶时间。
(3)候车人数预测,我们将获取到的数据按照路线、站台、星期数、时间段进行划分,得到同一路线同一站台同一时间段上下车人数时间序列。建立arma模型,进而对等车人数进行预测。建模步骤下:
①检验序列的平稳性:利用获取到的数据生成时序图,用观察时序图的方法来判定数据的平稳性,根据平稳性的定义,平稳序列具有常数均值和常数方差的性质,因此其时序图应该在一个常数值附近波动,且波动的范围有界。同时,根据实际情况推测,短时间内站台上下车人数不会有明显增长或者下降。
②模型识别和定阶:一般的arma(p,q)模型的形式为:
其中
③模型的参数估计:根据识别的模型及其阶数,采用最小二乘法来对模型进行参数估计。
④模型检验:经过模型识别、定阶和参数估计,需要对模型进行残差序列检验分析。当残差序列是白噪声序列时拟合模型才有效,方可用于预测。计算差序列{ε(t)}的s步自相关系数ρ1、ρ2、...ρs,然后构造卡方统计量fs,如下式所示,fs服从自由度为s的χ2分布;式中,n为残差序列的容量;
⑤利用arma模型计算结果进行预测。输入线路、站台、时间等数据后,即可得到预测的候车人数。将arma模型计算结果作为主要的预测依据,同时加入天气、节假日等参考因素,使预测结果更加准确。
(4)出行方案判定,通过综合考虑车厢拥挤度、站台同车候车人数以及公交到站时间这三项指标,来科学合理地为乘客制定乘车方案,提高乘车满意度,实现智能出行。
topsis是逼近理想解的排序方法,它借助多目标决策问题的理想解和负理想解给方案集合中各方案排序。通过对每辆公交的车厢拥挤度、候车人数、到站时间这三个指标进行量化,并根据实际情况赋予相应权重,分别计算出每辆公交到理想解与负理想解的距离,将各方案排序,给出最优解。具体步骤如下:
①标准化决策矩阵;设出行方案决策矩阵为z=(zxy)l·w,其中x为出行方案下标,y为方案属性下标,zxy表示x方案y属性的值,l、w分别代表决策矩阵的长和宽,即方案的总数与各方案属性总数,下同。方案属性包括车厢拥挤度、候车人数、到站时间、换乘次数等内容。设规范化决策矩阵b=(bxy)l·w,其中bxy表示规范化后的x方案y属性的值,则有:
②计算加权规范决策矩阵;根据影响出行体验因素的重要程度设定权值,其中,到站时间的权值最大,候车人数的权值最小,构成权重向量q=[r1,r2,...,rw]t,进而构成加权规范矩阵c=(cxy)l·w,其中cxy=rx·bxy,x=1,2...,l;y=1,2...,w;r表示权重系数;
③确定理想解和负理想解;确定正理想解cy+(正理想解的第y个属性)和负理想解cy-(负理想解的第y个属性)则:
正理想解
负理想解
其中,车厢拥挤度、候车人数、到站时间均为成本性属性,正理想解都取最小值,负理想解都取最大值。
④计算每个出行方案到理想解和负理想解的距离;
到正理想解的距离为
到负理想解的距离为
⑤计算各方案的排队指标值(即综合评价指数):由到正理想解和负理想解的距离共同给出,计算方法如下:
⑥按quex由大到小排列方案的优劣次序:将最终得出的各方案的综合评价指标值,即quex由小到大排列,其中,quex最大的方案即为最优方案,即本算法的最终输出。
由于公交的换乘可以类比至地铁,因此本实施例方法也可以应用至地铁上。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
网址:一种出行方案推荐方法及推荐系统与流程 https://www.yuejiaxmz.com/news/view/958160
相关内容
一种旅行美食推荐系统及方法与流程一种智能饮食推荐系统及方法与流程
出行路线推荐方法、装置、设备及存储介质与流程
一种智能饮食推荐系统的制作方法
一种基于机器学习的营养饮食推荐及评价方法与流程
推荐系统的工作流程
一种健康菜谱智能推荐系统的制作方法
推荐系统:个性化推荐的算法与策略
推荐系统:个性化推荐的算法与实践
个性化推荐算法(推荐系统)概要