共享单车目前已成为不少大学校园内学生的重要通勤工具,给学生的出行带来了极大便利,但同时也产生了一些问题,如共享单车投放点位设计不合理,高峰期运力不足等。
某高校委托一公司在校园内投放了一批共享单车,经过一段时间运营后,学工处委派几名学生对共享单车的运营情况进行调查分析,以此来评估共享单车的运营情况,并对提升共享单车的使用效率做一些改进。
几名同学利用课余时间选取了晴朗天气对若干共享单车停车点的单车数量进行了统计(数据见附件1)。现请你根据他们统计的数据,分析并解决以下问题:
问题一:根据附件1的数据,估算出目前校园内的共享单车总量,并测算出不同停车点位在不同时间点的数量分布。将结果按要求填入表1。
校园内设若干停车点,记停车点集合为
分别对应“东门”、“南门”……“校医院”。在一天内,调查同学在若干时刻对各停车点的车辆数量进行了多次观测,记观测时间点集合为
其中每个
为实数型时间,如 7:30、8:50 等。目标时间集合为
记原始观测数据为 Dik,即停车点 i€L 在时刻t,的观测车辆数,且可能存在缺测或“200+”等含义不明的字符串。
1.数据清洗与统一化
首先,对带有“+”符号的字符串进行数值化处理,取其数字部分;对缺失值补以 NaN 并保留,以便后续统计。可表示为:
2.时间映射模型
3.同一时段的均值估计
4.全局总量估算
5.空间分布与占比分析
6.不确定性与误差度量
7.时序连续模型(可选扩展)
8.模型验证与残差分析
可通过留一法(LOO)或交叉验证取出部分观测,检验模型对未映射时刻的预测能力。残差定义:
统计残差分布的均值与方差,以评估映射与平均化方法的有效性。
时间/地点 |
东门 |
南门 |
北门 |
一食堂 |
二食堂 |
三食堂 |
梅苑1栋 |
菊苑1栋 |
教学2楼 |
教学4楼 |
计算机学院 |
工程中心 |
网球场 |
体育馆 |
校医院 |
07:00 |
31.0 |
45.5 |
18.3 |
0.0 |
105.0 |
0.0 |
97.0 |
102.0 |
19.0 |
30.0 |
2.3 |
0.0 |
8.5 |
0.0 |
11.0 |
09:00 |
78.0 |
72.0 |
31.0 |
54.0 |
43.0 |
47.0 |
106.0 |
93.0 |
32.0 |
34.0 |
8.0 |
0.0 |
37.0 |
34.0 |
6.0 |
12:00 |
86.0 |
52.0 |
102.0 |
57.0 |
58.0 |
66.0 |
52.0 |
66.0 |
50.0 |
0.0 |
12.0 |
38.0 |
0.0 |
14.0 |
0.0 |
14:00 |
53.5 |
29.0 |
66.0 |
6.3 |
0.0 |
12.0 |
20.0 |
66.7 |
0.0 |
137.7 |
79.5 |
70.0 |
14.0 |
4.5 |
35.0 |
18:00 |
36.0 |
108.0 |
89.7 |
0.0 |
67.7 |
58.3 |
46.0 |
0.0 |
24.7 |
6.0 |
36.0 |
29.0 |
42.5 |
42.2 |
4.5 |
21:00 |
89.5 |
0.0 |
42.0 |
55.0 |
53.0 |
47.0 |
119.0 |
118.0 |
31.0 |
31.0 |
7.0 |
49.0 |
2.0 |
9.0 |
1.0 |
23:00 |
14.0 |
46.5 |
0.0 |
82.5 |
114.3 |
123.0 |
128.0 |
126.0 |
30.0 |
19.7 |
17.0 |
49.5 |
15.5 |
0.0 |
10.7 |