跟央视合作的百度地图「百度迁徙」的数据从何而来?
哈哈,这个项目我知道并且跟负责的PM私交不错,所以可以答一发。
1.数据从哪里来?
数据从百度地图开放平台上来,所有使用百度地图API的移动应用,都是其中的一分子,这里面可能有墨迹天气什么的……
2.样本量有多大?
具体数字不方便说,但是绝对是亿级。并且因为并没有特别一致的标签能将所有用户分类,所以用的是全量数据。所以用户手机每一次定位请求都在分析的范围内。
大家能看到这个地图上有着“八小时数据迁徙地图”……其实最开始PM是想做半个小时内的数据变化,后来发现连百度地图自己的服务器都扛不住如此大规模的全样分析……一步步的妥协,效果和带宽,最后才定格在了八小时。
3.是不是真的大数据?
如果这都不算爱,我有什么好悲哀……
4.它是怎么挖掘出迁徙数据的?
这个产品核心在于数据量的扎实,覆盖面广,采用了全量分析而非抽样分析
同一个手机如果上一次请求在北京,下一次请求在东莞,那么就是地图上的一条线……
P.S.一个细节,这个产品其实年前推出比预计晚了两天,
因为在临上线前,李彦宏回了邮件,对其中的一个细节进行了质疑
那就是对于热门线路的评判标准。
最开始衡量热门线路的标准是“在一定时间内,某两地点之间线路增加数量最多”
李彦宏质疑细节,表示应该是“同一线路比之前时间段,增长比率最大”
其实两种方式都能解释得通,不过也就因为这个细节
哥们又加了两个通宵的班……
本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。
如果侵犯了你的权益请来信告知我们删除。邮箱:dacesmiling@qq.com