人物名片:
张传明博士,现任百度主任研发架构师、百度地图技术委员会负责人。2010年获北京大学理学博士学位,近年来致力于结合计算理论解决现实世界的复杂空间问题,并发表论文著作5篇,申请发明专利30余项,承担多项国家重点科研项目。
【通讯员:姜良存】 2018年3月9日(周五)下午14:00,在遥感betway必威西汉姆联官网附3-202报告厅,张传明博士做了“互联网地图实现原理”的学术报告,重点介绍了百度互联网地图在数据获取、地图绘制、导航路线规划等方面的研究。遥感betway必威西汉姆联官网院长龚健雅院士、朱国宾教授、乐鹏教授、桂志鹏副教授、资环院陈玉敏教授、东华理工大学李小龙老师等出席此次研讨会。
张传明博士首先介绍了百度地图的数据来源,传统的数据采集车方式具有数据质量可靠、采集效率高的优势,但是无法采集室内信息,且成本代价比较高,所以同时采取了一些有效的补充渠道,如购买别人的数据、室内商圈的步行采集、用户贡献数据(UGC)。
过去,百度地图事先将地图信息画成图片(如BMP、PNG等格式),用户在手机地图或浏览器上拖到哪儿,就把这个地方的图下载到本地。这么做的问题是流量太大,用户无法交互点击。从2013年起,百度地图采用直接将地图要素下载到本地,然后在本地用Canvas或者OpenGL等方法绘制,实现3D楼块的绘制、全景(街景)的渲染等。
接下来,张传明博士分析了如何确定用户想要去的地方在哪。直观的实现方法是:把所有的地址都索引到内存中,看query与哪个已有地址的名字最像。但地图检索远没有看上去那么简单,面临着用户的输入比较随意的难题,如“地铁”和 “城铁”有时候是一个意思,输入“黄浦江”,其实是找“黄浦江”,输入“张江饭店”,其实是搜索“张江附近的饭店”。如何更好的识别用户的意图呢?百度地图结合检索通用优化方法,整理用户可能的检索表达方式,分词并识别每个词的类别,将query匹配常见检索模式。张传明博士以“某地附近的某类店”为例,如“肯德基中关村店”代表的是“中关村附近的肯德基”。最后根据文本匹配度,优先返回用户附近、点击率高、扎堆显示、优质来源的结果。
张传明博士认为,对于百度地图而言大部分情况下导航定位的速度比精度更重要。定位的方法有GNSS、基站、WIFI定位算法,因为每一个实体的基站、WIFI路由器有全球唯一标识,所以原则上只要有这个数据库即可知道用户在何处。百度地图通过在手机同时开启GPS和WIFI时记录WIFI路由器的位置来构建WIFI位置库。张传明博士分析了不同场景应该用何种定位方式,GNSS与基站、WIFI、手机传感器(陀螺仪、计步器、气压计)如何协同定位计算。
2012年,“大数据”的浪潮席卷IT行业,百度地图的路线规划也从单一的Dijkstra算法引入实时路况与实时公交信息,基于大数据学习出最佳方案。多方面考虑解决出行方案代价估计问题,实时路况取代距离成为最重要的因素之一。与此同时,基于大数据学习来规划路线也遇到一些新的问题,张传明博士讲到,用户反馈不全面,大数据的样本太小,难以协调不同的用户群,
对于地图而言,算法与数据哪个更重要?张传明博士的答案是:数据。在解决地理信息过期问题上,张传明博士提出了一些可尝试的新模式:把任务下放到用户,利用某些领域的“爱好者”来自发更新地图信息,巧妙设计互相验证的“群众性任务”来替代集中审核;通过爬虫确定情报是否属实,卫星图、街景自动识别,基于用户位置日志发现疑似道路更新。
在互动交流环节,现场师生针对报告内容纷纷提出自己的疑惑和思考,报告结束后,许多同学留下与嘉宾进行了探讨和交流。