摘要: 中国工程院院士李德毅院士为大家带来《大数据时代的位置服务》的主题演讲,李德毅院士同时指出:大数据引发新理念,实践中的研究也许胜过研究中的实践,较多的数据也许胜过较好的算法
以“智慧城市与移动信息化”为主题的“第七届中国电子政务高峰论坛”于2013年6月23日在北京大学英杰交流中心阳光大厅隆重举办。本次论坛由工业和信息化部信息化推进司指导,北京大学信息化与信息管理研究中心主办,中央机构编制委员会办公室电子政务中心、北大CIO班教务办公室协办,CIO时代网和锐捷网络承办。各部委、各省市特邀嘉宾、CIO班学员及有关企事业单位和媒体代表200多人荟萃于此,就智慧城市、云计算、物联网、移动互联网和大数据等新一代信息技术的应用进行了热点讨论。
中国工程院院士李德毅院士为大家带来《大数据时代的位置服务》的主题演讲,他首先提出了问题,智慧城市的第一责任人是谁?李德毅院士同时指出:大数据引发新理念,实践中的研究也许胜过研究中的实践,较多的数据也许胜过较好的算法。大数据成为连接物理世界和虚拟精细地图的桥。大数据的作用首先在于体现价值,而不仅仅是发现知识……他同时提出,人人都是传感器,从小众到大众,形成群体智能,由下而上也许胜过由上而下。他渊博的学识、幽默的演讲赢得了现场嘉宾的阵阵掌声。以下为演讲实录:
大家早上好,讲一点智慧城市的事情。刚才姚老师说,一个报告让人家记住一句话就好了,我的一句话是:智慧城市的第一责任人是谁?是市长。
智慧城市是一个美丽的神话?我小的时候,大家都说要建设一个卫生城市,现在我们有太多的口号,平安城市、生产城市、数字城市、无线城市、宽带城市、幸福城市、艺术城市、历史城市、文化城市、旅游城市、健康城市等等,还没列完,各式的城市也很重要。好比说美丽城市、宜居城市、休闲城市、文明城市等!同志们,我们不要太忽悠了!
昨天听到广播,说一个婴儿的奶粉要九个部委发联合文件。我想问:我们的社会怎么了?大家说云计算、物联网好像第一责任人不清楚,我感觉到智慧城市的责任人很清楚,那就是市长,市长是人大任命的,人大是人民选举的。我被邀请在北京市参加一个讨论,我就泼了冷水,因为官员都在想:我当市长了,以后这个城市要变成智慧城市了。你想想市长有这么大能耐吗?你在台上五年、十年北京就变成智慧城市了?你的孩子会在家里踹你的,告诉爸爸不要说大话,会悄悄的提醒你,这是善意的提醒。法国作家雨果说过,一个城市的良心是下水道,当洪水四溢,城市的下水道让滔滔之水悄然排淌,城市回归安详。不幸的是去年北京就发生了“721”事件。一个文学家说良心、智慧,慧字底下是一个心,一个城市良心都没有,哪来的智慧?听说有的城市的下水道是形式上的下水道,没有下水管,下工地检查的时候看不到,良心哪去了?
城市的智慧呢?我是中国人工智能协会理事长,我们经常讨论人工智能,讨论智能技术,但我们不敢轻易地讲智慧,在人工智能这个学科里面,有很多没有打开的科学之谜,好比说大脑跟心脏是什么关系?知识一般认为头脑、智慧,知识这一块、技能这一块、智能这一块靠大脑,但是心呢?良心呢?秀外惠中,讲的秀外要惠中,所以你们看看惠中这个词是怎么演化过来的?是很有意思的。我们又说人的手是人的第二大脑,大家看到一个残疾人用脚写字,用脚做很多活动时,我也觉得脚也是第二大脑。所以从脑科学的状态下,智慧与智能要求更高。
对智慧城市作为一个普通市民的理解,我觉得应该是生态环境良好、基础设施先进、产业结构合理、经济实力雄厚、服务保障完善、科教文化发达、社会平安和谐、市民健康幸福。现在PM2.5叫做冠状物,还有一些人叫做开状物,搞不清楚到底是开状物还是冠状物,我们要想一个系统的方法,空谈误国,实干兴邦。多做一些实在的事情,少忽悠一点口号。
我讲一个具体的例子,智慧城市建设的一个最基本问题,就是位置服务。云计算使地理信息系统走上飞天之路,本来我们的汽车里面安了地理信息系统,导航,要放一个硬件做载体,现在不要了,把地理信息系统搬到网上去了,所以手机就可以做导航,这就是云计算给各位带来的现实。
刚刚我们举办了“第五届云计算大会”,6月5号到6月8号在国家会议中心,那几天正好下大雨,工程技术人员恪守时间,也是非常让人感动的。云计算定位导航结合,催生位置服务。位置服务无人不用、无时不需、无所不在。1994年美国学者提出了位置服务的时候,三个基本内容:你在哪里、和谁在一起、附近有什么资源。当今随着移动互联网的发展,已经形成了一个新的概念,叫做SoLoMo,综合了社交、位置、和移动的特点,使得位置服务成为移动互联网时代最接地气的服务。
大家说地理信息系统,我们所说的早先的地理,在人们的头脑中是挂在墙上的,印在书上的,到上个世纪80年代,人们把地图电子化,我们获得了电子地图,于是有了结构化和半结构化的地图数据,进而把电子地图发展成为了数字地图。随着全球导航定位系统的普及,人们又把定位系统和地图紧紧结合在理一起,从Google地图到现在每个人走在街上都能看到街景,变化够快,多实在。位置衍生服务就是摇一摇、扫一扫、照一照,摇一摇附近我的朋友们在不在、附近有没有商店和吃饭的地方;扫一扫这个店是什么样子的,拿这个照相机照一照二维码,马上就可以得到优惠卷,或者是给你一个自动的联谊,或者给你一张电子名片。这些技术和手段深刻的影响到我们每天的日常生活。于是又出来了一个新的概念,众包地图,软件的开发不仅仅是在一个公司里,而是在一个开放的社区里,不是在一个单位里面,而是在共同感兴趣的人在网上进行共同兴趣的开发。
手机、汽车等移动设备装载各种各样的地理信息系统、并定期更新地理软件的时代已经过去了,我国目前存在众多小而散的地理信息产业孤岛,只能满足简单地理要素查询,满足行业的解决方案,跨行业之间的坐标和格式不能互换,数据不兼容,语义不统一,分享难、互操作难。于是,云计算把早先的互联网核心简单、边缘复杂、千人一面的形态,改造成网络丰富、边缘简单、交互智能,尤其是在网络中心的云计算,支持社会化、集约化和专业化的信息服务。一个个孤立的地理信息系统走上飞天之路,实现从行业解决方案向云计算的转型。行业解决方案已经到了尾声,跨行业的解决方案站到了行业之外,看到的行业成为了时尚,因此我们需要的是跨越界限、柔性重组、共享价值。
云计算走过了理念清晰、操作模糊、八仙过海、云里雾里的一段路程之后,已经成为了我国信息行业当前的主旋律,给我们的生活带来太多意想不到的改变,正越来越深入地服务于各式各样的小众,甚至改变整个大众的社会交互形态,位置云首当其冲。我们过去的企业服务大众、服务公众,现在要想服务大众,首先要服务小众,没有成千上万的小众,服务大众是一个空话。以前我们是粗放式的服务,叫做大河有水小河满,现在我们是精细的服务,叫做小河有水大河满。
谁是中国位置服务的领头羊呢?哪一家企业、哪一个地区、哪一个城市是位置服务的领头羊呢?北京是位置服务的领头羊吗?北京是云计算数据中心的试点城市,“智慧北京”的口号提出来了。在这里提出了衡量位置中心的五个外在指标:电力消耗、带宽支持、覆盖范围、注册用户量和衍生服务能力。我通常给出了位置服务的五个内在指标,时间上要连续,365天每天不能间断,每小时、每分钟不能间断,要有四个九的可靠度。我们现在的电力供应就是四个九的可靠度,四个九可靠度就是一年365天,停电时间不能超过1小时。我们到哪里找这样的位置服务中心?汽车在路上跑的时候,飞机在天上飞的时候你位置服务中心要给我位置服务的,要给我导航的,空间无缝、精度要多样,技术要可靠。
我这里讲一个典型的位置服务的云计算案例,叫做定位精度校正服务中心。大家知道天上有北斗,有GPS,地上有基准站,还有移动通信的基站,还有好多的车,各式各样的电器、房屋等等。如果我们建立一个定位精度校正服务中心,当我们一个个体的手机,有GPS接收机,从GPS收到一个精度、纬度和高度的信息,这个误差是25米,25米是什么误差?是军方误差,最大的误差是多少?是75米。实际上我们拿着手机的GPS,如果没有校正的话,通常在100米左右,这就是为什么我们有的时候在主路上,他说在辅路上,我们在辅路上,他就说在沟里一样。那么怎么办呢?如果有一个定位精度校正服务,手机就可以把得到的位置服务,精度、纬度、高度发到服务中心,一个短信一毛钱,定位精度校正服务中心根据它的基准站,例如北京,北京有15个基准站,每个基准站上都有他已经知道的精度、纬度和高度,于是进行一个差分计算,把计算结果还给手机用户,又是一个短信息,一毛钱,两毛钱的结果就使得手机得到了在所在位置的精度、纬度、高度,从原来的100米提高到1米。这是一个什么情景?两毛钱就可以知道1米精度的误差服务,这个世界真的变样了。假如我们跟老年人做一个手机环,他们是接收机,自动接发,就可以在任何地方知道老人现在在什么精度、纬度、高度,误差不超过1米,这解决了多少问题啊?我们现在有很多老年人得了老年痴呆,记性不好,走散了。我们曾经出动很多人找一个干部的老太太,现在把这个环套上,我们叫做黄环运动,老人就不用那样痛苦,找不到家。如果把这个给小孩子带上,那么家长就会知道小孩子是不是在马路上乱跑。我们的社会很多人需要这样的服务。
当然,跑动的汽车也可以得到这样的定位导航服务,所以我说刚才的五个内在指标,如果现在北京或者宁波,或者杭州能够有这样一个定位精度校正服务多好?如果你觉得不够,咱们的手机是双操作的定位接收机,GPS、基准站等都能相互互通。如果大家移动的精度服务,我觉得这个精度还可以往高里做。
定位精度的校正需要复杂的计算能力、海量的存储能力和丰富的交互能力,如果不放在网上做这件事,而放在手机上,放在端设备,那么手机端设备要多大呀?这就是为什么要搞云计算,从这个案例里可以看得出来,云计算是不可阻挡的高新技术,现在说云计算是忽悠的人已经寥寥无几了。
最近这几年,我一直在做智能驾驶,我们想让汽车改变早先的由人工驾驶的状态,我认为智能驾驶在云计算、物联网和智慧城市等战略性新兴产业中的位置是非常重要的示范地位。没有位置服务,何谈智能驾驶?因为没有人导航,没有智能驾驶,驾驶员就不可能在车上干更多的事情。车子为什么一定要联网?只有把驾驶员从驾驶的低级劳动中解放出来,才可以做更多的事情。没有车联网哪来智能交通?没有智能交通哪来智慧城市?所以我说我们要实干性,从一点一点干起,把车子联网,把电机联网,把消防水龙头联上网,一个一个的去做。
智能驾驶这件事情宏观上可以分三步走,第一个结构化的道路智能驾驶,第二个半结构化道路智能驾驶,第三步非结构化道路智能驾驶。当前,我们正在做第二步。智能驾驶并不是很新鲜的事,我们的车上已经有不少智能驾驶的东西,比如说自动巡航,当我们在高速公路上转到自动巡航,脚不动弹手动弹,手不动弹脚动弹,或者从事故预警开始,当我们自动倒车的时候,超声雷达发出一个声音,不能再倒了,也叫智能驾驶,只不过没有跟刹车直接联系在一起而已。我们希望今后的汽车应该是一个云式机器,会记忆、会对话,你开了十遍、二十遍、一百遍从家到单位,第101遍汽车说我会开了,会学习、会记忆。
我们希望这个车是节能的,不能因为智能而不节能。还要个性化、自学习,驾驶员是一个菜鸟,学习到这个机械也是个菜鸟,也是个飙车手,这个社会还是要有个性化的。有了这样的手段之后,我们可以利用智能机器人来计算路程,从北京到天津每个人都要开车,每辆车前面都要有100米左右的路程距离,浪费太大。如果把两辆车、三辆车变成一个公共火车,只要第一辆车占用路程,后面可以节省路程,这样多好。像我们现在首长出门,道路要封锁,封锁占用了老百姓太多的路程。能不能又能保证老百姓的行车安全,又不占用老百姓的路程。
驾驶是快乐的享受,但我们希望自动驾驶和人工驾驶两种状态会长期共存、相互补充、自然交换。我们并不把重点放在道路信息化上,因为每个红绿灯发出信号,告诉驾驶人要改动道路。而道路环境信息化,依靠车路协同实现智能驾驶,肯定是一件长远的事情。北京市的红绿灯现在都不规范。
这是通用车,我现在在北京改装它的性能,这个汽车有10m雷达,前面装了一个SICK雷达,后面装了毫米波雷达,前后有摄像头,大概就可以构成一个智能车,再加上GPS。目前我们所有都装上了需要100万,我们还要把这个价格压下来。现在全国的高校、研究院、研究所都在做这样的智能车,再加上移动测量车,全部搭配一千辆的智能车,各种各样。所以你们有时候坐在车上,看到车上有很多奇奇怪怪的设备,实际上他是在做道路测量。
智能驾驶技术可以分为三大技术,一块叫做自主驾驶,一块叫做组合导航,一块叫做人工干预。我们让乘员手上拿着iPad,触摸一下就可以表达自己的目的地意图,把道路要走哪些车线交给云计算位置服务。那么我们规定的人工干预应选最高,自主驾驶次之,组合导航更次之。城市驾驶实验主要在城际高速道路上,相对来说比较规范,我们已经在北京到天津跑了18次,进行了一万多公里的实验。
我们有几次相当仔细的实验报告,这是第四次的实验报告总结论,其中提到检测到周边移动障碍物17497次,自动控制转向18020次,自主超车7次,被超车140次,这次实验数据还是很宝贵的,召集了一批研究生,他们的论文用这些数据,所以质量也就比较好。第18次实验我们开始考虑既有的问题,油门操作1816次,刹车36次,意思呢?如果在能够松油门的时候,尽量不踩刹车,从而减少二氧化碳的排放,减少油耗。这个工作我们刚刚开始,逐步的我们会考虑省油的问题。
目前我们认为我们要做半结构化的智能驾驶,所以我们要了解市区的智能驾驶难在哪里,这样一个道路条件是比较理想的。这就比较惨了,因为车道被汽车挡住了,咱们的摄像头就失去了功能,而且这一挡住的汽车是不断移动变化的,尤其在立交桥下面,GPS又不能工作。市区道路是半结构化的道路,红绿灯、人行道、立交桥路口复杂多样,交通和道路标识有新有旧,机动车和非机动车、行人与车流混杂。因此我们提出了一个组合导航战略,GPS在智能驾驶中究竟能力做到什么?云计算中的位置服务做到什么?都是目前的难点。我们目前采取的策略是进行级别导航,在路段里面让摄像头和雷达导航,让GPS告诉你前面的路口名,做路口识别器,在路口过渡区做交通指示的导航。
大家知道在道内行使的时候,比如说首都机场到天安门,大量的时间是在道内行使,这个时候就要雷达导航,并且靠GPS识别前方路口。快到路口的时候大家知道,这个路口如果一个稍微大一点的路口,往往有一个节,叫做路口过渡区,会把原来的四条道扩大成六条道或者七条道,从路口过渡区就必须走到正规的车道里面,然后你就会看到一个停止线或者是人行横道线等等,这就是路口导航。路口导航拐弯之后又到了车道里面,又有了道内导航又有路口过渡区导航,然后又经过过渡区,就这样的循环,从而从首都机场到达天安门。
在这个过程当中我们发现,大数据成为支持路口导航的重要来源,大数据是连接物理世界和虚拟精细地图的桥。我的单位在万寿路口附近,我这辈子在万寿路口走了成百上千遍,但是我并不知道万寿路口由东向西几条道,由南向北几条道。这次做智能驾驶才发现,万寿路口非常普通的路口,由东向西是6入5出,6个车道入,5个车道出,由南向东是6个车打入4个车道出,为什么以前没有注意呢?因为以前没有搞智能驾驶,为什么现在注意了呢?因为我们要精细的控制这个车,这就告诉我们,当人利用信息技术精确挑战能量的时候,人们对数据量有极大的要求。比如万寿路口,人行横道中间的面积竟然有4143平方米,这就是万寿路口的图,由南向北,右拐4道口,前行5条道,拐弯有两条道,可以说世界上没有完全相同的路口。前两天搞了一个路口的通用模式,后来发现不行,路口是地区演变的过程。因此我们要进行精细的路测试,我们向北京市测绘数据院寻找万寿路口有没有最细的地图,1比1000的,1比500的,甚至有1比200的,这就是数据量增加的根本原因。我们要做这样的右拐、直行、左拐,要进行精细的路径规划。这就是我一个研究生目前正在做的,万寿路拐弯的路感形态,规划的路径很复杂,博士论文题目是智能驾驶系统中的不确定表达与计算。
谁来提供详细的路口位置信息?谁来确保详细路口位置信息的实时更新?谁来提供碎片化的路口信息在线服务?都成为了一个很重要的问题。北京市有多少路口?有多少信号灯,有多少个小路,一算必定是大数据。目前我们从天安门到首都机场的实验正在进行当中,我们希望全程30多公里的道路用90分钟走完,我们采取刚才的导航措施。尤其重要的是,随着移动互联网和云计算的普及,机器人、乘员都可以和网络的位置服务中心交互,物联网的更高境界一定是机器人联网,人互相之间、机器之间都可以进行交互。自发地理信息可以利用工具组装和上传个人资源提供的位置数据。万寿路左转这件事,如果有一个人做到了别人就可以跟随,这就是对感兴趣位置和区域的共享,形成群体智能。
我是1983年在英国拿到博士学问的,当时我的博士论文就是Databases,DB,都到70岁了,突然有人把我这两个颠倒过来,转到了BD。一开始我们搞的时候是Databases,后来我们觉得这个数据量不够大,就改成Large Databases,后来是Very Large Databases,然后是Extremely Large Databases,这些都是结构化数据,现在突然出来一个Big Data,搞的大家很茫然。2013年,我们请了几个获奖的人,到中国来谈,特别是搞数据库的都觉得搞的颠倒了,把我们搞晕了。大家知道关于数据库,如果数据库到了几P级的话,一个操作大约要5个小时,这就是说结构化数据已经走到头了。现在不是再由结构化的工具把这个数据放在一起,再放到大库里头去,不是这样的。DB和BD有什么不同呢?我这里举了十个不同,我就不念了。
所以现在我们遇到了挑战,我们曾经习惯的用数据部分,数据仓库技术应对结构化,我们目前比较习惯的是用超文本超连接、搜索引擎、云计算等技术解决半结构化数据。我个人的观点是要靠网络交互和群体智能来应对,第三道杠很有风险,仅仅是我个人的观点,仅供参考。
想在北京的街道里开一家门脸超过5米的商店,而不被高德公司记录在案,绝非易事;想在北京开车出门吃一顿饭,不被摄像头记录也不是一件容易的事情。在基于位置服务的社交网络上,人们也许会发现今天你先进入“为民刻字部”,然后去了“俞式削面馆”。大数据的作用,首先在体验价值,而不是像很多教授讲的,要从数字里面发现信息,从信息里面发现知识,从知识里面发现智能,未必如此。我们希望那样理性,但是实际生活非常感性。我从天安门要到首都机场,我问你哪条路最快,哪条路最短,最省钱,你告诉我,我给你一毛钱,这就叫做大数据架构,这就叫做软件做服务的事情,而不是要发展什么知识。
大数据成为连接虚拟时代和信息时代的桥梁。科学本来是研究为什么的,是一个形而上的,技术是怎么办的,是形而下的。上个世纪的前半叶,我们有一个天才科学家发明了一个图灵模型,所以我们有了冯诺伊曼计算机。后来有一位天才的数学家发明了关系模型,于是我们有了关系数据库。科学作为技术的先导,在上个世纪的上半叶是非常清楚的。后来人们把计算机构成了网络技术,物联网技术,还有云计算。云计算已经在我们的身边,那么它的形成是什么呢?人们不知道,于是有人想办法知道它,把它叫做网络科学。在云计算之间的大数据,对应的科学依据是什么呢?我们也不知道,于是有人就想象成数据科学。这个表就告诉我们一个真理,科学可以作为技术的先导,但是反过来技术也可以作为科学的先导。传统的科学先提出一个模型、理论和发展,验证这个模型,我们把它叫做研究中的实践。科学理论与模型纠正或者扩大了早先的发现,新的科学发现又在实践中一个个地被验证。而自然杂志公开提出了我们已经进入了一个PB时代的科学,也就是大众时代的科学,大众时代的科学跟传统的科学不同了,普遍参与了开发,群体智慧非常多,人人都是传感器。大众既是数据的使用者,也是数据价值的开发者,既是消费者,也是数据的提供者。
因此我们更加的提倡实践中的研究,用数据表示世界众多层面,这个世界是导致大众的根本原因我们可以从不同的测度上描写地球、描写资源,包括描述我们生命科学本身,甚至我们的情感都可以造成情感的技术,数据支配世界,充满了不确定性。信息和信息技术解决了这个世界、这个人研究的对象,是什么的问题。为什么、怎么做分别代表了科学和技术,我们通过数据产生价值,就是解决怎么做的问题,满足服务需求,而不是像科学一样解决为什么,也未必发现知识。更多的从相关性而不是从因果性做出理解和决策,数据关联,多人乃至多群体关联形成群体智能,通过交互和挖掘,发现普世价值。
因此在大数据时代的科学,引发我们新的创新思考、创新驱动发展。我认为实践中的研究,也许胜过研究中的实践,如果我们不去研究智能驾驶车,我不会感受到万寿路口的大数据。较多的数据也许胜过较好的算法,这句话非常的重要。我们早先的软件工作者希望把程序写的很好,程序加数据加稳当叫做软件。数据是固定的数据结构下支持的数据,有时候一个程序很大,能处理的数据很小。但是现在我们需要的是程序可以小,处理的数据要大,而且较多的数据可能胜过较好的算法。而且告诉我们另外一个理念,由下而上也许胜过由上而下,我们智慧城市每一个城市都非常想要做一个顶层设计的方案,现在我给你泼一点点冷水,由下而上也许是更好的。当然传统的是由上而下,这种是中国式的状态。但是目前看来,由下而上的动力强大,草根的力量很强,旺盛力不可控制。
智慧城市是一个长期积累演化的结果,我们不妨从智慧的人、智慧的家庭、智慧的社区做起,由下而上。我们需要看到智慧的家庭是什么样的,各个城市不宜把智慧城市作为一届或者几届政府的建设目标,可以提出实现智慧城市行动纲领。不要把智慧给出一个终极目标,终极目标是人类的研发,可能十年、二十年,三十年也未必能出。谢谢大家!
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。