何宝宏:预见2020,拐点已至丨风向Talks
编者的话:12月22日,由人民邮电报社、人民邮电出版社共同主办的“风向系列活动暨何宝宏思享会”在北京举办。会上,中国信息通信研究院云计算与大数据研究所所长何宝宏以其特有的视角,跳出技术看技术,用诙谐、幽默、生动的语言,讲述技术发展背后的至深规律。区块链、人工智能、大数据、云计算、开源……一起细数2020年不可错过的技术风口。
面对即将过去的2019年,几大行业都经历了不同的起伏。2019年互联网产业经历了丝丝凉意,虚拟现实做了更理性的选择,退守娱乐和游戏市场,先烈似乎比先驱更多一些;开源正在吞噬整个世界,业内第一次感受到风险;大数据仍然面临难以翻越的两座大山,左手是隐私要保护,右手是资产流动;人工智能面临七年之痒;区块链经历了10个月的低谷和两个月的高潮。与此同时,互联网产业传来阵阵暖意,产业互联网正在蓬勃发展;5G是当仁不让最亮眼的技术;“视频+”让一切皆视频;“云+”,过去是云找你,现在是你找云;除此之外,还有边缘计算、数据、智能、服务器、数据中心等,都在2019年经历了或多或少的变化和发展。
在过去的十多年里,每隔几天就会宣称出现了一种会颠覆世界的技术。变化的背后是永恒,探寻永恒才可能把握变化。
什么是变化的呢?几十年来,互联网一直在转型发展,正在从消费互联网转向产业互联网,消费互联网红利基本被“吃光”,但是经过五年的努力,产业互联网红利还没有到来。移动互联网的红利也基本被“吃光”,正在向物联网、可穿戴设备发展,同样,IoT、可穿戴设备红利还没有到来。从计算的产品到计算的云化,“视觉”由人的视觉转向机器视觉,最主要应用在无人驾驶、视频监控等领域。数据正在由信息流越来越多地变成资产。
互联网经过了十几年的转型发展,这次的转型发展有一些不同的“味道”——远方的天空飘来了两朵“乌云”。第一,摩尔定律为信息通信业提供了源源不断的免费或者廉价的计算资源,但是当整个行业所依托的资源不再让它充沛、不再让它廉价时,就要面临新的挑战。第二,行业经过多年的发展,技术创新的步伐太快,面临着技术应用步伐远远赶不上技术创新步伐这一现状,不可持续。
无论走向何处,人类正从工业文明走向数字文明。互联网作为一个技术新物种,外部生存环境的逆变,必将改变半个世纪以来一些行之有效的方法、一些颠扑不破的“真理”。
区块链 价值互联网不可能取代信息互联网
随着互联网与实体经济的深度融合,数据越来越多地具有资产属性。同时,数据是信息,要传播、开放、共享。数据代表资产时,需要同样一套网络体系来传递。价值互联网不可能取代信息互联网,因为用数据表示资产的时候,本身还是信息,所以,未来的价值互联网会构建在信息互联网之上,而不可能取代信息互联网。
如何从数据资产的角度理解区块链呢?数据的最后一个拥有者,才是对应资产的拥有者。数据之前的拥有者都只是所对应信息的拥有者,其在区块链上存在的价值,只是为了证明谁是数据的最后一个拥有者。
区块链新在什么地方?它需要多方维护,传统数据库只需单方维护。传统数据库属于某个企业、个人或组织,需要某一个实体来维护数据库的数据。区块链有多方参与,而不仅仅有某一个实体或个人,需要参与方共同维护。区块链技术涉及密码学、分布式共识、智能合约等,具有不易篡改的特点。
去中心化是伪命题,高喊去中心化的,大多是自己想成为新的中心。去中心化的后果,就是区块链会成为新的中心。
区块链技术现状可以总结为六个字:已可用、不易用。技术方向没有问题,但存在一些需要完善的地方。比如,从孤链改成跨链,从链上到链上链下相结合,整链切成小块,等等。此外,拓扑结构方面正在优化,出现了树形、桥形、图形、点状等结构,尽管名字还叫区块链,但已经不是链式结构。
区块链不是万能的,不会颠覆世界。它是一种新型的数据库,要用数据库的时候才会考虑区块链,要多主体,大家要共同参与,解决缺少第三方时彼此不信任的问题。
什么时候用公有链,什么时候用联盟链?很多情况下,多方主体通过市场交易,为了保护商业秘密,只要参与方彼此知道即可,这时必须考虑保密的问题,就要用联盟链或私有链。
区块链号称“信任的机器”,但现在很多时候成了诈骗工具,为什么?道理很简单,信任缺失,需要监管。什么时候才能相信区块链的数据?当区块链数据是原生的,就可以放心使用;反之,如果数据曾经暴露,就要特别小心,有很多数据在你看到之前被篡改了。除了数据,还要看底层系统,以证明这套创造信任的机器本身是值得信任的,这就是可信区块链产生的原因和存在的价值。
数据中心 数字社会的新基建
数据中心是整个数字行业基础设施的基础设施。无论是全球还是中国,数据中心作为基础设施的基础设施,增长是非常猛烈的。
数据中心跟计算机一样,也走上了两个极端。一方面,数据中心在消费侧变得越来越小,从PC到手持设备,到可穿戴设备再到物联网;另一方面,走向了高性能计算,数据中心变得越来越大。全球的数据每年增长50%左右,而数据中心的增长为20%~30%。
数据中心发展的趋势之一是产品化。过去的数据中心建设更像是一个施工的现场,现场施工远远大于产品化。2011年启动的天蝎计划,核心是将IT设备前置化、模块化、预制化,把它推到工厂去,让现场施工越来越少。今年推出的巴拿马项目,是将产品从IT推向了非IT,走向了供配电,很明显这条路会越走越远。这几年服务器市场发生了翻天覆地的变化,以前经常是改造机房环境,以适应标准服务器。电信运营商提出来新的思路,可以改造服务器,OTII就此诞生。现在OTII是定制服务器,以适应传统通信局站。
液冷技术越来越趋于成熟,但是配套的外部环境还需要我们共同去维护。液冷单体计算密度提升10倍以上,可以让IT设备占地面积减小75%以上,HPC和GPU等已规模应用,能够满足一线城市PUE建设需要。
白盒交换机正在快速崛起;机柜世界里是光进铜退……
网络创新是另一主战场,今天网络创新的聚焦点主要在两大领域,一个靠近用户侧,一个靠近服务侧,靠近用户侧的集中在5G,靠近服务侧的集中在数据中心。可以说,数据中心是今天网络创新的制高点。总而言之,数据中心就是数字社会的新基建。数据中心是工业互联网、人工智能、物联网等基础设施的基础设施。
开源 几乎是躲不掉的
开源是社会化协作的基础。随着软件越来越昂贵、风险越来越大,单靠一个企业内的合作已经不够了,需要全球供应链、全球生产链来共同生产软件、维护软件、交付软件。开源也是社会化生产的需要。经过20年的发展,开源已经今非昔比。20年前,开源是一种软件的开发和交付方式;2020年,开源已经演进发展为一种生态竞争的模式。
开源的生产交付模式已发展成熟。2019年,70%的财富50强企业为GitHub(代码托管网站)贡献了开源代码。开源已经形成了两种模式:基金会主导模式(Linux模式)和企业主导模式(Android模式)。码农数量激增,因为码农是数字社会先进生产力的代表。
总而言之,开源几乎是躲不掉的,99%的组织已经在其 IT系统中使用了开源软件。2019年,中国的代码贡献量上升了48%。在中国,过去,开源的核心是国际项目本土化,现在,国内开源的焦点是本土项目国际化。重要的是,要将风险管控前置来治理开源。
大数据 拐点出现
大数据让我们相信,数据是21世纪的石油。
大数据的拐点之一,是由以前关注的数据量“大”转变为今天关注的如何让数据“跑得更快”。大数据的拐点之二,是从聚焦数据技术转变为现在将技术作为资产来看待。
大数据的两座大山——左手是数据如何资产化,右手是数据如何保护。GDPR实施一年,引发全球隐私保护热潮,无论是欧盟还是中国,密集出台了数据隐私保护的相关管理规定。但另外一个方向是如何促进数据的可控流通。保护隐私,不能单靠政策,还要靠技术。保护隐私数据的政策,目前为止有三个流派:一是数据脱敏,让数据“少出门”;二是安全多方计算;三是联邦计算,让数据少跑腿,让算法多跑路。
“任何一个新技术在解决老问题的同时必然会创造新问题。”何宝宏表示。传统的数据治理框架失效了,根本原因是以前数据是信息,今天数据是资产,要把信息的一套框架和方法搬到资产的治理方式上,显然不太适用,所以需要创造新的数据治理框架、新的数据治理模式。数据从成本中心变成了价值中心。
数据开放不是0和1的问题。数据的开与不开之间有一个漫长的灰色地带,需要通过开放解决这个问题。数据开放需要数据许可证和开放数据管理办法。当涉及个人隐私、用户权利时,算法应该是开放的。算法的开放问题、中立问题、可解释性问题都是必须解决的。
总而言之,数据有时候是隐私,有时候是信息,有时候是资产,所以需要资产管理的办法。“相信关于数据管理的技术未来应该会越来越碎片化,这个社会需要更多更新型的技术来对付不同的数据。”
人工智能 计算机还无法实现的那些智能
人工智能领域经过几年的发展,计算机视觉应用一枝独秀。
谷歌马上就能开发出修改自然语言对话甚至可以预见人开玩笑的算法。普通人只需1秒就能够想通的事情,不远的将来很可能会被AI自动化。
2019年,AI到了七年之痒。2015年之前AI是人才、技术和资本;2016年到2018年是数据、场景;2019年,开始关注人工智能伦理、道德、可解释和监管方面的问题。
产业需要一个什么样的人工智能?高效,模型训练时间需要满足业务实时响应;经济,要降低计算成本;泛在,让AI计算无处不在;智能,自动化半自动化数据标注;稳定,满足工业级AI系统需求。
随着视频监控、无人驾驶的兴起,人工智能又发展到一个新的阶段。近几年人工智能的进步,如人脸识别、身份验证等,产生了巨大的变化,但是深度伪造技术、深度造假也是必须处理好的问题。
何宝宏认为,AI的可解释性存在陷阱。第一个陷阱,人的智能是不是可解释的;第二个陷阱,87%的人认为,自己的智商高于平均值;第三个陷阱,凡是自己无法理解的,都是不可解释的。
总而言之,所有可解释的智能都是计算,人工智能就是计算机还无法实现的那些智能。
技术都是螺旋上升的 行业需赶上技术创新的步伐
何宝宏认为,创新太快了,应用跟不上,必然会脱离行业创新的步伐。技术从来都是转圈的、螺旋式上升的,这是因为一个技术往一个方向走久了,它反方向的弱点就暴露出来,就像云计算走久了,一定会有边缘计算。互联网让信息和网络呈现分布式,但SDN让网络集中、云计算让计算集中、大数据让数据集中。再比如,以前IT技术的优点是可编辑,现在区块链的优点是不可编辑。因此,技术都是螺旋上升的。
如今,有三个方向特别值得关注。第一是软件,大家需要在软件上下功夫,尤其是并行软件。第二是算法,大家以前做的很多事情就是在做加法,几乎所有的技术优化,基本上是如何把技术搞复杂,今天要想办法做减法。第三是芯片,以前有通用芯片,这几年是专用芯片,尤其是特定场景下的芯片,比如边缘计算、人工智能的专用芯片。很明显,会有一些大的专项性的问题出现。
如果说100年前是IT技术赶不上全行业、全社会发展,今天面临的问题则是反转,全社会追赶不上IT技术创新的步伐,这肯定是不可持续的。如今有两个机会,第一,如果应用赶不上创新的步伐,那去做行业和应用、做产业互联网,与场景相结合。第二个机会是软实力建设,当把新技术应用到各行各业时,会发现经济、教育、制度和伦理等受到冲击,这需要优化经济学、教育学、管理制度、伦理道德等,继续改变应用、改变社会。
来源:人民邮电报