专家观点

【强国讲堂】杨学成:数字中国与未来产业的展望

杨学成 北京邮电大学经济管理学院副院长一、我国在数字技术发展上取得的成就经过最近二十多年的发展,数字技术已经深度融入我国经济社会发展的全过程、各领域,生活、学习、娱乐以及工作等方面更是一刻都离不开数字技术的支撑。应该说,数字技术是近年来对于我们影响最为深刻也最为全面的一项技术,同时我国在数字技术的发展与应用上取得了举世瞩目的成就。(一)数字经济的规模和体量目前,我国数字经济规模占GDP的比重已经超过三分之一。这是第一个非常重要的指标,表明了在全球数字经济蓬勃发展的背景下,我国数字经济在规模和体量上已经跻身于前列。此外,我们可以看到,在过去这些年中,在中国大地上出现了很多数字企业、互联网公司,它们实际上都是以数字技术的应用为主线进行商业化开发的,并且都已经跻身于世界著名互联网公司的行列。我们可以看到,一堆“数字巨兽”在中国大地上孵化出来,这些数字企业在数字领域的发展推进了我们对于数字技术的应用。(二)数据基础设施建设在上述背景下,以习近平同志为核心的党中央提前谋划、积极推进,提出了网络强国建设的战略目标。近年来,围绕着网络强国建设的战略目标,我们逐步推进落地实施,其中一个重点就是关于支撑数字经济发展的基础设施。可以说,我们现在已经拥有了世界上最完备的、布局相对比较超前的数据基础设施,尤其是在2020年国家发改委提出的“新基建”中,有四个方面都与数据基础设施相关:一是5G基站建设,近年来我国5G基站的部署非常快,已经达到全球5G基站的70%以上;二是大数据中心,我们已经完成了相关的整体规划布局,在全国各地建设一系列大数据中心,同时构建了面向全国算力的整体调度网络——“东数西算”工程,涉及包括京津冀、长三角、粤港澳大湾区等不同区域的大数据中心集群,我们的算力资源将会蓬勃发展;三是工业互联网,我国在工业互联网的标准制定层面、应用层面走出了一步先手棋,在推动工业制造业和互联网融合的过程中是走得比较靠前的;四是人工智能,也属于新型的基础设施建设,近年来基于大语言模型,尤其是以ChatGPT为代表的人工智能的应用或是自动驾驶技术的发展,都离不开人工智能这样一个大型基础设施的建设。这一系列数据基础设施建设,带来了数据、算力以及在二者之上的算法突飞猛进的发展,为未来更高质量的数字经济的发展打下了坚实的硬件基础。(三)率先把数据列为第五大生产要素在推进硬件基础的同时,我们也在快速推进数据领域中软件的顶层规划,尤其是以数据要素的认定为主线。2020年,我国率先把数据列为同土地、劳动力、资本、技术并列的第五大生产要素。数据作为生产要素是最具乘数效应的,能够对其他生产要素产生倍乘的效果。把数据列为生产要素,意味着我们想要通过数据来促进整个经济的增长。在此基础上,我们围绕数据不断出台了一系列相关政策文件,数据要素正在发挥出非常强劲的经济发展动力。2022年12月,被称为“数据二十条”的《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》对外发布。作为数据相关顶层设计的“数据二十条”,对数据要素的使用包括确权以及价值的分配等方面作出了最基本的指引,这意味着我们围绕着数据要素给出了中国方案。从“数据二十条”中,我们能够看到关于数据要素未来在社会治理中的应用和发展的思想,是一次非常重要的主动式的制度设计,也是为全球数字经济的发展贡献了中国方案与中国力量。在“数据二十条”的基础上,2023年以来,我们做出了一系列动作,比如在机构改革中组建国家数据局,中共中央、国务院印发《数字中国建设整体布局规划》。这一系列动作表明,我国在数字中国建设,尤其是数据要素的使用方面已经形成了比较完整的顶层设计,也意味着未来我们对于数据要素的使用将会更加走向深入。从某种程度上来讲,数据要素的应用将会直接助力中国式现代化,这是我们对未来整个经济社会发展作出的一次主动的制度设计。二、数字技术和产业融合,我们会走向何方(一)数字经济发展的两个阶段在上述这样的大背景之下,数字技术和产业融合之后,我们的产业将会发生哪些变革,又将走向何方?按照逻辑来划分,我们可以把数字经济发展分为两个阶段:一是数据产业化,也就是以上一代的互联网公司的发展为主,收集用户数据并加以分析和利用,再通过广告的方式进行变现,成就了互联网公司的发展;二是产业数据化,也就是推动传统产业完成数字化转型,实现数实共生、数实融合,二者交相辉映才能推动整个产业的更新迭代。(二)数字技术与产业融合的五个方面要想推动整个产业的数字化,我们就必须坚持数字技术与产业的结合。我们把能够为产业的未来发展带来重构性影响的数字技术,归纳为一个单词——Basic。Basic是基本、根本的意思,包含五个字母,这五个字母分别都代表着完全不同的数字技术。1.大数据B代表bigdata,也就是大数据。我国的数字经济之所以发展非常迅猛,就源于非常丰富的数据资源储备。在借用人工智能技术以及各种算法的处理之后,数据的重要性便完全不容忽视了。我们谈到大数据的时候,也应该意识到“大数据”具有三个方面的特点。第一个特点是数据的规模和体量很大。第二个特点是“杂数据”,也就是多元异构数据,即多个来源不同结构的数据。多元异构是数据的一个非常重要的特点,数据会因为关联而产生价值,单一来源的数据的价值很稀薄,只有不同来源的数据相互结合关联而后进行统一化分析,才能不断呈现出价值。比如,在疫情防控期间,我们使用的健康码就是一个多元数据相互关联、产生价值的典型应用。第三个特点是“活数据”,也就是说如果数据不是“活”的,那么数据量再大也很难维持支撑。我们把整个屋子都堆满了数据,那也不叫大数据,大数据必须是时刻在运转的数据。大数据作为生产要素,其影响力是很大的,我们从一个“小数据”上就能体会到,那就是每个人手机上都可以看到的“步数”,代表着我们每天走了多少步路。自从有了步数这个数据之后,不少人的走路行为就开始发生了变化,出现了很多专门依据步数数据精准管理自己走路行为的人,被称为“万步走大军”。实际上,这是我们能够看到的第一层改变,相当于因为有了这一数据,我们的行为发生了很大的变化。接下来,数据还会带给我们第二层改变,那就是我们不单知道自己走了多少步路,还知道别人走了多少步路。这时,你会发现我们的行为又变了,比如今天你走了两万步、你的朋友多走了三百步,你就有可能继续走。所以我们看到,步数这一数据引发了一种群体互动、一种新的社交行为,我们称之为“运动社交”。再然后,因为步数这一数据的出现,一个前所未有的产业生态出现了,那就是“步数捐赠”。今天你走了两万步,可以把这个步数捐出去,你捐出去之后有个慈善机构就会收到一小笔善款,实际上不是因为你自己掏了腰包,而是有第三方机构帮你出了钱。第三方机构为什么要帮你出钱呢?因为你在捐完步数之后,会看到这家公司的广告,实际上这是一次非常精准的广告展示,因为你看了这一次广告,公司就要付广告费,而广告费就转化为慈善机构的收入。那么,为什么你在捐步数的时候会看到这家公司的广告而不是另外一家公司的广告?因为微信运动早已经对你个人进行了后台大数据分析,根据分析结果形成了一个潜在默认的认知,相当于只要你捐步数,这家公司的广告就会精准推到你眼前。正是因为这是一次精准的广告展示,这家公司也就愿意掏广告费。那么,你为什么非要捐这个步数?因为步数捐赠为你自己所有的行为改变找到了一个非常正当的理由,那就是公益。至此,我们能够理解步数这一数据是如何重塑了用户、广告机构以及慈善机构的三方关系的,也因此促使一个全新产业生态的诞生,这个产业生态就是步数捐赠——一个非常典型的大数据应用。此外,步数这一数据还带动了运动鞋、服装、运动腕表等智能设备的销量。所以我们才说,数据具有非常强大的威力。由这一个小小的数据入手,我们看到了大大的应用,由大大的应用入手,我们看到了未来数字经济的全新形态,即借助对数据的应用可以凭空产生出很多过去见所未见的产业。与其他的生产要素最根本的区别在于,数据不会因为使用而枯竭,反而会因为使用而变得更加繁荣、更加复杂。根据相关统计报告,人类社会近两年产生的数据量能够占到人类社会有史以来数据总量的一半以上,人类社会近五年产生的数据可以占到人类社会有史以来数据总量的90%以上。由此,随着数据体量的增加,我们更要不断发挥大数据的威力。未来的数据时代会是什么样子?数据会推动人类社会沿着两条路线向前发展,一是数据会把没有生命的东西变得“有生命”,二是数据会把有生命的东西变得“有灵性”。那么,我们要如何理解这两条路线?首先,我们要理解数据怎么把没有生命的东西变得“有生命”。工业化时代,很多人对于产品的看法是非常固化的,其主要目的是为了进行大规模、标准化、低成本的生产,可是我们生产出来的产品基本上是没有生命的。比如,我们生产茶杯,要采购原材料,经过各种工艺加工,最终做成一个制成品茶杯。只有制成品才能拿去销售的这套逻辑,背后有一个很重要的前提,那就是我们实际上是把原材料经过各种工艺一步步固化到茶杯上去的,使茶杯形成一个固定的性能,最终把它变成了一个制成品。对于这样一个产品,我们不会认为它是有生命的。进入数字时代后,我们要能够解锁一个产品的固定的性能。比如,我们可以在一个茶杯中植入一定的感知单元,用于自动检测茶水的温度、分析茶水的成分,之后把数据提炼出来。一旦有了这个数据,我们就可以进行与个人健康数据的匹配,通过算法来设计怎么喝茶是最有益于个人健康的。再比如,我们可以创建这样一个场景,那就是个人和茶杯之间将基于数据展开一种正反馈效应,即个人与茶杯共享健康数据越多,个人得到的服务就越精准,得到的服务越精准就会越愿意共享更多的健康数据。久而久之,茶杯将会积累大量的个人健康数据,也就意味着茶杯不再是物理意义上的茶杯了,它同时还具有由数据构成的不可见的部分,我们称之为茶杯的“数据孪生体”,也就是为这个茶杯创造出了一个数字格式的同步数据孪生体。我们为什么要去训练这个数据孪生体?在实体空间中,任何一个物品都会受到时空的双重束缚,比如此时这个茶杯只能待在此地,不可以在此时待在另外一个地方。但是一旦有了数据孪生体,茶杯就进入了数字空间,遵循的是数字空间的基本逻辑而不再受到时间和空间的束缚。基于茶杯诞生的数据孪生体并不需要存在茶杯里,我们完全可以把它存到云上,而我们的生活场景也由此发生了巨大变化。比如,我在北京训练的这只茶杯,当我要去南京出差时就没有必要非要把这个茶杯带过去,而是在南京找一只同类茶杯,然后通过扫码把云上的茶杯数据孪生体召唤到本地,实际上仍然是在与数据孪生体进行交互,而当我离开时数据孪生体又会回到云端。由此,数据孪生体给了我们更加灵活和弹性的选项,久而久之我们的数据就会在这个孪生体上积累得越来越多,以至于使得数据孪生体比我们自己更加了解自己,甚至可以应用到看病就医等方面。未来,医生给我们看病可能不再需要望闻问切了,因为医生只能接触到我们的数据,也只需要通过分析数据就能完成对疾病的诊断。在此基础上,通过分析数据来看病,人类的大脑反而比不上计算机,也就是说看病就医将会被智能系统接管。因为我们人类的学习是基于经验而不是基于数据的,所以也天生并不擅长处理数据,而计算机的学习是纯粹基于数据的。一旦有了数据,拥有大量算力的计算机就可以直接接管此类工作,带来翻天覆地的变化。未来,医生的主要工作将从看病变成维系这套医疗数字化系统的正常运转。更进一步的是,随着数据的不断累积,我们能够发现越来越多的工作将会被数据与计算机接管,这就是数据的威力。由此,我们也就搞清楚了物联网的本质,关于物体的联网就是物联网。过去,很多人谈到物联网会认为我们就是要用物联网技术做一个产品,但物联网真正的核心是找到最简单的办法训练出一个物体的数据孪生体,因为只有数据孪生体才能够联网,而物体本身是不能直接联网的,就像我们上面说的茶杯一样。基于茶杯训练出的数据孪生体是时刻联网的,就像我们人一样都是联到网络里面去的,我们都被称为网民。但实际上,我们的肉身从来不曾联过网,我们都是通过人的数据孪生体来联网的,而我们人的数据孪生体就是手机里面的数据,也就是说是与手机的界面进行交互来借助数据孪生体间接联到网络里面去的。既然搞清楚了这一点,我们也就有必要去思考一个问题,那就是可不可以把这个模型进行移植。比如,我们可不可以仿造人的联网过程为一条狗搭建一个联网模型,可不可以发明一个类似手机的设备——“狗机”戴在狗的脖子上,从而学习狗的生活习性、不断记录数据,以至于可以通过这一数据孪生体解锁一条狗的世界,进而用同样的办法解锁成千上万条狗的世界?假如成千上万条狗都可以被数据孪生,那么我们就可以为狗和狗之间建立一个新的通信协议——“狗联网”。接下来,我们再推动狗联网和人联网建立数据接口,那么人就能够搞清楚狗的意图、狗也能听懂人的语言了,因为我们为狗联网和人联网找到了一种标准化的语言体系,即数据语言。综上所述,正是通过数据孪生体,数据得以把没有生命的物体变得“有生命”,把有生命的变得“有灵性”。从茶杯和狗联网的例子中,我们可以看到,万物互联将会推动我们这个社会迈向数字时代。在迈向数字时代的过程中,我们也能够看到这背后巨大的数字经济的发展空间,几乎所有的行业都有可能被数据重新改造。2.人工智能A代表AI,也就是人工智能。近年来尤其是2023年,人工智能的话题是非常火热的。随着ChatGPT的发展,我们见证了人工智能在全世界的普及。过去,我们提到人工智能时总是感觉技术高高在上,可望而不可及,但是ChatGPT却可以像智能助手一样和我们互动,我们有任何问题都可以询问ChatGPT,而它的回答每每都让我们感到惊艳。由此,我们看到人工智能技术正在快速大踏步向我们走来,那么我们要如何理解人工智能技术?我们可以把人工智能技术的发展以及对产业发展的影响分为三个等级来看:一是运算智能,也就是通过计算能够得来的智能;二是感知智能,也就是要求机器做到会听、会说、会看,比如智能音箱、Siri、人脸识别等;三是当前最复杂的认知智能,也就是要求机器做到会想、会思考、能理解,具备真正的思维能力。这是人工智能从诞生到现在走过的三个重要阶段,现在我们的焦点是在认知智能上。那么,我们要如何理解这三个等级的智能?那就是要统一认识这三个等级的智能,也就是说尽管各有侧重,但基本上都是同时被用到的。第一,什么是运算智能?运算智能讲究大算力,实际上是指算力输出而不讲究算法。最开始给人类社会带来人工智能冲击的,是发生在1997年,IBM公司开发生产的超级国际象棋电脑——DeepBlue(深蓝)。深蓝诞生之后就打败了卡斯帕罗夫,在世界上引起了很大轰动,不亚于现在的ChatGPT对我们的影响,大家都在惊讶于计算机能够有智力,甚至是进化速度非常快的计算机将很快在智力上把人类全部打败。但是没过多久,我们就明白过来,深蓝打败卡斯帕罗夫实际上并不是由于具备智力,或者说根本不需要用到智力,因为国际象棋的走法是可以被穷尽的,我们完全可以把所有走法都教给深蓝。这样的话,深蓝就具备了完备数据库,人每走一步棋都会回到数据库中进行比对,得出哪种走法最终胜出的概率更高。我们发现,深蓝只需要通过计算胜率就能够把人打败。尽管卡斯帕罗夫下棋时要相对复杂,因为他考虑的不是眼前这一步棋而是好多步棋的走向,但是他也有局限,那就是考虑更多将会远远超出脑力范畴。然而,我们只需要给深蓝足够强大的算力,就能够算出第十一、十二甚至二十步棋。通过这个例子,我们知道正是因为有了极强的算力,计算机才能够体现出智能的感觉。到现在为止,任何一台人工智能系统的发展都离不开强大的算力,比如支撑ChatGPT计算与发展的仍然是上万张性能最高的芯片,并且每进行一次大模型训练都要耗能甚巨。所以,算力是智能系统的基础,这就是运算智能。然而,过去的计算机都属于经典计算机,其实际算力是有瓶颈的。我们能不能找到一种更好的办法,能够让算力更大量地输出?这就要换一个范式,从经典计算机采用的二进制发展到突破二进制束缚的量子计算,进入到更大范围的算力提升上来。从上世纪70年代提出量子计算机原形到现在,经过五十年左右的探索,我们能够看到量子计算技术也已经大踏步向我们走来。比如,2019年谷歌公司研制完成的“悬铃木”量子计算原型机,在计算一个非常复杂的线路问题时只用了200秒就完成了,而对于同样的问题,运算速度最快的经典计算机也差不多要连续不间断工作一万年时间,差距一目了然。2020年我国科学家团队成功构建76个光子的量子计算原型机“九章”,其计算速度等效比“悬铃木”快100亿倍,这意味着量子计算技术已经离我们的生活越来越近,当有了更大算力支持时,我们过去很难做到的事情将很快可以迎刃而解,如对气象动力学进行精细化数据模拟,甚至能确定每分每秒的天气情况。总而言之,更大的算力将带给我们更大的智能。第二,什么是感知智能?感知智能基于自然语言处理或者称语音识别技术,现在这个领域已经突破得很好了。国外最先把语音交互入口作为商用化应用的就是苹果公司推出的Siri,国内也先后涌现出一批在感知智能方面做得非常好的企业,如旷视科技、商汤科技、依图科技、云从科技等。他们在语音识别、图像处理等方面的技术都是全球领先的,在人脸识别方面基本上都可以把准确度提高到98%以上,也就意味着在会看这一领域,机器的能力已经超越了人的眼睛。第三,什么是认知智能?认知智能要求机器能做到会想、会思考、能理解,在这个方面我们已知的就有很多表现得非常惊艳的公司,比如DeepMind公司开发的专门用来下围棋的人工智能系统——AlphaGo。自诞生之后,AlphaGo先后挑战了人类最顶尖的围棋高手,如4:1战胜了李世石,一次性打败日本和韩国排名前六十的围棋高手,在中国乌镇挑战柯洁,三盘全胜。至此,机器又在围棋这个领域获得了超越人类的绝佳优势,而且我们还有理由相信,一旦机器能够下围棋,人类就再难找到翻盘的机会了。在此基础上,DeepMind公司又推出了AlphaGo的进化版本——AlphaGo Zero,又称阿尔法元。阿尔法元只训练了三天,就完全打败了AlphaGo,之后只花了三个小时的时间又掌握了国际象棋,成为国际象棋的顶尖高手。后来,DeepMind公司又让阿尔法元去发现蛋白质结构。在阿尔法元的支持下,人类对于蛋白质结构的认知被扩大了无数倍。人类作为一个整体、总体,拥有大量的知识,然而我们每个个体却又很渺小,哪怕任何一个人从出生开始学起,倾其一生能够掌握的人类知识也只占总体知识微不足道的一部分。由此,一条巨大的鸿沟出现在我们面前,我们能不能找到并建立起来一种机制,让任何一个个体学到更多的人类整体的知识,这就是关于认知智能的另一条路线。在这条路线上率先做出成绩的是IBM公司推出的沃森系统。沃森系统有一项非常重要的能力,那就是只需要一秒就能够读完一百万本书,这个读完特指认知计算完,也就是理解这本书的意思。有了这样的能力,沃森系统可以瞬间成为任何一个专业领域里面的专家,我们可以把某个专业领域里所有人类已有的知识迅速教给沃森,这种学习能力是任何一个人类个体都没法相比的。沃森学完了之后,就可以反过来赋能个体。这就是认知智能的另一条路线,即并不给人类整体增加新知识,而是使人类积累的知识得以更加高效地输出和使用。由此可见,未来的工作场景更像是人类负责提问,而机器负责回答。比较个体有没有能力或竞争力的核心,取决于能不能提出好问题,因为问题提得越好,人工智能系统就能够发挥出更大的潜力。由人类提问、由机器回答的结合也将成为我们全新的生活状态,也就是未来任何一个人都会是人机融合或者称人机交互的系统。人工智能成为人类的“僚机”,全生命、全时空伴飞。综上所述,三个等级的智能结合起来,奠定了未来人工智能技术发展的基础,进而在大数据之上演化出智能经济。3.安全S代表Security,也就是安全。因为S这个字母处于Basic的C位,也就意味着安全是最重要、最核心的。其他数字技术越发展,关于安全的诉求也就会越高,也就是说当一切都被数据化后,数字化的程度越深,我们对安全的敏感性也就越高。4.物联网I代表IOT,也就是物联网。关于物联网的内容,我们已经在大数据的部分详细介绍过了,即万物互联的概念。5.云计算C代表Cloud,也就是云、云计算。云的本质就像是一个数字化的空间,也就是数字形态所存在的地方。比如,参照我们在线下生活中的教室,我们也可以在线上开辟一间“云教室”,这间教室搭建的空间就是在云计算平台上。再进一步,我们也可以参照线下生活中的作坊或生产车间,在云上开辟一间“云作坊”或“云生产车间”,其本质就是实现制造业的智能化、高端化转型,也就是说未来的智能制造是离不开工业互联网的支撑的,而工业互联网会把各种生产运作全部数据化来进行云上协同,形成最终的“云工厂”、“云生产”或“云制造”。总而言之,云实际上就是一种数字形态的空间概念。上述五个字母合起来就是Basic,我们也可以把它们统称为数字原力。只有有了数字原力的支撑,五项技术交叉作用、相互推进,我们才能让整个人类社会迈向数字时代。展望未来,上述一系列数字技术的背后都有着巨大的可利用空间,我们在其中也将会迎来大量的变革机会。但与此同时,数字技术也向我们提出了包括安全挑战在内的一系列全新挑战,需要我们特别加以应对。文章转载自:宣讲家网(如有侵权,请联系我们删除)原文链接:http://www.71.cn/2023/0804/1206320.shtml