当前,作为数字经济时代的重要基础设施、关键技术、先导产业以及赋能引擎,人工智能已在自动驾驶、智慧城市等领域广泛应用,成为改善人民生活质量、推动产业优化升级的重要驱动力。党的二十大报告指出,加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。
近日,北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军,清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松,阿里云智能首席技术官周靖人做客《人民会客厅》栏目,围绕大模型驱动下AI产业发展进行交流。
从日常生活中人脸识别的广泛应用,到街上行驶的无人驾驶汽车,再到工厂内相互配合的机器人……类似的智能场景在生产生活中并不少见。作为数字经济时代的重要基础设施、关键技术、先导产业以及赋能引擎,人工智能(AI)已在自动驾驶、智慧城市等领域广泛应用,成为改善生活质量、推动产业优化升级的重要驱动力。
近日,行业专家和企业代表做客人民网《人民会客厅》视频访谈栏目时表示,大数据、大算力推动了人工智能发展走向大模型时代,要加快人工智能技术创新,建设开源开放生态,降低模型应用成本,拓展人工智能应用场景,推动数字经济和实体经济融合发展,为经济社会高质量发展注入智慧动能。
【更多】北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军:经过十几年发展,人工智能已发展到大模型时代。大模型是一个智能载体,而智能来自于海量的数据。计算机具有超强算力,能够从海量数据中提炼出智能模型。再加上人工智能算法的进步,能够训练出智能水平比较高的模型。要建设开源开放的大模型技术体系,让更多人的聪明才智以开放的方式汇聚在一起,推动智能社会更快到来。
清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松:大模型和AIGC实际上为数字经济开创了无限可能性。借助于计算机可以对所有信息,包括文本信息、图像信息从计算的角度进行处理,在深度和广度上比以前有一个质的提升。要把这种可能性落实到现实中的应用场景里有一定的难度,需要付出艰苦的智力劳动,要打破数据间的行业壁垒,在符合国家法律法规的前提下,共享、利用、开发好数据。
阿里云智能首席技术官周靖人:推动我国AI创新发展,一是要在基础设施上提供相应的算力支持,能够有更大规模的提供公共服务的算力平台,为我国AI快速发展奠定基础。二是模型生态建设上要有开源共享的目标,不仅要关注基础模型,也要探索每个行业的相关模型,包括人工智能一系列应用,这对我国AI发展发挥着重要作用。三是要降低AI使用门槛,降低模型应用成本,让各行各业的人将人工智能应用到实际场景中,真正让AI做到普惠、创新发展。
人民网主持人吴婧:
各位好!欢迎走进《人民会客厅》。近年来我国人工智能加速发展,形成了较为完整的产业体系,人工智能日益融入千行百业,成为驱动产业转型升级、推动新型工业化建设的重要驱动力量。今年的政府工作报告也强调,大力发展数字经济,这意味着人工智能等数字经济将迎来新的发展前景。
今天我们的演播室为大家邀请到了北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军,清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松,阿里云智能首席技术官周靖人。欢迎大家。
今天我们将要围绕大模型驱动下中国AI产业发展进行探讨。我们知道,近期国内外出现了一系列的自然语言生成的现象级AI产品。我们想先请教一下三位,这样一款产品出现根本的原因是什么?
北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军:
可能大家关注的是产品,事实上整个AI的趋势到了今天这个时候,无论是哪款产品出现,背后的整个大的趋势是不变的,产品只是一个典型的大家接触到的东西。实际上人工智能发展,当然我们也可以说经历了差不多六七十年,也可以说经过2012年以来十多年的发展,已经到了这样一个时刻。什么样的时刻呢?就是今天大家说的大模型。大模型是什么东西呢?其实就是一个智能的载体,智能的来源来自于大数据,海量的数据。人类像生物这种智能来自于地球这样一个复杂的环境把我们进化出来我们的智能。今天大家用的人工智能这种用计算机算法产生的人工智能,背后实际上来自于海量的数据,数据也是环境的一种表达方式。经过差不多新世纪以来,海量数据的产生,使得产生智能的物质条件具备了。这是第一个。
第二个,今天计算机的算力特别强,它能够从海量的数据中提炼出一个智能模型,这也是一个基本条件,这个条件以前也不具备,今天的算力也已经具备了这样的条件。再加上人工智能算法的进步,使得今天能够训练出智能水平比较高的模型。有了这样的模型在背后,出现各种各样的产品也就不奇怪了。
清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松:
刚才黄老师说了,实际上是三个“大”,三驾马车,大数据、大模型、大算力。这三件事不是放到一起就出这个东西,实际上是产生了化学反应。但是没这三件事肯定不行,应该说这三个“大”风云际会的结果。这里面特别重要的就是自然语言的作用,自然语言就是人类语言,人类语言的重要性不言而喻,我们大家都有认识,语言是人类所独有的,可以反映非常深刻的思想,我们很多人类独有的活动,比如说推理、决策等等,其实都依赖于语言。但是以前没有找到一个很好的计算的办法,把它打到模型里面去。这些年发展,实际上我们找到了一种通过计算的手段把人类的语言可以无遗漏地表示出来,处理一遍。这件事导致了什么结果呢?我们人类拥有的任何的概念,这个概念非常庞大,有粗力度的概念,有细力度的概念,任何概念都可以以一种隐藏的我们所谓向量表示的形式,向量表示其实就是数字,以一种可计算的数字的方式建立联系,建立联系就可以相互作用,相互作用的话就可以有些更加复杂的行为,比如大模型和大数据融合,可能就会产生涌现现象,涌现现象就会导致它的性能出现一些突变,所以,才有最近这段时间大模型有些表现,包括AIGC的表现,非常让人惊艳,我们对语言的处理是一个很重要的原因。
另外,这套理念,就是我们进一步拓展了多模态,比如说到图像,以自然语言为桥梁,然后再结合图像本身的优势,把文本和图像的各自的长处结合起来,就产生了现在做图像生成效果也很好,这也是语言做桥梁,往前又走了一大步。我觉得这几点可能是我们现在产品做得不错的一个内在的原因。
阿里云智能首席技术官周靖人:
刚才黄教授和孙教授的观点我都非常认同,主要的几个原因来源于三个元素,包括数据、算力,特别是云计算的诞生,以及本身算力模型方面的一系列的进展。数据,刚才黄教授提到了,整个数据现在是以非常丰富的形态的存在,不光光指数级的增长,以前可能我们更多的是文本的数据,现在有图片,有各种的多媒体的数据,整个的数据的体量也是在以指数级的规模不断地发展。有了数据,就需要有计算的能力去处理这些数据。正好这几年我们整个云计算得到了长足的发展。不光是单台服务器的计算能力有一个突飞猛进的发展,包括我们的云计算也有效地把成千上万的机器有效地连接起来,组成了一个超级计算机,也为今天模型的发展提供了一个坚实的基础。
另外,我们在模型方面也有很大的突破。首先,模型本身越来越复杂,特别是近几年的Transformer模型的架构,能够让模型的参数非常庞大,参数越多,在一定程度上让模型可以能够捕捉到很多知识细节。另外,在模型训练的范式也发生了一系列的变化,以前我们人工智能的模型,更多的是从标注的数据开始,也就是说需要人提前去标注,告诉机器,学习什么样的结果,但今天由于新的人工智能范式的诞生,我们更多的是通过一个所谓自监督学习的方式,能够从我们海量数据里面自动进行数据的标注,只有这样我们对模型的训练才能有规模性的发展,才能真正地能够创造这样一个大模型。
回到模型的本质,为什么今天的模型有这么非常有力的一系列的应用呢?我们也在不断地探索。中间可能有几个原因。我们知道今天的这些大模型在一定程度上已经代表着近似于人类的智能体,人的智力很重要的一点是记忆力,也就是说首先要有记忆才能有其他的一些推演的能力。今天,在大模型,因为它能够海量去处理今天互联网上看到的各种信息,或者说书本上的信息,首先对所有的信息能够看过一遍,而且本身模型有强大的记忆的能力,它能通过内部强大的网络,非常有效地把我们的信息、把我们的知识组合起来,组织起来,也就是我们常常讲到的高效的缩影,也就是它有高效的存储让这些知识有效地存储起来。有了这些知识过后,当我们解决实际问题中间的时候,就会发现我们是可以举一反三的,经常我们讲熟读唐诗三百首不会做诗也会吟,我们往往遇到实际的问题是可以通过我们的知识体系进行解答的。甚至今天在模型的时候我们也引入了一些随机变量,能够让今天有这么灵机一动的感觉,让今天的基于大模型的深层的应用变得非常丰富、非常有力。
我们认为今天大模型还是在一个发展的初期,所谓大模型所带来的一系列的应用,以及大模型真正的核心的能力,我觉得我们现在也许只看到了一部分,今后的几年我们应该能够看到更多这样创新式的应用发展起来。
人民网主持人吴婧:
清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松:
AIGC是生成,所以,首先应该会对内容制作和内容创作产生直接的深刻的影响。我想可能有这么几点。一个是它可以显著地降低制作成本,以前你要作一幅画,很多功夫要下,现在用大模型,他把人类的画作都学了一遍,之后他可以很快地,不需要你做很多的事情,从制作的角度,如果从工业生产的角度,他会显著地降低成本。
再一个,会显著地降低准入的门槛。原来比如说你要做内容的制作,通常是要大的机构,或者是大的企业,个人很难做这件事。从制作。但是现在有了AIGC的人工智能工具,不光是2B,不光是大的B可以做这件事,个体也可以做,2C和2B说不定在一个平面上了,这样其实大大有利于大众创业、万众创新。
再一点,它会显著提高生产的效率,它快。这个显然,秒级就出来。
再一个,它会显著提升产品的质量。特别是多样性和个性化生产,计算机作一幅画,人工智能作一幅画你不满意,我再给你弄一个,这几乎是无限的,直到一款符合你的要求,契合上,你在这种基础上修改,还是启发你,机器可能的生成空间比我们人想象的空间可能要大,它启发你,可能不一定完全合理,启发你,你再去做一些创意,也很重要,在这个基础上做创意,这样就使它的多样性和个性化就会有一个很大的提升。
直接的效应,包括相关产业,是很明确的,这个空间是非常广阔的。再往前走,不仅限于此,有了大模型,因为它把信息以一种知识的形式整理了一遍,给它打通,这时候我们做其他更复杂的任务,比如说做宏观经济决策,做更复杂的任务,可能就会比以前做得好。直接就是生产,但是,再往前走一步,会有更广阔的应用空间。
人民网主持人吴婧:
北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军:
AIGC,人工智能产生内容。之前我们知道,几年之前,UGC,用户产生内容。再往前,大家不说,但是大家都知道,是专业人员产生内容,是作家、画家经过长期训练之后才能产生有质量的内容。现在AI都可以做了,肯定会对人的各方面会产生很深刻的影响。
一方面我们传统认为的创造性,比如说我是个作家,我写一篇大家很愿意读的小说,我觉得这是很有创造性。我一个画家,美院毕业,我画一幅画价值多少。那个时候认为这就是创造性,今天我们回过头来看,这种创造性大概要一分为二的看,一种是真正的原创性和根据前人的作品组合、模仿画或者是创作,这是两种创作性,后面这一种现在AI是可以做的,真正原创的,比如说齐白石画派,出现了一个全新的画种,以前没有,从他开始有了。物理学的爱因斯坦,之前我们没有相对论的观念,他在脑子里面有了这么个灵光一闪,产生了一套新的理论。这种创造性,今天的AI,我认为是做不到的,至少目前的AI还缺乏这样的能力。但是像刚才说的其他的,我们原来认为百分之九十几的创造性,AI都可以做了,因为大多数从事的是这百分之九十多,而不是那最顶尖的创造性,一定会对这一类的职业、工作带来很深刻的影响。
因为今天我们很多人,除了刚才说顶尖的少数人在做,从事物质生产的也有一部分人在做,中间有很大量的人是在做内容或者是文化产品或者是精神产品,这些工作就会受到直接的影响。但是我觉得可能最大的影响是说,如果这个东西能被AI替代之后,如果人不去做这件事了,AI的成本也低,又方便,很容易得到,其实最后那个顶尖的成果的产生也可能被影响了,因为人不去努力地走前面这些没那么创造性的工作,他可能走不到那么原创的东西。所以,这个对人类社会的发展,我们要想想,原来说把体力劳动希望交给机器,现在我们把大部分脑力劳动也要交给机器的话,还要我们干吗?尽管我刚才说,还保留了一定的人,特殊的只有人能做的创新,但是问题是可能根本就走不到那一步。所以,这是一个很深远的问题,一方面,某种意义上是福利,AI帮我们做了这么多脑力劳动的事情,但是另外一方面我们想想这个社会结构,以及我们人类到底怎么发展的。
人民网主持人吴婧:
北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军:
人民网主持人吴婧:
北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军:
人民网主持人吴婧:
北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军:
人民网主持人吴婧:
阿里云智能首席技术官周靖人:
我们刚才提到大模型特别是超大规模模型的发展是需要强大的算力,以及模型本身的一系列的研发。今天到了超大规模模型,实际上是AI+云计算全面的整体的技术的表征。也就是说,今天所有的大模型离不开下面的基础设施,特别是云计算这样的计算能力,能够帮助我们去做模型的训练,去做模型的服务。在这两个方面,我们国家都有很早期的投入,而且在这方面也是有非常多的创新。比如说在基础整个算力这部分,在云计算方面,阿里云也是全球前三的云服务商,特别是阿里云也有自研的超大规模的操作系统,飞天云操作系统,也就是说能够把数百万的机器有机地能够联系在一起,形成一个超级的计算机。通过公共服务的方式,为大家提供相关的算力。整个操作系统也是通过今天内部的软件各个方面的资源调度,能够为我们的AI各个方面的训练,包括数据的处理,提供一个坚实的基础。
我们大模型的训练,还需要特别的智能计算的一些硬件和场景,特别是我们需要一个高密度的计算的集群,在这方面,不光光是每台机器有足够多的计算算力。这些再加上我们的存储,再加上我们的网络,再加上我们软件调度的一系列的优化,才真正为我们大模型以及AI的发展奠定一个坚实的基础。我相信,首要的第一个条件就是今天如何能够用好云计算,能够让云计算为我们的AI算力有效地快速地创新、快速地发展起来奠定了一个坚实的基础。
第二方面,在模型方面。我们国家在模型方面也是有非常多的一些创新,今天包括孙教授和黄教授这边的学院等等,其实在这方面都有非常多的研究。
我们国家研究大模型方面,还是起步很早的,举例而言,即使在我们阿里,阿里达摩院这边也是很早就在做相关的一系列多模态预训练的大模型。最初我们的想法很简单,当我们看到一个事物的时候,如何理解一个事物,这个事物有可能是一个商品,有可能是一个服务,关于这样一个事物,是有语言的描述、文本的描述,也有图片的描述。我们意识到今天为了有效地去理解这样一个万物,其实我们是需要从多个渠道理解这样一个物体,从文本、从自然语言的角度,从图片、从视觉的角度,去多方面地通过我们的知识体系,去理解这样一个商品,能够把知识融会贯通,这样才能有效地去完成万物的识别、万物的理解。这也是我们最开始去做多模态预训练大模型的初衷。大概在2019年、2020年的时候我们开始在这方面有很多的投入。我们过去这几年,从2021年我们也发布了一个百亿参数规模的中文的预训练多模态大模型。之后我们从百亿又到了万亿,到了十万亿也代表了我们国家是有训练整个超大规模模型技术的能力。在这之后,我们也在相关的,包括对话、视觉各个方面也都有非常多的多模态模型的研发和创新,特别是我们在过去几年读图会意的竞赛VAQ里面,首次能够让模型超越人类的评测标准,在中文的阅读理解方面,也是首次超过了人类的评测标准,这也是代表了今天我们所有的模型在过去几年有长足的发展。
去年阿里这边把所有的模型汇集在一起,对外发布了“通义”的大模型系列,我们之所以把所有的模型汇聚在一起能够形成多模态训练的范式,能够提供统一的训练的框架,更重要的是把这些模型能够分享给大家,能够开源,能够开放给大家,能够让各行各业在上面进行创造和继续地二次开发,只有这样我们才能为今天这个模型整个的生态逐渐地建立起来。
人民网主持人吴婧:
北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军:
我们在做AI的人与广大网友大家所关注的可能还不太一样,比如产品出来之后,大家会突然眼睛一亮,好象AI突然发生了什么巨大变化。但是对于做AI的人来说,大概那条河流本来就在流,到了这个节点出现了一些浪花现象。所以,我想从这个角度来说,我说河流的时候,实际上是全世界上很多人都在做AI的研究,中国有很多人做AI的研究,而且中国的研究本来就是世界研究的一部分,中国的人才、论文等各种贡献现在也是有目共睹,是整个全球做AI研究的一个重要的力量。所以,在这个意义上来讲,我们认为这个时间到了这个点,中国有这个技术的积累、人才的积累,我们现在要做一个产品或者做一个服务,这些条件都是具备的。但是,从一个真正的我们搞AI研究的人,到变成千家万户能用的服务,这之间还是有很多企业、产业的投入。首先,我们基本的条件还是相当不错的。但是,如果要说大模型这样一个基础设施或者大模型这样一个时代来看这个问题的话,这中间还有大量的工作要做。
我稍微说得长远一点,不在乎今年、明年又发了几个大模型或者有多少产品上市了,当然对大家有很直接的感受。我想我们从稍微长远一点的角度来看待这件事情,大模型本身是一个时代,一个什么样的时代呢?它从海量的数据里面抽取出来,凝练出这样一个模型,以智力的方式给千家万户提供服务的。这种服务你要想,我们讲未来是智能时代,智能时代是什么感觉?家里面所有的东西都是在跟一个具有智力的云、网络联在一起的,就像今天家里的电器接着电一样的,打开就亮了。将来我们每一个设备或者我们用的东西都是聪明的,它聪明来自于哪里?来自于通过网络源源不断送过来的智力。所以,在那个意义下,整个社会构造的是一套智力基础设施,就跟今天正在用的电力基础设施是类似的,是一个道理。所以,整个会有成千上万的企业在上面在不同的环节给大家提供服务。所以,在那个意义来看这件事,一方面,这件事并不是特别的技术秘密,好象谁能用、谁能做、谁不能做,不是那样一回事。就像发电,全世界会发电的人多了,能够运营大的电厂也很多,但最终电网只有极少数的电网,中国只有两家电网,国家电网、南方电网。将来智力也是这样类似的形态。要把这样的基础设施和智力服务构造出来,需要从多方面推动这件事情的形成,而不是几个简单的产品。可能不同的机构、不同的产学研用、全社会,包括投融资,大家要从这个角度来看,找到自己更恰当的位置,为未来共同的愿景作出自己的贡献。
像我们学校,或者我现在所在的智源研究院这样的机构,因为我们是做技术的,最终我们的贡献还是体现在技术上。我们现在的重点实际上是做开源、开放的大模型技术体系,因为你早晚不管这个模型谁做谁运营,总要训练模型的技术是越先进越好,那样才能把成本降下来普及千家万户。所以,我们为了做开源开放,很多研究学者都在做,不做开源开放,这些东西会封闭在少数垄断企业手上。比如我们关心国内国外的,这个产品当然是要直接面对用户。但是像我刚才说,长远来说,这个东西是普惠的东西,普惠的东西就需要跟多的人把自己的聪明才智,比如算法的改进、训练东西的改进能够以开放的方式汇聚在一起推动这个社会更快到来。现在整个社会,可能大家看到产品有点着急,这是着急不来的,一定是在建造一个智力社会,至少要有几年的眼光,绝对不要几个月,现在着急,马上要做出,有点过激反应,这不太好。
人民网主持人吴婧:
清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松:
我特别同意刚才黄老师说的,我们应该从更高的角度来看待这个问题,风物长宜放眼量。著名的哲学家维特根斯坦曾经说过一句话,非常深刻,他说“我的语言的极限就是我的世界的极限”。这句话我们给它推演一下,人类语言的极限就是人类世界的极限。大模型实际上通过语言把我们世界上所有的文本信息以及进一步拓展图像信息、多模态信息等等,它给它融通起来。这件事实际上可以说是大模型的极限,就是我们未来智能信息处理的极限,可能也不夸张,就是刚才黄老师说的,它是一个智能信息处理的基础设施。可能我们要从这个角度来看这个问题,如果这样来看,就不光是企业的问题,就上升到国家层面。
我们国家应该说从2010年开始,这一波人工智能的高潮到来这十来年,我们国家在人工智能方面还是取得显著进步,刚才黄老师也说了,我们做这件事的能力是有的,这个不容易,非常不容易。人工智能实际上是全世界各种,包括国家,包括企业,包括个人,各种力量博弈的一个结果,它是竞争的一个巅峰对决,我的话叫巅峰对决,非常不容易,我们能跟上。所以,这应该是我们国家可以在大模型和AI技术方面已经作出很多成果的一个重要保障。我们弱是弱在哪呢?我们跟跑能力很强,我们领跑能力现在是一大短板。总的来说,跟我们是能跟上,但是领跑几乎很少,这是我们将来要深刻思考的问题。但是跟跑的能力也很重要,为什么?我们能跟上,就说明我们有能力在AI一些重要应用场景方面作出创新。因为AI应用场景也是重大挑战,国外在这方面也在探索。貌似在应用层面,实际上它和国计民生更密切,这一大块是短板,全世界都是一大短板,我们能在前沿技术上跟上,就预示着我们有能力在重大应用场景方面取得突破,这也非常重要。
当然,如果我们将来可以领跑就更理想了,这个问题比较复杂,今天可能不一定有时间来讨论。你刚才讲的人才培养,其实是其中一个重要的因素。我们国家培养,平均意义来说,高质量的人才、人工智能的人才,这些年是没有问题的,这些年培养了大量的人才,支撑了我们国家包括大学、科研院所乃至企业的人工智能的发展。但是我们在顶尖人才培养方面也是一大短板,这和我们顶尖成果、领跑是匹配的。当然,这个问题就比较深刻。比如我就讲一点,我们可能要进一步提高学生的视野,就是他的学术视野。比如说人工智能真是要有重大创新,可能要多学科的交叉,特别是要有非常深厚的数学基础。包括从物理、化学里面都应该可以接到很好的借鉴,这块我们学生是弱的。比如学计算机的,可能只关注计算机的知识。但是从国外发展,比如这段Diffusion model,实际上从物理、从化学那边有所借鉴,你看他们学生读的论文,会读《Physical Review》,我们学生可能就少。所以,交叉学科合作的意识可能需要培养。总之,这个问题很复杂,今天不一定有时间展开了。
人民网主持人吴婧:
阿里云智能首席技术官周靖人:
我们刚才提到其实大模型本质都是算力及模型上的突破,为了进一步促进我们国家在AI上面的整个创新和不断探索,我觉得从几个方面:第一方面,我们还是要能够在整个基础设施上提供相应的算力支持。因为所有模型的训练基础还是依赖于通用的计算能力。在这方面,我们是希望能够有更加大规模的、更加能提供公共服务的算力的平台,或许更多是跟当前云计算发展能够有机结合在一起。
刚才讲到模型训练的范式也在发生一系列的变化。往往以前我们是训练一个特定问题的模型,因为有了这样一个预训练的模型框架,我们可以最开始的阶段,更多的是一个知识的积累,并没有带有任何一个特定问题训练这个模型。这部分,在这个阶段,我们往往叫预训练的阶段,是需要大量的算力,需要大量数据的处理。在这方面,刚才两位教授讲到,今天我们要在跟海外的顶尖机构在这方面进行竞争。今天的竞争,不单单是一个AI方面的竞争,这是今天AI+整个计算算力全方面的竞争。在这方面,我们一定要在基础设施方面能够为我们接下来整个国家的AI快速发展奠定一个坚实的基础,这是第一点。
第二点,我也非常同意刚才两位教授的观点,今天我们要讲到AI快速发展,需要我们模型有这样的生态,更多的是要让大家有开源共享的一个目标。其实今天我们大家更多的关注是底层的模型,也就是今天关注的比如说像语言模型等等,这些我们一般来讲,专业人士讲的是叫基础模型。基础模型需要大量算力、大量的知识积累。同时,我们也需要行业模型,比如真正要把这些模型应用在一个行业里面,其实我们是需要大量的行业的算法工程师来根据我们当前的问题来进行不断地去调优。当然,随着今天整个大模型的发展,上层模型的调优也发生了一系列的变化。过去我们更多的是做一些微调,其实现在我们看到,现在微调都不需要,可以通过指令性的一系列创新,能够改变今天模型在实际过程中的一系列行为,帮助我们有效解决问题。所以,在这方面,整个模型的生态发展,我希望大家不光光关注我们的底层模型,其实每一条行业线相关模型的探索,包括人工智能一系列的应用,这对我们国家全方面的AI的发展也是起到一个至关重要的作用。
第三点,随着我们今天AI的发展,我们还是需要降低AI使用的门槛。刚才讲到所有都提到AI训练成本比较高,有时候也需要相当专业的知识,包括今天到了每一个行业也需要进行特定为这个行业进行制作,怎样让AI使用的成本进一步降低。甚至我们今天能够让学生甚至让小学生,今天我们的小学生也都可以在PAD上进行编程,其实他们也应该能快速使用这些模型。去年我们搭建了一个社区叫魔搭社区,就是尝试解决这方面的问题。魔搭社区短短几个月也出现了将近有几十万的开发者到我们的网站上来下载模型。特别是我们提供一个简单易用的编程接口,能够几行代码就可以使用非常复杂的模型,这只是一个例子。我是希望讲到今天我们需要让模型的应用成本不断地降低,能够让今天我们各行各业的人,即使你是非计算机专业的人,也能够使用到人工智能的方方面面,能够应用到你实际的场景里面,只有这样我们才能真正做到AI的普惠、AI的创新能够共同发展。
人民网主持人吴婧:
北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军:
刚才讲数字经济与实体经济的结合,可能还需要从更长远一点角度看这个问题。我甚至想这样去打一个比方,比如工业革命,蒸汽机,原来以人力动物的力量进入到以机械为主体的那样一个时代,大概有几百年。电力,应该说一九几几年开始,整个电力开始进入千家万户,进入企业。我们想一想当时有电和没电这个社会的那种差别有多大。过去一百多年,计算机、互联网、移动互联网这些信息,其实我认为信息本身可能都难以跟我们接着要出现的智力时代相提并论。因为信息的时候是给人提供信息,还是人作为主体来加工使用这些信息。所谓智力时代是整个信息系统,AI系统在利用这些信息产生新的能力、新的智力。所以,我刚才讲,从当时工业革命、电力革命、智力革命这三个是同样量级的。而信息前面那些都是前奏,都是为了这次智力革命准备素材,数据、算力这些条件。只有智力像电一样的源源不断地给全社会供应的时候,我们就进入了一个全新的时代。
在这种意义上我们怎么看待这个问题呢?我们讲数字经济,数字经济肯定是建立在数据、大数据、AI这些新技术基础之上的,让各种应用,刚才说人、企业、全社会各个要素能够很简单地使用智力来驱动。因为这个社会运行的很多东西是靠智力的。我们建房子,我们农业、工业,更别说所有的这些跟内容加工、信息生产相关的活动,背后都是智力。以前是靠人的智力,刚才说工业革命让我们的体力一定程度上解放了,这次要解放我们的智力。它会带来特别深刻的巨大的变化。像刚才讲,我们中国在这个时代是走在前沿的,我们并没有落后,不像前两次时代的时候,历史的原因,某种意义上是我们错过了一段时间。这次我们几乎是在人类要进入这个时代,我们准备好了。
人民网主持人吴婧:
清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松:
大模型和AIGC实际上是为数字经济开创了无限的可能性,这是一条。因为它是借助于计算机对人类所有信息、文本信息、图像信息、各类信息从计算的角度进行了理解,在这个基础上我再去做信息处理,所以它的深度和广度比以前有一个质的提升,所以可能性是无限的。但是要把可能性落实到现实性其实还是蛮困难,你不能指望大模型是一个灵丹妙药,放之四海而皆准,吃一片就灵,不能指望这个。到了重大应用场景,还是需要一个场景一个场景的深耕,深深的耕作,要付出艰苦的智力劳动,它不是一个简单的事。
在这一点上,全世界其实都在摸索阶段,你可以认为大模型AIGC是一个概念,这个概念显示了一个无比美妙的前景。这个概念进入到千家万户可以进行销售,还有一段路要走,这实际上给我们国家,因为我们国家市场很大,各种应用场景很大,实际上给我们国家带来一个很好的机会。同时,也给各类比如企业,不管是大型企业还是中小型企业,特别是新兴创业的企业也带来了很多机会,也个人发展也带来了很多空间。我刚才也讲过AIGC本身是个性化可以很强的,降低了门槛。
总的来说,我们国家这几年再加把劲,以我们有很强的跟跑能力这件事,在重大的应用场景方面应该能作出世界领先的成绩来。这里面当然有很多问题要解决,比如刚才黄教授说了,数据有很大的问题。
人民网主持人吴婧:
清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松:
人民网主持人吴婧:
谢谢孙教授。AI产业的发展应该有很宽广的未来,但是路上的艰辛还是可以看得见的。
清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松:
人民网主持人吴婧: