http://www.scol.com.cn(2023-4-3 9:31:07) 编辑:盛飞
发展生成式ai 四川可以算力基建和数据产业为基点
openai发布chatgpt背后是前两年openai发布的gpt3.0技术,由于在gpt3.0技术上做了一些优化,所以chatgpt又被认为是gpt3.5版本。在3月14日,openai再次发布了新版本gpt4.0,并将其作为plus订阅服务发布,新版本再次掀起热潮,订阅支付通道一度拥堵瘫痪。 chatgpt 一次又一次掀起热潮,是因为chatgpt突破了人工智能应用瓶颈,未来以生成式ai为代表的人工智能产业将进入全面爆发阶段。 面对生成式ai热潮,四川要紧抓前沿科技发展机遇,将发展生成式ai作为四川实现高质量发展、实现科技弯道超车的重要应用方向,主动推动生成式ai产业的发展和进步,争做生成式ai发展的引领省份。 chatgpt将带来生产力的变革 chatgpt是生成式ai,通过机器学习让ai掌握一种能力,最终实现机器表达。而为了规范ai的行为,chatgpt通过三步走来优化:第一步是利用海量语言数据来进行无监督学习,就好像鹦鹉学习人类讲话那样;第二步是利用海量标注的语言范例来进行监督学习,用人类的语言数据来规范gpt的回答模式;第三步是通过强化学习算法对gpt回答进行打分,这一方面让gpt的回答具有随机性,另一方面让gpt更大概率用最优的方式回答问题。 chatgpt之所以引起轰动,主要原因有二:其一是gpt比过去的ai更智能,过去的ai是玩具,如今的ai是工具。chatgpt根据用户的关键词提示,在理解语义的情况下,会不断追问要求用户补充信息,最终给予用户满意、符合人类逻辑的答案。其二是万物皆可gpt。chatgpt不仅仅是聊天,它可以写代码、写文案,gpt-4的多模态模型中还加入读图功能,它也可以辅助搜索,同样的功能可以移植到办公软件领域,移植到医学领域,移植到新闻广告领域。可以说chatgpt应用到一个行业领域,就会大大影响到一个产业。 综上两点,我们认为chatgpt将带来生产力的变革。人类之所以站在地球生态系统顶端,关键在于人类知识可传承、可积累,而每个时代,人类都用不同工具来传承知识。原始和封建社会我们靠代代相传、口耳相传的知识传承和积累体系,而到工业革命,古登堡印刷机和造纸工业只是支撑了传承和积累体系,书本让工人成为先进生产力的代表。而到信息时代,互联网和存储芯片成为知识的重要载体,人类摆脱了知识匮乏的状态,但受限于人类的认知容量,信息时代人类面临的问题不是信息不足,而是信息过量过载,此时,诸如chatgpt这样的生成式ai就是人类解决问题的钥匙。 万物皆可gpt,因为所有领域都可以用gpt来提升效率。人类将记忆性、重复性的工作交给gpt,而自己承担创造性的工作,这大大降低了人类创新创造的门槛。过去写软件需要数十年的编程学习,如今通过生成式ai,那些机械重复的代码,完全可以用ai去解决。有了生成式ai,人类将从重复劳动中解脱出来,将有限的生命投入到无限的创新创作、开拓进取当中。 四川发展生成式ai有自身优势 chatgpt大火引爆生成式ai的产业机会,生成式ai发展的背后有三大基础:智算算力、高质量数据、大模型算法。当前,各省市都在围绕生成式ai展开产业竞争,发展生成式ai,四川有自身的一些优势: 四川尤其是成都创业氛围良好,对互联网、初创企业创造了良好的创业环境。成都2022年净增高新技术企业达3489家,较2021年有较大幅度增长。早在2015年,四川成都就推出了“创业天府”行动计划,在电子信息产业、传媒互联网、生物技术等新兴产业领域,成都一直居于全国各大城市的前列。 成渝地区双城经济圈建设为四川和成都经济发展提供了支持动力。成渝双城经济存在互补优势,重庆有较为突出的工业、金融业,成都有较为出色的科技初创企业,通过科技创新,成都的产业诸如数字经济可以和重庆的工业相互结合,形成数实融合发展态势,通过重庆的金融亦可以加大对成都初创企业的支持力度,以双城经济圈来带动成都创新发展。 四川有资源优势。四川是全国水力发电量最高的省份,其他能源资源、矿产资源也非常丰富,这让四川在发展算力方面具备很强的优势。国家“东数西算”提出建设成渝枢纽,但实际上成渝算“东数”,就四川来看,“西算”可以布局到除成都以外的其他城市,比如四川雅安就在着手建设数据中心。 四川具备发展生成式ai的人才优势。成都有多所院校开设“数据科学与大数据技术”专业,受益于过去重点发展软件外包业务的基础,当前成都聚集了不少大数据、人工智能、区块链领域专业人才。 综上,正是因为有如此条件,四川可以力求在生成式ai领域有所作为,并借发展生成式ai的契机,为四川培育一批高科技企业。 以算力基建数据产业为基点推进 政策层面,四川继续以包容性、支持性政策引入初创企业,尤其是ai领域企业。生成式ai 需要海量资本投入,比如有人估算chatgpt的总投入高达40亿美元,单次数据训练的算力耗费都高达千万美元,所以生成式ai的确是一个烧钱的行业,初创企业需要资金支持。为解决初创企业资金不足的问题,四川可以考虑通过政府牵头,国企、民企跟投的方式来为生成式ai初创企业提供融资支持。所以政策层面的任务主要是两方面:一方面是保持,继续以包容性、支持性的政策吸引相关初创企业来四川创业,另一方面是以投资支持来扶持初创企业,助力其迅速壮大。 基建层面,抓紧“东数西算”中成渝枢纽的建设。这里要强调三点:其一,所说的算力是智算中心,是针对生成式ai的算力,而在算力基础设施之外,当前算力gpu等芯片领域依然是我国的短板,以智算基建为契机,四川可以引入更多芯片初创企业,壮大四川的芯片产业。其二,所说的“东数西算”,成都应该以数字经济发展为主,四川其他地市则可以着重布局数据中心。其三,算力供给会出现过剩的局面,可以考虑引入更多的云计算企业来合理调配资源,算力建设应该以企业推动为主,政府为参与算力建设的企业提供好能源、通信等基础配套,以防止算力供给过剩。 产业层面,生成式ai的产生需要一条完整的创新链条。产生生成式ai基于三大基础:算力、算法、数据。算法依托人才,算力依托基建,当前我国各地在算法和算力上都有长足进步,唯独数据,当前依然有很大的发展空间。生成式ai发展需要高质量数据。高质量数据需要经历多个环节,包括数据收集、数据筛选、数据处理、数据预标注。而预标注数据是规范生成式ai语言生成能力的重要资源。 在过去,数据标注企业是一个比较低端的产业,但低端产业亦有很大的发展空间,理由如下:第一,生成式ai对高质量数据提出要求,市场有了新的需求增量。而随着各大企业纷纷介入到大模型ai当中,未来标注数据、高质量数据需求将井喷式爆发,在这个情况下,数据标注企业的规模效应将逐渐显现。第二,数据标注企业亦可以做到差异化。数据标注早先采取人工标注方式,如今通过算法和其他技术手段,数据标注的智能度提升,行业壁垒也逐步提升。第三,数据标注企业可成长为数据经纪商。数据企业可细分为具备数据资源的平台和面向数据需求的经纪商。经纪商从客户获得需求订单,通过数据平台购买等方式最终向客户提供数据产品。生成式ai 需要高质量数据,而当前大数据时代正逐渐从数据粗加工转向数据精加工。而实现数据精加工的企业,就是数据经纪商。四川在发展生成式ai方面,要尤其重视数据要素产业的发展。而发展数据要素产业的侧重点,就是培育本土的数据经纪商。培育本土数据经纪商的基础,可以通过引入更多的数据标注工厂来实现。现阶段较为低端的数据标注业务,相信未来会逐渐走向高端,从规模化走向差异化。 综上,从四川的优势出发,四川可以算力基建、数据产业为基点,推进四川生成式ai产业的发展。与此同时,算力基建和数据产业也将在其他方面为四川数实融合、数据要素价值释放提供更好的支撑作用,从而推动四川数字产业实现高质量发展。 (作者系浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员,工信部信息通信经济专家委员会委员) |