微言网

搜索
查看: 6962|回复: 0
打印 上一主题 下一主题

中国的AI论文发表量全球第一,为什么没搞出ChatGPT?

[复制链接]
跳转到指定楼层
楼主
发表于 2023-2-24 11:43:05 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

【文/观察者网专栏作者 金钟】

最近几个月世界上最大的科技新闻恐怕就是ChatGPT的火爆流行。

ChatGPT是美国一个初创科技公司OpenAI开发的人工智能应用程序,2022年11月面向公众开放,到今年1月已经积累了1亿用户。

我也是这1亿用户中的一员。这段时间我使用ChatGPT的感受是,如果是在我本专业的经济和金融搜索方面,我不会依赖它。由于我知道自己所需的大部分经济和金融数据的原始来源在哪里,我会直接去各个数据的发布网站进行寻找。ChatGPT可能更方便,但是由于我的工作要求数据的准确性,所以略过人工智能这个中间层级反而更有效率。

但是在专业以外的地方,尤其是完全陌生的知识领域里,ChatGPT是一个非常有用的辅助工具。就像我们平时身边或则网上认识的某些“万事通”朋友,他们说的不一定就是最正确的权威意见,但的确可以快速给出一个我们容易理解、方便进一步深入了解事物的答案。

当然,如果仅仅是搜索辅助这样的功能,那么ChatGPT可能也就是一个更加智能的维基百科,并不值得现在这样热火朝天的关注度。它在搜索以外的各种场景应用,更是大家关心的焦点。

就我个人来说,ChatGPT可能对我最大的帮助就是辅助处理各种初级任务。在工作中,我经常需要分析大量数据来寻找规律、分辨趋势和研究各种异常的变化。但在将自己的研究结论整理成文字的时候,实际上大量的工作时间是用来完成一些初级的数据分析和文字工作,在做真正的深层数据挖掘之前,往往需要完成描述原始数据、画图做表、对图表进行简单描述等等繁琐步骤。

当微软宣布将ChatGPT整合到自己的办公软件后,未来我可以将原始的经济金融数据“一键生成”一份包含图表和文字介绍的初稿。这个初稿里只要能完整、准确的描述原始数据和介绍图表,那么我就可以摆脱繁琐的初级劳动,将主要的时间花在挖掘数据背后的故事、寻找数据变化带来的机会和风险这样真正核心的任务上。而当我完成一篇完整的分析之后,ChatGPT甚至可能“一键生成”一份精美的PPT,这样工作效率当然就会成倍的提高。

现实中我们很多人都面对着大量繁琐的文字工作,如果以后ChatGPT或者类似的人工智能软件可以让人“一键生成”这些文件,这对于工作效率的提高以及衍生出来的巨大商机的确难以想象。

我相信最近无数人都在思考着人工智能可能在自己的领域造成什么样的变化,而也有很多人在提问:为什么ChatGPT这样的技术成果没有出现在中国?

ChatGPT的开发者OpenAI成立于2015年12月,最初是一个非盈利机构,在2019年转变为盈利性公司。其主要创始人包括现任CEO山姆·阿尔特曼(Sam Altman)以及特斯拉的创始人马斯克。按照后来的媒体报道,OpenAI的创始者本身就是美国科技领域的明星巨头,所以他们出面聘请了当时美国在人工智能方面最顶尖的一些技术专家加入,而不少技术专家因为可以和自己同水平的研究者合作机会难得,宁愿降薪加入。

从2016年到2019年,作为非盈利机构的OpenAI的报税记录必须公开,根据他们当时的税表可知每年的成本开支都在递增。2018年是OpenAI作为非盈利机构的最后一个完整年度,当年总开支是5千多万美元,其中人力成本是1千5百万美元左右,租用服务器来运行人工智能的模型运算的开支达到3千万美元,剩下的5百万美元则包含了办公室租金、差旅费、法律费用等各方面的杂项开支。

2019年OpenAI为了吸收投资和给员工分配股权,选择从非盈利机构转变为盈利性公司,获得了微软公司的10亿美元投资。而2019年开始的GPT语言模型的研发发布也开始加速。到了2022年底ChatGPT发布以后,OpenAI的CEO山姆·阿尔特曼承认运行成本过高需要推出收费服务来平衡收支,而微软公司则立刻增加投资,据说新投资达到了100亿美元。

简单总结上面这些信息:

OpenAI在2019年之前的三四年里烧掉近1亿美元,才开始推出最初的GPT模型,当然此时的产品还只是雏形阶段,远远达不到今天我们看到的效果。从2019年到2022年由于变成了盈利性公司,我们不知道OpenAI的成本支出情况,但是根据CEO山姆·阿尔特曼的发言和融资动作来看,微软在2019年投入的10亿美元恐怕已经大部分花掉了。

现在事后诸葛亮的我们当然可以说OpenAI过去7年多烧掉近10亿美元做出来的ChatGPT是一个非常成功的投资故事。但是同时期美国成立的人工智能初创企业远不止OpenAI一个,不少当时比OpenAI更出风头的类似企业现在已经杳无声息,烧掉的资本当然更是无法计数。

从财务角度分析,这种未知领域的创新性研发就是一个漫长的烧钱过程,而其成果则具有高度不确定性。因此,就连谷歌、苹果和脸书这样的明星企业也没有“烧出”ChatGPT这样的产品,更不用说从总收入到利润率都落后于西方同行的中国互联网大厂。

国内的互联网企业虽然给我们的感觉是财力雄厚,但是在这种前沿研发的竞争中,它们的本钱比之于国外对手依然薄弱很多。这其实和当下个人创业有些类似,王思聪曾经创业投资熊猫直播和香蕉娱乐这些娱乐公司,后来基本上都血本无归,但这并不妨碍他现在依旧可以随手拍出200多万人民币来民事和解。而大部分普通的创业人并没有这么多的试错机会,一次失败可能就会把多年的积蓄都打了水漂,很难为了一个虚无缥缈的商业目标长期烧钱。

七年前当OpenAI成立的时候,国内互联网企业还处于刚刚完成起步、全力发展的阶段。阿里巴巴刚刚推出了国内第一个“双十一”购物节,而腾讯的微信支付正在和支付宝进行红包大战。后来的国内人工智能领头企业字节跳动的抖音短视频平台还没有面世。

今天在ChatGPT成功的刺激下,国内互联网大厂纷纷决定追随进入这个领域,虽然这种注重确定性、降低试错成本的跟随模仿研发战略说出来很没面子,但这恐怕也是目前最符合国内大部分企业自身条件的一种理性选择。

那么,国内科研机构和大学院系为什么也没能够做出类似的创新成果?

如果我们用论文产出作为衡量人工智能领域水平的标准,那么中国目前已经达到世界第一了。根据斯坦福大学出版的《人工智能指数报告2022》提供的信息,中国研究者目前在AI类的学术刊物和学术会议上发表论文的数量和论文的引用数量都已经达到全球第一,论文发表数量甚至比美国发表数量的两倍还多。但是,这些论文和引用到底对经济生产做出了多大贡献呢?

AI学术刊物发表论文数量排名

AI学术刊物论文引用数量排名

根据科技部发布的《2022年全国技术市场统计年报》,2021年全国高校全年输出的所有专业的全部技术合同达接近13万项,成交额为 790.4 亿元。而2021年全年国内所有的技术合同的总成交额达到37000多亿元,高校科研产出的金额只占全国所有技术合同金额的2%。人工智能作为一个学科下面的分支研究方向,其技术合同创造价值所占的比重恐怕更是微乎其微。

高校这样高学历科研人员最集中的地方,为什么科研产出比重却这么低?

一个很重要的原因就是国内高等院校和科研院所考核研究人员的核心指标就是发表文章的数量和刊物档次。据媒体报道,全国普通高校专任教师中30-44岁教师占全体教师人数的59.6%。而这些受过最优秀教育、科研能力处于黄金时期的中青年硕士、博士和博士后们,在学校“非升即走”的政策压力下,将教学之外的全部精力都用在追求“发表文章”这个目标上。

当然,利用论文发表这个指标来考核科研人员也是通行于欧美高校的一个做法,国内说起来也不过是和国外接轨,并在此基础上“卷”得更厉害一些罢了。

但是,我们今天面临着实实在在的科技“铁幕”,对于国家和社会来说,科研人员帮助企业解决几个具体的工程技术难关比在某些学术刊物上多发表几篇论文可能价值更大一些。

新华社呼吁破除“唯论文论”(资料图)

我之前曾经有一篇文章介绍过80-90年代美国半导体行业产学研合作的范例,其中的关键就是国家和企业共同出资,由高校和科研院所提供科研人员承担具体项目,由企业生产技术骨干作为评委,来共同解决国内在关键领域制造环节面临的工艺和设备难关。而如果想要撬动国内科研机构中研究潜力最大的这一批中青年研发人员,国家就必须给予相应的政策激励。

例如,提升重大产业产学研合作的研发项目的规格,赋予这些项目类似于国家自然科学基金项目的地位,这样承接和完成这些产学研合作的研发项目就可以帮助中青年教师完成学校的考核指标,有助于职称评定和晋升。这会让国内大量的科研人力资源从比拼论文的内卷中解放出来,转而投入到补齐产业链短板的实际应用科研之中去。

ChatGPT的成功面世在展示给我们无数可能的同时,也给国内提了醒。人工智能、量子计算机这些科技创新的发展似乎正在进入一个加速迭代、加速进步的时代,这有些类似于《流浪地球2》中图恒宇的女儿图丫丫通过快速迭代迅速成熟的情节。

国内的技术追赶则面临着双重难题:一方面要追赶加速前进的技术前沿,另一方面我们的现有短板和被封堵的事实则增加了中国追赶的难度。比方说进行人工智能计算所需的高性能AI芯片,国内既无法购买到国外的先进产品,也无法制造自己设计的替代产品。

在此关键时刻,提高投资效率,推动产业升级不仅仅需要保证资本投入的高效,更要解放那些处于“内卷”之中的人力资源,让宝贵的科研力量可以集中起来,解决国家急需的生产制造难题。


当他人从你分享的链接访问本页面时,每一个访问者的点击,你将获得[1金钱]的奖励,一个IP计算一次.

回复

使用道具 举报

使用 高级模式(可批量传图、插入视频等)
您需要登录后才可以回帖 登录 | 立即注册

快速回复 返回顶部 返回列表