智享荟 - 智享荟 - 上海交大上海高级金融学院
3月17日,由上海交通大学上海高级金融学院MBA与交大未来小苗基金联合举办的科学企业家活动隆重举行。来自学术界、产业界、投资界的专家大咖齐聚高金,分享新科技浪潮带给我们的挑战和机遇。

当AI技术的驱动为人类社会带来全新的可能,关心技术的发展和应用就是关心我们自己的未来。随着以GPT为代表的大模型横空出世,当下人工智能行业发展势头正劲,新技术、新产品和新应用不断涌现,对千行百业展开重构。

从芯片、模型,到应用,人工智能时代的第一批“赢家”们做了什么?AI技术将为我们带来怎样的明天?

本文整理自3月17日科学企业家活动之“GPGPU芯片+大语言模型,重构AI生态圈”。

01 AI时代的创变机遇和挑战


赵 甜
资深投资人,36氪基金创始合伙人

“以前一个业态跨界的成本很高,但今天,AI工具能让一家公司在过往的积累上快速成为新行业的玩家,这是人工智能带给他们的自救木板。”

此次人工智能技术变革对时代的影响空前,除了寻找新的投资机会之外,我们更应该思考,上一个范式的存量业态怎么在人工智能的新时代中活下来

技术革命的前提下,企业既要保持创业精神,也要保持创业的信念感。据硅谷的创业者总结,人工智能时代的关键是:Smaller, Faster, Cheaper, and Weirder(更小、更快、更便宜、更奇怪)。

过去这段时间,几乎所有公司都在精简自己的组织团队。有一家企业服务公司,高峰时一度拥有200名员工,但今天只有18人。它用了更多数字化、智能化的管理工具,砍掉了所有跟创始团队功能重叠的中层。去年下游都在萎缩时,这家组织利润达到3,000万,今年更是高达8,000万。现在它的组织结构更扁平,沟通效率更高、反应速度和成长速度更快,用更少的人做出了更大的商业价值,真正实现了更小、更快、更便宜。

很多公司变得“更奇怪”应该怎么理解?

某知名内容网站曾经用AI工具做过一家“假网店”。两位编辑利用人工智能工具,把起名、网站制作、选品、模特拍摄,主播合作等一系列工作全做了,堪比200人团队。开这家网店是突发奇想的决策,只是为了尝试可行性,直到客户真的找上门来后,他们才去做了投流、寻找供应链等后续工作。虽然他们后续并没有持续经营下去,但也证明了在AI技术的帮助下,媒体公司做电商是可行的。一家内容公司做网店是不是很“奇怪”?

有一家出海电商公司,此前的经营中沉淀了一套自用的报关表单生成工具,结合大模型的能力后,它们把这个工具做成服务,卖给了和它一样的中国同行。这家公司就这样利用电商的to C收入和赋能同行的to B收入,熬过了上一个寒冬,现在发展非常好。一家电商公司做企业服务是不是很“奇怪”?

某头部招聘网站去年开始做婚恋,业务很可靠,因为它对候选人的薪资等背调是最真实的。有一家心理学平台,沉淀了大量女性成长、家庭、育儿和婚姻的内容,现在它们把这些沉淀转化成数据,用人工智能生成剧本,杀向了短剧行业。一家心理学公司变成了文化类视频公司,是不是很“奇怪”?

以前一个业态的跨界成本很高,但今天,AI工具能让这些公司在原有数据和资源的积累上,快速成为下一个行业的玩家,这是人工智能带给他们的自救木板。人工智能拥有让企业低成本跨界的可能。

现在的一级市场融资环境下,创业公司应该先好好活着,然后去试探自己与人工智能的可能性。人工智能不应该仅仅是放在手机里的玩具,转化成更多的生产工具和生产资料才是我们希望看到的。

内容整理自赵甜的主旨分享
《AI时代的创变机遇和挑战》

02 复现or超越?Sora解析及大语言模型生态圈


齐 鹏
上海交通大学重庆人工智能研究院AI大模型中心主任、“兆言”大模型项目负责人

“大模型现在的能力就像是三四岁小孩,你可以把他培养成一个大人,也可以通过各种辅助工具,在特定场景精调一下,现在就把它用上,在这个方向上其实有很多事情可以做。”

大模型一般是指10亿参数量级的模型,一种是以ChatGPT为代表的大语言模型,另一种是以Sora为代表的扩散模型,即文生图片和视频。其中大语言模型的最终目标是实现通用人工智能(AGI),是研发投入的主力。

大语言模型的技术前沿已经获得了很多突破。第一是上下文长度限制已经越来越高。你可以给ChatGPT下20万的prompt,Gemini 1.5也已经支持1000万token的数据处理,也就是发给它整本小说,它都能一下子分析好。

第二是多模态的发展方向。把图像、视频、声音等都放一块扔给模型,现在GPT4和Gemini都能够理解并给出答案。谷歌的Gemini 1.5其实比Sora更牛,它能支持多模态的100亿token。比如你扔给它一个视频,它就能够直接扫描完整个视频,告诉你某个画面在视频里的哪一帧。

第三是智能体,也就是所谓的agent(智能助手),之前的智能助手能回答你的问题,但不能帮你真正做事,而现在的技术希望大模型能够把事也办了,这除了聊天的功能之外,大模型还需要掌握计划、记忆和行动。比如你对大模型说我想去海南旅游,它首先能够把这个任务分解成找攻略、找住宿、订机票、订租车等步骤,每一步都要分别判断和执行,10步之后的执行结果都要能记住。目前的大模型还不够稳定,不能完全做到这些事情。

在科研领域,随着CV(计算机视觉)NLP(自然语言处理)的进步,去年已经有很多算力被用来发现新材料、发现创新药的新结构,以及辅助数学家进行数学研究。在未来,每个行业都可以被AI重新做一遍。实体机器人方面,Figure 01人形机器人目前已经可以做一些诸如刷碗的工作,它目前的泛化能力还不够,但未来是一个重要的发展方向。虚拟机器人方面,以后可能人人都会有一个法律助手、一个金融助手,智能体能够基于多模态的视频音频进行互动,可穿戴智能硬件也是一个方向。

目前的大模型商业化落地还没有很多,主要是它还存在一些缺陷。

第一是幻觉问题,它还是会一本正经地胡说八道。你可以用RAG(检索增强生成)的方法让它提高准确度,但国内外都有合规要求,因此大家都很谨慎。第二是发挥不稳定,比如做一件事需要10步,如果每一步都是90%的正确率,最后这件事就可能完不成,所以它还需要不断提高,提高到99%的正确率。第三是成本高,现在一台英伟达A800整机大概是180万,如果要开发一个供1万人同时使用的app,就需要每年几亿的资金规模才能保持运转。

大模型做应用落地有两个思路,也就是大家看到的杨植麟思路和朱啸虎思路。大模型现在的能力就是三四岁小孩,一种是你可以把他培养成一个大人,走成年人路线,这需要投入非常大;另一种就是说三四岁小孩已经比以前好非常多了,你可以通过各种辅助工具,在特定场景来精调一下,现在就把它用上。

去年我们在重庆发布了“兆言”大模型,专注于降低成本、模型小型化,还有商业落地这些事情。用以前的方法做项目,派一个机器学习工程师可能要花20万的资金、两个月时间来积累数据、训练模型,现在在大模型的帮助下,换个提示词就可以了,资金投入就可以从20万变成2000元,开发周期从两个月变成两天,极大地降低了成本。

内容整理自齐鹏的主旨分享
《复现or超越?Sora解析及大语言模型生态圈》

03 探索国产自主云端GPGPU的发展机遇


梁晓峣
上海交通大学计算机科学与工程系教授、开源GPGPU平台“青花瓷”的发起者

“英伟达最大的护城河不是硬件,而是软件。我们这个市场需要的不是一个好的芯片,而是好用的芯片。”

我们现在所处的AI时代,对GPU这样的算力芯片的需求无比巨大,而英伟达的GPU因为技术优势世界领先,让它成为了AI时代的无冕之王。

但在我看来,英伟达最大的护城河不是硬件,而是软件。我们这个市场需要的不是一个好的芯片,而是好用的芯片。很多国产芯片在某些领域的硬件数据比英伟达还要高,为什么到市场上落地就不太理想,因为缺乏软件生态。英伟达耕作了快20年的时间,打造了一个非常强的软件的生态,才有了它今天的辉煌

英伟达的GPU最早是为游戏准备的,内在算力难以发挥到别的地方,但当时美国伊利诺伊大学香槟分校(UIUC)的大咖胡文美教授等科学家看到了GPU的潜力,便和英伟达的首席科学家David Kirk和一批工程师一起,推动了更多的应用场景。是学术界帮助英伟达打造了一个的生态,才有了它后面的发展。

2006年底,英伟达推出了CUDA编程模型和API接口,也就是今天大名鼎鼎的CUDA生态圈。随着CUDA生态圈越来越强,并且它最早开放了生态里的计算资源,踏上了AI的东风后,英伟达就开始一路向上,成为了人工智能芯片的主流选择。

另外值得一提的是,2008年金融危机后,英伟达的股价掉到了历史低点,在困难的时候,黄仁勋仍然力排众议,养着1500多名员工研发CUDA系统,挺过了最艰难的三年后,AI技术出现拐点,英伟达也迎来了爆发期。

国内的问题是什么?AI芯片初创公司已经这么多了,但缺乏人才为它们开发软件,也就无法形成一个真正的软件生态。对此我倡导的是,从学术圈开始用开源的方式解决这个问题。

传统的CPU有三极,除了以英特尔为代表的x86和以ARM为代表的ARM系统之外,还有一极是RISC-V的开源指令集架构。RISC-V起源于加州大学伯克利分校,它们定义了一套CPU的指令并开源,免费给社区使用。历经10年左右发展,RISC-V的开源模式在CPU这样一个封闭的生态里面,作为外来者闯出了一条道路,分走了市场上的一块蛋糕。那么在GPU这个领域,有没有可能也仿造RISC-V模式,推出个开源的GPGPU的生态?这就是我们在做的事情。

我们两年前推出了一个开源的GPGPU的生态和平台,叫做“青花瓷”,通过开源的方式来做英伟达GPU能做的事情,并且具有一定的先进性和生态兼容度。我们的发起方是高校,是一个公益性的事业。希望通过10年左右的积累,做成GPU领域的RISC-V,做一些对人类社会有影响力的工作。

内容整理自梁晓峣教授的主旨分享
《探索国产自主云端GPGPU的发展机遇》

科学企业家系列

是交大高金2024全新推出的品牌活动,每期活动邀请上海交大企业家教授,学术专家和投融资届资深人士,就科技和商业资本相结合的前沿问题展开研讨,并邀请相关领域专业机构和垂直行业社群参与。