科技快讯

多模态大模型是必经之路 通用人工智能进程加快

2024年02月23日 | 查看: 80723

  新华网北京2月23日电(记者凌纪伟 郑伟)近期,OpenAI发布视频生成模型Sora,引发人们对文生视频AI大模型的关注。

  Sora在视频生成方面的进展进一步打开了AI应用想象空间。AI视频是被看好的AI应用落地的重要场景之一,文生视频并不是一个新概念,国内市场早已存在不少公开的AI视频模型。有券商预测,国内大模型厂商将加快步伐,加大对文成视频大模型的投入力度。

  “因为路径比较清晰了,国内乃至全世界跟进都很正常。”天工智能联席CEO兼昆仑万维2050全球研究院院长颜水成表示,“原来预测年底才会有长视频生成,现在提前了10个月。多模态是终局,有可能视频生成会融合在多模态统一大模型里面。”

  据了解,Sora的核心技术是DiT的扩散变压器模型,OpenAI把这一技术用到了视频生成的扩散模型。“Sora的发布再一次证明了变压器(Transformer)技术作为一项人工智能的基础技术,在多模态大模型包括视频技术中也同样重要。”上海人工智能专家委员会委员、达闼机器人公司创始人兼CEO黄晓庆说。

  IDC中国研究总监卢言霞认为,要全面打开生成式AI的想象力,就要依托多模态大模型,国内很多公司早就已经在投入多模态大模型的研发,这是AI的必经之路。今天,Sora让文生视频迈出新的一步,将刺激其他科技巨头加快在该领域的技术攻关力度以及产品发布速度。

  在许多业内人士看来,Sora大幅缩短了通用人工智能(AGI)的实现时间,但文生视频本身只是AGI发展道路上的一小步。

  “中国人工智能产业的专家们,应该非常振奋,我们和国外的差距其实并没有那么大,我们能很快赶上。”黄晓庆说,Sora给产业界带来一个重要启示,那就是人工智能AGI时代已经来临,我们都要拥抱这个时代,它的应用场景非常丰富,我们可以发挥无穷无尽的想象力。

  商汤科技智能产业研究院院长田丰认为,国外依靠Scalling Law缩放定律不断投入AI算力、海量数据来取得更好的模型效果的方式并不完全适用于中国AI科研。在按照“摩尔定律”加速推进国产芯片的基础上,我们需要摸索出适合自己的AGI科技创新路径,比如开发更具性价比的AI芯片、更节能的智能计算中心、AI模型加速技术,加快多模态模型架构创新和数据合成、多媒体数据标注技术创新,在百科知识基础上,大幅强化逻辑推理、基础科研、工农业垂类模型,通过产业价值反哺AI发展。

  颜水成认为,中文数据是中国发展人工智能的重要优势。未来国内要加快AI人才和算力资源的集中度,这样才能更有利于AGI的创新。

【纠错】 【责任编辑:周靖杰】
    阅读下一篇:
      深度观察
      • 新华全媒头条丨科技创新助力安徽加快高质量发展
      • 权威访谈丨深学笃行“厦门实践” 为美丽中国开新局 
      • 经济参考报丨城市房地产融资协调机制落地观察
      • 新华每日电讯丨迟到40年的团圆
      • 新华全媒+丨数字技术“复活”约五千年前南佐聚落遗址 
      • 追光丨谱写青春之歌 “小雪团儿”闪耀“十四冬”
      • 节令之美丨元宵和汤圆,你分得清吗?
      • 这座“小渔村”变身双创热土
      • 古建有言 礼义传家

              推荐阅读:

              人保车险|第三者责任险中“第三者”如何认定?

              人保服务|买一份驾意险,多一条生命带!

              人保服务|电动车保险都保什么?有必要买吗?

              人保车险|应急车道到底应哪些“急”

              长安UNI系列中文定名“引力” 首款车型日内瓦车展发布

              全链条推进快递包装绿色化

              研究报告:发挥好数字经济企业在科技创新中的引领作用

              成立40周年 长虹美菱坚守品牌创新发展之路

              华为携全场景新品参展2023数字科技生态大会

              星闪技术:让万物互联又快又稳

              关键词: