当前位置:首页 > 我爱学习 > 正文内容

李彦宏坚称不做视频生成模型,中国版Sora到底值不值得做?

  近日,百度CEO李彦宏称“百度不做Sora”的演讲被媒体曝光后,有关“中国版Sora到底值不值得做”的话题又在微博、小红书等社交媒体引发众多争论。

  李彦宏在内部讲话中称,Sora这种视频生成模型的投入周期太长,10年、20年都可能拿不到业务收益,无论多火爆,百度都不去做。

  反对的声音认为,这属于百度自身业务的问题。国内目前在视频生成模型上最有希望的公司是快手和字节跳动,二者的业务离视频更近,待其视频生成足够优秀之后会快速完成拉新,并带动用户体验提升。

  快手和字节跳动是国内互联网大厂中积极布局视频生成大模型的公司。Sora发布后,快手便推出文生视频大模型“可灵”,其背后的技术原理和OpenAI的Sora类似,都是把常用于视频生成人工智能的扩散模型与Transformer架构相结合,依托于快手短视频平台,拥有大量可用于训练的视频数据。“可灵”发布几个月之后,字节跳动旗下火山引擎发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。

  除字节跳动和快手之外,今年发布视频生成模型的公司还包括阿里云、Minimax、生数科技、智谱AI等公司。

李彦宏坚称不做视频生成模型,中国版Sora到底值不值得做?

  国内视频生成模型领域虽然看起来火热,但确实面临着非常严峻的挑战,李彦宏对视频生成做出的判断并非无稽之谈。

  界面新闻从一位负责视频生成模型的技术人士处了解到,生成式AI技术正大幅降低视频生成的门槛,导致视频数据以20倍左右的速度增长,对计算成本和效率提出了严峻的挑战。以Sora模型为例,其训练和推理所需的算力需求分别达到了GPT-4的4.5倍和近400倍。

  中国银河证券研究院的报告也显示,Sora对算力需求呈指数级增长。其根据Sora参数规模推演出的训练单次算力需求或可达到2.6×10^24Flops,相当于GPT-3175B的8.2倍。目前Sora还在初级阶段,伴随不断迭代调优,其训练数据集规模将进一步增大,未来算力需求也会大幅增加。

  上述技术人士还表示,在编解码层和框架层,视频生成模型也面临着诸多挑战。一方面是效率的问题,另一方面是在计算需求日益增长的情况下,能否灵活处理越来越复杂的需求。

  这些都对视频生成模型形成巨大考验,但其在商业化上的形势仍然不够明朗,一定程度上使训练和推理成本上的挑战更为严峻。

  据界面新闻了解,目前视频生成模型的落地大多在影视制作、电商营销等领域,处于概念多于实质的阶段。

  快手曾高调推出由可灵深度参与制作的奇幻微短剧《山海奇镜之劈波斩浪》,并于近日联合李少红、贾樟柯等9位知名导演,启动了完全依托视频生成大模型制作电影短片“可灵AI”导演共创计划,试图以此来证明视频生成大模型在影视制作领域的可用性。

  但《山海奇镜之劈波斩浪》整部影片并不是由AI一气呵成,而是使用可灵大模型的文生图和图生视频功能生成了很多时长5秒的分镜头,再由后期剪辑团队剪辑而成。其在成本上整体的降幅不超过四分之一,远不如外界预期的那么大。

  从快手近期的一系列动作来看,其仍然在为可灵AI的落地寻找更多应用场景。比如,快手试图通过资源和流量扶植的方式,让品牌方、制作机构、媒体等需求方能够与AIGC创作者进行商务合作,以支持使用可灵AI的创作者获得变现机会。这在一定程度上反映了AIGC的变现并不像想象中的那么容易。

  在这些挑战之下,视频生成模型领域的一个发展趋势是降本。虽然很多公司依然在积极投入视频生成模型,但尽可能降低训练和推理成本,已经是很多公司都在探索的方向。

  在预处理过程统一视频的数据格式、提高数据质量、实现数据标准化、减少数据量以及处理标注信息,则是其他一些公司降本的重点。抖音一位视频架构技术负责人表示,超大规模视频训练数据集导致计算和处理成本激增、视频样本数据参差不齐,以及处理链路环节多、工程复杂等,都让视频生成模型训练和推理成本增加。同时,对GPU、CPU、ARM等多种异构算力资源的调度部署也是挑战之一。

  据界面新闻了解,豆包视频生成模型自研了多媒体处理框架BMF来应对模型训练的算力成本挑战,该方案可使用大量潮汐资源,为模型训练提供支撑。

  除此之外,通过自研芯片在同等视频压缩效率下实现视频大模型训练和推理成本降低,是部分互联网大厂选择的方向。而一些AIGC公司则在探索将低质量视频与高质量图像相结合,在保障视频输出画质的基础上降低训练模型成本的方法。当成本真的降下来,视频生成模型的未来之路也会更加明晰。

扫描二维码推送至手机访问。

版权声明:本文由上海忠信云帆体育资讯网发布,如需转载请注明出处。

本文链接:http://whlrf.cn/news/post/35395.html

分享给朋友:

“李彦宏坚称不做视频生成模型,中国版Sora到底值不值得做?” 的相关文章

科特估爆了!顶级游资呼家楼精准切入新方向,两只“新宠”要火了?|界面新闻

科特估爆了!顶级游资呼家楼精准切入新方向,两只“新宠”要火了?|界面新闻

界面新闻记者 | 龙力 6月11日,以半导体为代表的科特估方向大爆,当日通达信EDA概念(880637)、存储芯片(880672)、光刻机(880716)等相关的板块指数均大涨超过了5%。 盘后披露的龙虎榜数据来看,这一次顶级游资呼家楼也精准地切换到了爆火的科特估新方向,其常用席位中信...

泰国汽车销量连续11个月下滑,电动汽车市场份额逆势提升|界面新闻 · 汽车

泰国汽车销量连续11个月下滑,电动汽车市场份额逆势提升|界面新闻 · 汽车

界面新闻记者 | 杨诗涵 因拥有高技能劳动力和丰富的国际汽车市场经验,泰国长期被公认为“亚洲底特律”。近年随着电动转型潮流席卷,作为东南亚第二大汽车消费市场的泰国,成为中国汽车公司抢滩登陆的首选目的地。但现在,泰国汽车市场连续11个月销量下滑,汽车生产制造也大幅萎缩。 据当地媒体报道,...

菲律宾海岸警卫队称救助一名中国籍船员并送医治疗,我领馆为其积极提供领事协助|界面新闻 · 快讯

菲律宾海岸警卫队称救助一名中国籍船员并送医治疗,我领馆为其积极提供领事协助|界面新闻 · 快讯

据中国驻达沃总领事馆网站,6月14日,菲律宾海岸警卫队发布消息称,其在棉兰老岛三宝颜市附近海域救助一名中国籍船员,并送至当地医院进行治疗。中国驻菲律宾使馆及驻达沃总领馆获悉这一信息后高度重视,第一时间通过菲政府部门和当地侨社进行确认,与获救船员、船公司及医院方面取得联系,了解有关情况,并委托当地领...

创世纪:公司目前暂未涉及EUHT设备

创世纪:公司目前暂未涉及EUHT设备

快讯摘要 创世纪:公司目前暂未涉及EUHT设备 每经AI快讯,有投资者在投资者互动平台提问:公司是否生产EUHT设备用于车路云一体化的双智专网建设,是否与新岸线公司有合作创世纪(300083.SZ)6月15日在投...

泰国旅游:前五月超 1500 万外国游客,全年目标 3.5 万亿泰铢

【泰国旅游与体育部部长介绍新政策】据泰国媒体报道,15 日,泰国旅游与体育部部长森萨在曼谷介绍了该部新推出的“安全出行,四季旅游,带动旅游业发展”政策。森萨透露,今年 1 月至 5 月,已有超 1500 万人次外国游客访问泰国,旅游总收入超 1.1 万亿泰铢。接下来,泰国需再吸引 2170 万人次外...

凌凯科技赴港IPO:华神科技、富祥药业参股,2023年刚刚扭亏|界面新闻 · 证券

凌凯科技赴港IPO:华神科技、富祥药业参股,2023年刚刚扭亏|界面新闻 · 证券

记者|赵阳戈 日前,港交所披露了凌凯科技第一次呈交的申请材料。据悉,凌凯科技从事化学合成一体化解决方案,刚于2023年实现扭亏为盈,其2023年收入能在中国排名第五。同时该公司的股东名单中有A股已上市公司身影,也存在客户与供应商有重叠的情形,均为市场所关注。 来源:港交所...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。