周边城市设为首页收藏本站 关注微博 关注微信

舟山信息网

国内大厂集体“屏蔽”Sora-为虎作伥的中国高科技不堪一击

2024-7-25 00:22:56 161 1

[复制链接]
代码狂客 发表于 2024-7-25 00:22:36 |阅读模式

代码狂客 楼主

2024-7-25 00:22:36

15.jpeg

在AI的长河里,从不缺一鸣惊人、一夜成名的技术。上图,便是从Sora的示范视频上截取的,无论是略显蓬松的猫毛,还是主人被吵醒紧蹙的眉毛,与真实世界里的画面,别无两样。

半个月前,Open AI发布了首个文生视频模型Sora,再次让AI界沸腾——其是第一个能够根据人类指令生成长达一分钟视频的模型,上一个讨论度这么高的产品,还是ChatGPT。

从ChatGPT到Sora,这16个月里,AI界的战火已从千模大战的战场上,蔓延到各个细分应用之中。

对于普通人来说,就是原先你可以问诸如文心一言、讯飞星火等通用大模型各种问题,生成各种文字、图片答案,现在可以通过文字描述,生成还原度极高的视频。以下便是OpenAI的示范视频,提示词是一架无人机在阿马尔菲海岸的岩石露头上环绕着一座美丽而历史悠久的教堂······

更令人惊讶的是,以往的视频模型是多个真实图片的组合,并不具备理解力,而Sora是“听懂”人话后,进行视频的建构。

我们能看到,在OpenAI Sora 官方介绍页里,纸飞机有了自我意识,自由翱翔。这或许就是 OpenAI 终极的目标,也将是无数AI大厂的愿景。

现下,Sora已然敲响战鼓,百度、字节等以AI为标签的大厂们是否会紧跟脚步,以及能不能造出类似模型,是摆在李彦宏、张一鸣们面前的问题。但目前大厂们都在静默之中,等待着属于自己的质变。

当然,一旦造出来,类Sora模型变现路径倒是要比ChatGPT“现实”不少。

其可以是抖音、好看视频等视频平台的高效创作工具,也可以制作简单的特效,给近日爆火的微短剧提供更多题材。更进一步的猜测是,影视作品中大部分特效成本、人力成本都可以省去。

不过,对于国内以大模型创业的企业来说,又增加了一道坎——还没把ChatGPT消化掉,又来了个新课题。跟,没有更多的精力,不跟,没有热度有可能凉得更快。

Sora到底牛在哪里?

一系列文章、视频展现效果显示,Sora的出世意味着细分应用文生视频模型迎来了iPhone时刻。

事实上,文生视频并不是新鲜事儿,去年年底,全球AI企业陆陆续续发布了自己的文生视频模型。去年11月份,Meta发布了视频生成模型 Emu Video。从官方示例中可以看出,其局限于较为简单的动作。

紧接着,Stability.ai也发布了开源视频生成模型 Stable Video Diffusion (SVD),并且也在官方论文中大方承认自己的不足——生成的视频相对缺少动态性。

也就是说,生成有高度一致性且有丰富动态性的视频,让视频内容真正地动起来,是去年年底视频生成领域中的最大挑战。

在Sora发布以前表现最好的,莫过于PixelDance。从展示的结果来看,在基础模式下(用户只需要提供一张指导图片+文本描述),人物动作、脸部表情、相机视角控制、特效动作,Pixeldance都可以很好地完成。

国内大厂也同样是去年年底开始布局。

字节跳动于去年11月18日推出了文生视频模型PixelDance,可生成有高度一致性且有丰富动态性的视频。阿里紧随其后也上线了Animate Anyone模型,一张人物照片,再配合骨骼动画引导,就能生成动画视频。

23年末,百度发布了文生视频工具“度加剪辑”,据称可以一键获取最新热点、ai生成文案、一键生成视频。同时一大批“应ChatGPT而生”的AI创业公司也在去年年底参与进来,共同探索AI大模型应用。

而时间来到2024年2月中旬,OpenAI的Sora还是凭借更逼真、流畅的效果,遥遥领先。

为何 Sora 可以一骑绝尘?红衣大叔周鸿祎给出了答案,大概的意思是,在这之前我们做视频、做图用的都是Diffusion,我们可以把视频看成是多个真实图片的组合,它并没有真正掌握这个世界的知识。

但 Sora能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克的情况。OpenAl 利用它的大语言模型优势,把 LLM 和 Diffusion 结合起来训练,让 Sora 实现了对现实世界的理解和对世界的模拟两层能力。

自Transformer架构引领通用大模型浪潮后,LLM+Diffusion这一新兴研究框架或许又会有大批量的追随者。

开源后跟不跟,不开源搞不搞,成为每个AI厂商面前的难题。

谁都能玩得起吗?

事实上,要不要跟随Sora这个问题,或许并不再取决于个人/公司意愿,而是一些硬性条件+软实力。例如,公司还有足够的芯片吗?

去年,据偲睿洞察测算,ChatGPT光是访问阶段就要耗去3万多个A100,这俨然已是巨头们的游戏。按照去年一份流传出的交流纪要显示,大厂们手握着丰厚的资源——阿里云AI专家提到,阿里云在云上有上万片的A100,整体能够达到10万片,集团体量应该是阿里云的5倍。腾讯云利用H800加速卡打造的大模型算力集群,集群规模达到了数千台服务器。

尽管Sora只是一个视频模型,但对算力的渴求也不小。目前,训练端由于暂无明确算法架构和训练详细数据。据民生证券测算,一个月内训练完Youtube全部新增视频需要约231片A100。考虑到模型都是经过多次训练得到,算力需求仍有较大程度提高的可能性。而推理端的需求量更是惊人,假设Sora模型参数为30亿,则对应1846万个A100需求。

紧接着,第二个致命的问题是,公司有高质量的数据集吗?现阶段,谷歌、OpenAI等国际大厂们,都在争抢高质量的文本数据集。

根据第一批大模型弄潮儿的经验,若是没有备足充足的弹药,很有可能会草草离场。

据智东西不完全统计,2023年11月-2024年1月,有4家AI大模型创企宣布关停。在这之中,其中有大厂独立出来的团队,有明星产品创始人新成立的公司,也有已经走过十余年的“老牌”企业。有的缺钱、有的缺精准定位,想要玩AI,空有一腔热血远远不够。

回复

使用道具 举报

全部回复1

代码狂客 发表于 2024-7-25 00:22:56

代码狂客 沙发

2024-7-25 00:22:56

事实上,更致命的问题是,公司有AI天才吗?
周鸿祎表示,科技竞争最终比拼的是人才密度和深厚积累。这里的人才密度,绝不是说规模——毕竟OpenAI的Sora团队只有13个人,应届博士带队,00后参与。
我们不得不佩服OpenAI的勇气,将“选贤举能”发挥得淋漓尽致,除了未知的潜能,年轻人还有一个最大的优势——能熬。据谢赛宁透露,Sora是Bill他们在OpenAI的呕心沥血之作,“虽然不知道细节,但他们每天基本不睡觉高强度工作了一年”。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F0306%2F01b0951ej00s9x7s00027d0012w00jyg.jpg

从以上部分团队成员背景可以看出,其门槛极高——大部分都是名校博士毕业+实习/工作经验,有本科学生,不过也要有着创业经历、多段工作经历。无论是OpenAI公司,还是人才本人,都积累了无数个量变,为质变做准备。
或许,包括OpenAI在内的AI公司们,都在等哪个“无名小卒”(要么是MIT、清北级别的学生,要么3-5年创业、大厂经历,要么是二者的结合)悟得了AI的真理,一战成名,成为AI大神。
ChatGPT和Sora告诉我们的是,A100、高质量数据、AI天才,是新时代的稀缺物资,国内大厂尚有欠缺,从零开始的大模型创业公司们怕是跟不上热度,也跟不上速度。
微短剧,或许是现下大厂高性价比变现方式
在AI各类资源都很有限的情况下,All in AI的大厂们在跟随之前,必然会考虑投资回报比,也就是Sora能够极大地改变哪些行业的模式?同时还和大厂已有业务密切相关?
答案,非短视频行业莫属。
对于定位于热点话题视频的创作者们,Sora可谓是极大地提高了工作效率。毕竟热点话题比拼的是时效,大家很难有二创的空间,只要学会了,便能快速拉开差距。目前在国内,已经有电商服务机构向带货主播推出“AI根据热梗自动撰写视频脚本”的服务。
而对于一些深度话题,创作者们则可以与AI分工合作。
创作者产出事件/产品的差异化内容、确认文章大纲;而AI负责重复劳动的部分,例如展现产品的特性,给文字自动加背景视频,无需创作者去各大网站搜罗。也就是说,创作者们能够靠着AI省去不少事,出现更多的“灵光一现”,吸引更多的用户停留。
在这之中,最大的受益人便是平台。于是,我们也就不难理解为何2月7日,抖音集团CEO张楠辞去集团CEO一职,把精力聚焦在剪映的发展上。据了解过去一年,张楠已经把绝大多数精力倾斜到剪映相关业务上,并亲自带队在AI辅助创作上寻求突破,即将推出一个AI生图和视频的产品。
视频平台快手必然会在这个方向努力:在去年的那一波卷大模型的浪潮中,快手宣布已组建大模型研发团队,推进在搜索、AIGC 辅助生成图文视频方面的应用。
百度,也正在跟上节奏。尽管好看视频在百度的存在感并不高,但每年都在实打实地推进该业务: 2020年下半年开始,百度开始一系列大手笔运作。 百度先后投资MCN机构牧云文化、引入宋健(内容生态平台总经理,年前已离职),以及在11月17日宣布斥资36亿美元并购YY中国。
2024年微短剧爆火,百度也在不断加码该市场。据光子星球报道,百度将在上半年完成与微短剧适配的基础设施建设,包括创作者生态、分发逻辑、用户运营等,并尝试跑通变现路径。
微短剧,或许是百度等类Sora视频模型的“用武之地”。
相比于大型的影视大作,微短剧的特效制作、内容创作各方面门槛都较低,与此同时,类Sora模型能给近日爆火的微短剧提供更多题材范围,例如科幻等。若是人物细节逼真,演员的片酬都可能为零,如果分摊成本极低的话,视频内容行业将很快被洗牌。
百度们亟需推出中国Sora,除了因为新业务的需要,还需考虑到站位的问题。作为上一个千模大战的发起者,百度再次迎来证明自己的时刻。
2024年的春天,来得很晚,无论是真实的天气,还是AI行业。
去年冬天,研究部门能拿着以往AI积累,赶上大模型的浪潮,市场部门也能借此开大会、与友商们一起打响千模大战。
今年冬天,研究员们还在加班加点想着怎么把通用大模型落实到千行万业时,文生视频这一细分领域又出现一个劲敌。
永远在黑暗中前行,永远有人走得更快,国内AI大厂们的黎明,忽近忽远。
不过,离黎明更近的Sora,也需加强常识学习——在完整 看完头图的原视频之后发现,女孩的胳膊与手并不在同一个维度。

回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则

:
:
gfhgfh@163.com
:
未填写
:
未填写
:
未填写

主题46

帖子80

积分262

图文推荐

  • 芮成钢:曾直捅“裆中央”的青年才俊抵美油

    芮成钢,男,汉族。安徽合肥人,1977年9月24日生

  • 希特勒给德国带来了什么好处?

    1‌‌、经济复苏‌:希特勒通过一系列经济政策,

  • 广场舞分贝超多多少违法?超过60分贝即算扰

    广场舞的分贝超过60分贝即算扰民,且可能违法。‌

  • 抹茶绿用在家装中的搭配,效果简直不要更赞

    抹茶绿,一种深邃而微妙的黄绿色调,是大自然四季

  • 抹茶是什么茶?为什么叫抹茶?是用啥做的?

    抹茶是什么茶?为什么叫抹茶?是用啥做的?吃了多

  • 人类历史为什么总是野蛮征服文明?因为演化

    美国历史学家伊恩·莫里斯,在他的著作《西方将主

  • 中国为何打压基督教,优待佛教,冷落道教

    虽然我国民众普遍不信教,但是在我国的历史上,佛

  • 这个世界上最惨无人性的制度就是分面包的人

    视频中演讲者的原话是,这个世界上最惨无人性的制

  • 十年寒窗换张废纸文凭中国特色读书骗局野鸡

    十年寒窗换张废纸文凭中国特色读书骗局野鸡大学拖

  • 口腔种植费用纳入职工医保!“家庭共济”范

    据舟山市医保局消息,今年10月10日起,我市职工基

  • 以军声称:哈马斯领导人已被击毙

    以色列国防军声称,其在一次行动中击毙了三名哈

  • 制度是经济增长的根本原因,真的是一针见血

    当世界和平的时候,经济增长成为各个国家最主要的

  • 在中国创建政党合法吗

    在中国创建政党是合法的,但需要符合一定的条件和

  • “无人机侵入事件”激化朝鲜半岛局势:准备

    【环球时报驻韩国特派记者 莽九晨 王逸】韩国联合

  • 中国历代词作名篇138首,值得你一读再读

    唐· 温庭筠 《更漏子》玉炉香,红蜡泪。偏照画

  • 谎称拥有图片版权敲诈勒索商家,一张图片要

    图片版权费得来容易屡试不爽?小心坐牢!记者17日

  • 有种“遗憾”叫郑中基不再唱歌了,只有听过

    有种“遗憾”叫郑中基不再唱歌了,只有听过他唱歌

  • 新的充电电池是先充电还是先使用

    新的充电电池在首次使用时,建议先充电再使用。‌

  • “远上寒山石径斜”,“斜”读xíe(音邪)

    前言: 文学是一种表达情感、抒发思想、展现艺术

  • 警惕听话水!无色无味,几滴让人失忆!谋财

    警惕听话水!无色无味,几滴让人失忆!谋财害命

  • 台湾纪念双十为何大陆没反应?辛亥革命不是

    辛亥百年,台湾在纪念什么? 2011年10月10日,辛

  • “永久基本农田”和“一般耕地”到底有什么

    在农村的广袤土地上,“永久基本农田”和“一般耕

  • 十方的具体方位,十方的佛教背景和意义

    ‌‌十方是指东、西、南、北、东南、西南、东北、

  • 好莱坞电影现在越来越不受待见

    曾几何时,“好莱坞”这三个字,在国内就是好电影

  • pad电用到多少充电从而有助于维持电池寿命

    ‌iPad的电量使用到20%-80%之间充电有助于维持电

  • 重读《阿Q正传》:“奴隶”、“奴才”与“

    “奴隶”与“奴才”是鲁迅文章中常常出现的两个关

  • 奴隶与奴才有区别吗?这里告诉你

    对于奴隶和奴才,只有一字之差,看上去也算是同义

  • 歌手狼戈:离婚后酗酒差点丢命,拒绝1500万

    歌手狼戈,这个名字你可能已经听得耳朵起茧了。他

  • 房间灰尘太多怎么解决?开窗通风、定期打扫

    随着人们生活水平的提高,越来越多的家庭拥有了高

  • 网传湖南邵阳国庆升旗礼发生枪击 公安局长

    联合早报 湖南省邵阳市公安局大院星期二(10月1日

  • 长征“穿越”短剧火爆 左派网民批是历史虚

    首部关于长征的奇幻主旋律短剧《我在长征路上开

  • 经济就业牵动中国国庆消费 电影文旅冰火两

    今年“十一”长假,中国假日消费呈现分化趋势。图

  • 腹部肥胖怎么消除最快?除了这5种没有更好

    通常情况下,没有消除腹部肥胖最快的方法。但一些

  • 查特绿香甜酒 绿荨麻酒 Chartreuse Liqueur

    查特绿香甜酒 绿荨麻酒 Chartreuse Liqueur法国

  • 为什么还有人用CD机听音乐?

    时至2022年,我仍坚持使用CD来享受音乐,耳机选择

  • 21世纪最伟大百佳电影排名第三!谈及人性,

    21世纪最伟大的一百部电影。第一是《穆赫兰道》,

  • 14岁少女的坚定信念,指引她一路前行-简评

    今天把电影《大地惊雷》看完了,感觉挺不错,虽然

  • 《大地惊雷》:一个时代的落寞,下个时代的

    一部标准的西部牛仔片,弱肉强食的社会和扣人心弦

  • 坚韧不拔的小姑娘的勇气令人敬佩,她无视冷

    勇气、决定和执行力在面对任何事情的时候都彰显一

  • va面板和ips面板哪个好

    VA(Vertical Alignment)面板和IPS(In-Plane Sw

  • 不宣而战!以色列偷摸轰炸俄罗斯空军基地

    10 月 2 号晚上,以色列空军不宣而战,偷偷摸摸去

  • 以色列轰炸叙利亚俄罗斯空军基地,当机立断

    10月3日,以军继续在黎巴嫩展开行动,过去一天

  • 平板怎么投屏到电视上 怎么样把手机投屏到

    平板怎么投屏到电视 想要平板投屏到电视,可以在

  • pad怎么投屏到安卓显示器

    ‌要将iPad投屏到安卓显示器,可以使用AirDroid C

  • 伊朗对以色列发射约200枚导弹,打击以军事

    封面新闻记者 张奕丹 综合报道 当地时间10月1日晚

  • 斯坦福大学博士已入职安徽灵璧乡镇公务员岗

    今年6月,一份2024年乡镇公务员政审考察名单在网

  • 黎巴嫩真主党领导人纳斯鲁拉被杀,中东多方

    以色列军方28日宣布黎巴嫩真主党领导人纳斯鲁拉在

  • 1977年来首次,美国港口工人将举行大罢工

    评:中国工人饿死了也不会有人组织罢工,代表工人

  • 比掌权更重要的是你的人民!-民为贵,社稷次

    原标题:拜登联大告别演讲,为这事"赞赏"中国 原

  • 南通低保户54岁单身汉因被取消低保资格怒杀

    江苏南通启东市女驻村干部沈某遭54岁单身老汉赵某