顶部通栏.png

关闭
搜索
|

365.png

2024“文生视频”创新企业TOP50
来源: Internet Deep ·  编辑: 李小孟 ·  2024-04-18

2024“文生视频”创新企业TOP50

深水炸弹”Sora

继ChatGPT后,OpenAI又在人工智能领域扔下一颗深水炸弹,引爆海内外AI圈。
2月16日,OpenAI发布“文生视频”模型Sora。Sora 官网发布的几十个视频 Demo 中,有在东京街头散步的女人、在咖啡杯里航行的海盗船、在雪原上走过的猛犸、无人机视角拍摄的海浪拍打峭壁、华丽的纸艺海底世界、维多利亚冠鸽的微距特写,其视频主体和环境的一致性令人震撼。
Sora可以根据所输入的prompt,直接输出最高长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。
Sora出现以前,主流的AI视频生成软件如Pika、Runway等生成的视频时长普遍被限制在5秒内,在特定情况下,应用户要求,能够扩展到16秒,这已是2024年以前AI生成视频领域公认的最长时间纪录。而Sora则突破常规,其独特的能力允许它生成长达一分钟的视频,这一时长无疑将其置于行业绝对的领先地位。
虽然Sora在文本生成视频的领域取得了显著的进展,但它也只是文生视频革命的初步尝试。
赋能
Sora的推出让我们见证了一个技术奇迹,这个能够快速且优质地将文字描述转化为视频的AI工具,不仅代表着AI技术的一次巨大飞跃,也预示着我们熟悉的许多行业即将面临一场新的革命。
在短视频内容消费领域,随着Sora的出现,用户能够迅速制作出各种类型的视频内容,未来稀缺的不再是视频拍摄或者剪辑的能力,而是独特的创意。影视和游戏等行业是文生视频落地的重要场景,文生视频用文字就可以编辑和生成想要的故事情节,实现创意辅助和降本增效。而凭借为内容生成赋能这一独特优势,文生视频的前景也是毋庸置疑。
但是Sora在视频生成方面还较明显地有着各类Bug,这也是OpenAI迟缓推出Sora的重要原因之一。在OpenAI的官网介绍中,OpenAI表示Sora可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系,还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
在其他行业,如算力,受益于Sora驱动的AI视频生成技术对强大计算能力的持续渴求,市场需求将迎来显著增长;又如安全行业,普遍认为在AI视频生成广泛应用后,安全领域的革新将会是最受惠的方向之一,可预见的是,随着技术的发展和普及,市场上将涌现一大批专注于视频真伪鉴别技术研发与服务的新兴企业。
超越
以抖音为例,抖音在短视频和社交媒体方面的海量数据资源,会使其在文生视频模型的研发上占据独特优势。MagicVideo-V2的发布及其效果上的显著提升,已经证明了字节跳动在该领域的技术实力与创新能力。
同时,火山引擎大模型服务平台“火山方舟”的推出,以及与多家合作伙伴共建的生态体系不断完善,抖音不仅能够利用自身的庞大用户基础产生的实时、多样的数据流进行训练优化,还有望通过高效的模型迭代和协同创新,在未来开发出能与Sora匹敌甚至超越的新一代文生视频模型。
但这样的优势能否快速补充其他的发展短板,摘下国内首个正式开放文生视频桂冠,仍需要时间来证明。
有个问题需要注意的是,ChatGPT成功运行最少需要一万张英伟达GPU提供算力,迭代到GPT-4后,其所需的英伟达GPU数量被爆超过了2万张,价值达数亿美元。而面对这种投入产出比,国内大模型厂商担忧的不是能不能做出Sora,而是投入重金研发后,硅谷是否会有开源模型突袭。
结语
当下,文生视频的热度足够火爆。
对于中国企业来说,Sora是前方需要追赶的又一个目标,它为更多内容创作及其他行业带来了全新的思考和机遇,百度、科大讯飞等在大语言模型中领先的企业,以及拥有海量数据资源的抖音,都应该加速了。
虽然我国文生视频领域尚且没有明星产品的出现,但更多有人才、有技术的文生视频公司正在不断涌现。
(文/欣遇)
e-Mail:lab@enet16.com
TEL:010-65283855

绿色.jpg

品牌推广

微信图片_20230922155520.jpg

品牌推广

财经峰会.jpg

品牌推广

ab6b4cd3961517dcbd39161275e91a07.png

品牌展播查询

品牌展播查询.png

微信小商店

微信小商店

微信视频号

视频号