分享好友 最新动态首页 最新动态分类 切换频道
刚刚,OpenAI Sora正式炸裂登场,网页挤爆了!
2024-12-26 10:20

算起来,距离今年 2 月 16 日 Sora 的发布已经过去了近 10 个月的时间。

视频链接:https://mp.weixin.qq.com/s/_cm8Sw50XF0P2JtHGDAKKA?token=1912244716&lang=zh_CN

让你的想象力栩栩如生

那就先为读者们展示下官方放出的 Sora 的能力吧。

Storyboard:在时间线上组织和编辑视频的独特序列

更多 Sora 生成的惊艳视频,也需要广大网友们的想象力去创造了。

Sora 正式版系统卡

在今年 2 月份,Sora 刚发布时,OpenAI 曾公布了 Sora 的技术报告(参阅:我在模拟世界!OpenAI 刚刚公布 Sora 技术细节:是数据驱动物理引擎)。

OpenAI 认为,扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。

Sora 是 OpenAI 的视频生成模型,旨在获取文本、图像和视频输入并生成新视频作为输出。用户可以创建各种格式的高达 1080p 分辨率(最长 20 秒)的视频。

Sora 建立在 DALL・E 和 GPT 模型的基础上,旨在为人们提供创意表达的工具。

Sora 是一种扩散模型,它从看起来像静态噪声的基本视频开始生成新视频,通过多个步骤消除噪声来逐渐对其进行转换。通过一次为模型提供多帧预测,Sora 解决了一个具有挑战性的问题,即确保画面主体即使暂时离开视野也能保持不变。与 GPT 模型类似,Sora 使用 transformer 架构,释放出卓越的扩展性能。

Sora 使用 DALL・E 3 中的重描述(recaptioning)技术,该技术涉及为视觉训练数据生成高度描述性的字幕(captions)。因此,Sora 能够更忠实地遵循生成视频中用户的文本指令。

除了能够仅根据文本指令生成视频之外,该模型还能够获取现有的静态图像并从中生成视频,准确地将图像内容动画化并关注细节。该模型还可以获取现有视频并对其进行扩展或填充缺失帧。Sora 是能够理解和模拟现实世界的模型的基础,OpenAI 认为 Sora 将成为通往 AGI 的重要里程碑。

在数据方面,正如 OpenAI 在 2 月的技术报告中所述,Sora 从大型语言模型中汲取灵感,这些模型通过互联网规模数据的训练来获得通才能力。LLM 得以确立新范式,部分得益于创新了 token 使用的方法。研究人员们巧妙地将文本的多种模态 —— 代码、数学和各种自然语言统一了起来。

在 Sora 中,OpenAI 考虑了生成视觉数据的模型如何继承这种方法的好处。大型语言模型有文本 token,而 Sora 有视觉 patch。此前的研究已经证明 patch 是视觉数据模型的有效表征。OpenAI 发现 patch 是训练生成各种类型视频和图像的模型的可扩展且有效的表征。

在更高层面上,OpenAI 首先将视频压缩到较低维的潜在空间,然后将表征分解为时空 patch,从而将视频转换为 patch。

Sora 接受过各种数据集的训练,包括公开数据、通过合作伙伴获取的专有数据以及内部开发自定义数据集:

更多细节,读者们可以查看系统卡介绍。

价格权益

最新文章
倒退式设计_今日回环倒退式设计教程
摘要:倒退式设计,今日回环倒退式设计教程,新片场素材小编尹文倒退式设计,今日回环倒退式设计教程相关内容整理,如果您对倒退式设计,今日回环倒退式设计教程感兴趣欢迎访问免费阅读。倒退式设计,今日回环倒退式设计教程一、倒退式在线设计
轻松生成超逼真美女写真,教你如何使用AI画图工具!
在这个以图像为王的时代,社交媒体上的照片越来越重要,尤其是美女写真。这时候,我们不禁要问:如何能在短时间内生成高质量的美女写真呢?答案就是利用AI技术。如今,市面上出现了多款AI绘画工具,能够一键生成超逼真的美女写真。今天,我
Ubuntu之root权限的获取
方案一:   Ubuntu的root密码在没有设置之前是随机的,即在每一次开机的时候他的密码都不同,但是由于在安装Ubuntu的时候需要建立一个账户,而这个招呼又属于admin组,因此它可以对root进行密码的修改。方案二:  通过修改/etc/passwd
WordPress初学者入门教程-页面与文章
本文源自:https://wpeyes.com/wordpress 当你想要添加书面内容到你的网站,你有两个选择。你可以创建一个页面或一篇文章。在添加/编辑方面,这两者非常相似,但在功能上其实是相当不同的。 对于刚接触WordPress的人(或者甚至是网站建设的新
高SEO优化公司、网站建设公司,效果有保障专研搜索引擎最新算法技术以及应用排名优化不仅仅是SEO优化服务,还有保姆级的一站式SEO优化服务,拥有完整的营销体系,全方位打通企业获客渠道
致:高seo客户技术手段:定期检查站内外布局,优化以符合SEO标准。在与高SEO公司合作之前,建议您多提问、多比较价格、效果和技术,这样您就可以对这家公司有一个清晰的认知。通过搜索引擎优化关键词在高找到我们,也展现了我们公司的实力和
教你怎么免费的将PDF转换成PPT
将PDF文件转换成PPT文件是一种非常有用的技能,因为它可以帮助您将一个PDF文件中的文本、图片和其他内容转换成一个幻灯片演示文稿,这样您可以更方便地展示和分享它。虽然有很多商业软件可以帮助您完成这项任务,但是在本文中,我们将介绍
什么是营销型网站?营销型网站有什么特征?
随着互联网的发展和电子商务的兴起,许多公司现在都有来自互联网的订单,而且这个比例正在增加。许多公司非常重视网络营销,但缺乏相关知识。 营销的结果往往不如他们想象的那么好。如果要想网站达到我们预期的效果,一定是需要精心呵护的
红米2手机应用下载与内容体验全方位指南
红米2手机应用下载与内容的全方位指南,涵盖手机应用商店的各类应用下载及安装方法,包括社交、娱乐、工具等各类应用。提供简单易懂的步骤指导,帮助用户轻松完成应用下载与安装。介绍如何管理手机内存和流量,确保下载过程顺畅无阻。还涵
谷歌图像搜索的相似图片哈希算法
对于像谷歌、百度识图这种图像搜索的算法,主要有三个步骤:将目标图片进行特征提取,描述图像的算法很多,用的比较多的是:SIFT描述子,指纹算法函数,bundling features算法,hash function(散列函数)等。也可以根据不同的图像,设计不
小红书可添加淘宝外链-新流量正向商家敞开-内容电商小红书电商营销
本文主题内容电商,小红书,种草拔草,小红书,淘宝链接,电商营销。有报道称,在双11即将迎来第一波爆发的前两天,淘宝商家群里出现了一份名为“品牌合作平台外链操作手册”的文件。里面介绍了小红书正在内测的功能:合作笔记跳转淘宝链接。这
相关文章
推荐文章
发表评论
0评