分享好友 最新动态首页 最新动态分类 切换频道
谷歌大幅更新生成式AI,推出视频模型VEO 2和最新版Imagen3
2024-12-27 19:40

  作者:赵雨荷

  来源:硬AI

  的旗舰AI研究实验室Google DeepMind周一大幅升级其人工智能驱动的内容生成工具,推出了Veo 2视频生成模型和增强版Imagen 3图像模型,挑战OpenAI在AI图像和视频生成的领先地位。谷歌表示,这些更新有望彻底改变创意工作流程,为视频和图像创作者提供更高的真实感和定制化体验。

  谷歌介绍,Veo 2是谷歌的视频生成工具,能够生成多样化主题和风格的高质量视频。谷歌在博客中表示,这款模型在真实感方面表现卓越,能够捕捉到人类表情和电影效果等细节。其增强的物理和电影学理解能力使用户能够生成令人惊叹的内容,包括跟踪镜头和广角构图等。

  例如,Veo 2熟悉电影拍摄语言,用户可以要求某种类型的风格,指定镜头,建议电影效果,Veo 2都会以高达4K分辨率并延长到数分钟的视频长度来呈现。比如,要求“低角度跟踪镜头穿越场景中央”或“特写科学家通过显微镜观察”的镜头,Veo 2都能实现。提示“18mm镜头”,Veo 2知道生成广角镜头;要求“浅景深”,它会模糊背景,突出主体。

  值得注意的是,这一分辨率是OpenAI Sora模型的4倍,视频时长更是其6倍以上。

  不过,目前这些优势仍是理论上的。在谷歌的实验性视频创作工具VideoFX中,Veo 2生成的视频被限制为720p分辨率、8秒的长度。(相比之下,Sora的最大输出为1080p、20秒的短片。)

  谷歌表示,虽然视频生成模型往往会“幻象化”出不需要的细节,例如多余的手指或意外的物体,但Veo 2在这一方面的表现更为真实,生成错误的频率较低。

  此外,Veo 2生成的视频包括不可见的SynthID水印,用于标记它们为AI生成的内容,从而减少误用或错误归属的风险。

  DeepMind产品副总裁Eli Collins对媒体表示,随着模型逐渐具备规模化使用的准备,谷歌将通过其Vertex AI开发者平台提供Veo 2。

  开发者和创作者目前可以通过谷歌实验室(Google Labs)访问该工具,预计到2025年,它将广泛集成至诸如YouTube Shorts等平台。

  此外,谷歌还推出了Whisk,这是一款结合了Imagen 3和Gemini视觉分析能力的创意工具。用户可以输入图像,生成详细的文字描述、重新混合风格,或设计个性化作品,如数字玩偶或搪瓷徽章。

  谷歌介绍,Whisk结合了Imagen 3模型和Gemini的视觉理解与描述能力。Gemini模型会自动为用户的图像生成详细的文字描述,并将这些描述传递给Imagen 3。这一过程让用户能够以有趣的新方式重新混合主题、场景和风格。

最新文章
Xiaomi Mi Unlock Tool: Download and How to use it to Unlock Bootloader
Through this post, you can download the latest Xiaomi Mi Unlock Tool, along with all the previous versions. Further, we will also guide you on how to use the Mi Unlock Tool to unlock the bootloader on Xiaomi, Redmi, and Po
营销信息网站排名优化,策略与实践,营销信息网站排名优化方案
营销信息网站排名优化,策略与实践,是提升网站在搜索引擎中排名的关键步骤。通过优化网站内容、关键词、链接等,提高网站质量和用户体验,从而吸引更多潜在客户。需要关注竞争对手的动态,不断调整优化策略,保持网站的竞争优势。实践表明
项目记录:C语言学生成绩排名程序
  一个很简单的小项目,大一的学生作业。我简单介绍一下相关功能和代码之类的吧~  本来题目不强制要求菜单的,我有点强迫症加了菜单。【1】题目:   一个班40名学生,期末有10门课程成绩,要求计算并输出
用AI绘画生成超逼真美女写真,简单易上手的工具评测与教程
5. Runway ML Runway ML是一款提供多种创意工具的AI平台,用户可以利用其强大的功能进行视频编辑、图像生成甚至生成式图像处理。在生成美女写真方面,Runway ML允许用户上传参考图像进行修改,非常适合有一定艺术背景的用户。不过,操作界
豹猫怕不怕冷
豹猫对寒冷的适应能力较强,但仍然需要注意保暖。豹猫主要栖息于山地林区、郊野灌丛和林缘村寨附近,能够在海拔3000米的高山林区生活。它们的体毛较为浓密,能够提供一定的保暖效果,因此在寒冷环境中具有一定的适应能力。然而,尽管豹猫对
揭秘看网站流量的秘密,揭秘那些能帮你洞察网站流量的网站地址
在互联网高速发展的今天,网站流量已经成为衡量一个网站受欢迎程度的重要指标,一个高流量的网站意味着它具有更多的潜在客户和商业机会,如何了解自己的网站流量呢?就让我们一起揭秘那些能帮你洞察网站流量的网站地址。百度统计是百度提供
深圳外贸建站_深圳外贸建站推广
在当今的数字化时代,深圳外贸建站已成为众多企业走向全球市场的必备利器。无论是小型初创公司,还是大型企业集团,外贸网站都是打破地域限制、获取全球客户的关键桥梁。对于深圳这样的外贸重镇而言,拥有一个高效、专业的外贸网站不仅是企
农村直播对农民的影响,机遇与挑战并存,数据驱动计划_WP35.74.99
摘要:农村直播对农民产生了深远影响,既带来机遇也面临挑战。直播形式为农民提供了展示农产品、推广农业技术的平台,促进了农村经济发展和销售增长。竞争激烈的直播市场、技术门槛和市场需求变化也给农民带来了挑战。数据驱动计划如WP35.7
保利世博天悦售楼处电话→售楼中心→24小时电话热线→楼盘百度
最新消息:保利世博天悦已取证,将于明日开启认购,推出2#、4#共58套建面约174-400㎡洋房,均价165262元/㎡。【保利世博天悦】售楼处营销中心:400-8855-420
曹建峰《“人工智能+法律”十大趋势》推介
各位听众朋友们,大家好!我是中南财经政法大学硕士研究生姜洋,今天我想给大家推荐的是腾讯研究院未来科技中心高级研究员曹建峰撰写的《“人工智能+法律”十大趋势》。该文发表于《机器人产业》2017年第5期。作者站在人工智能发展前沿,
相关文章
推荐文章
发表评论
0评