谷歌发布超强AI视频编辑工具！施展魔法的VLOGGER，音频加图片就搞定唇形和手势，还把表情编辑玩出花了！

　　发布于2024-12-27　阅读（0）

扫一扫，手机访问

出品 | 51CTO技术栈（微信号：blog51cto）

编译丨伊风

视频生成模型的脚步永不停歇！

谷歌发布超强AI视频编辑工具！施展魔法的VLOGGER，音频加图片就搞定唇形和手势，还把表情编辑玩出花了！图片

4月2日，谷歌刚刚发布了强大到可怕的AI视频编辑工具VLOGGER。VLOGGER就像收集了很多视频素材领域的前沿AI技能，而打造出的一款百宝箱。其中也有一些亮点细节，例如通过AI编辑，将让画面中讲话者的闭眼、闭嘴、甚至“wink”。

这意味着视频编辑在细节的深入上又精进了一个level！

Vlogger的工作原理是根据音频和图像输入，由“读唇器”根据音频预测说话者的动作，而“动画器”根据说话者的照片和动作细节创建视频帧。

谷歌发布超强AI视频编辑工具！施展魔法的VLOGGER，音频加图片就搞定唇形和手势，还把表情编辑玩出花了！图片

要知道VLOGGER这个百宝箱里都装了什么，可以跟随以下示例来看！

1.VLOGGER的多面能力

基础的图生视频功能

将图片驱动为一段视频。

谷歌发布超强AI视频编辑工具！施展魔法的VLOGGER，音频加图片就搞定唇形和手势，还把表情编辑玩出花了！图片

多语种唇形切换

输入一种语言的视频和另一种语言的音频，它能根据新输入的语言调整说话者的嘴部动作！

顺便一提，OpenAI的VOICE ENGINE也在关注多语种的能力。可以根据一段音频生成一段保留原声音色及口音的外语视频，如果这些能力都能打通，那么音视频内容的出海将会畅通无阻。

谷歌发布超强AI视频编辑工具！施展魔法的VLOGGER，音频加图片就搞定唇形和手势，还把表情编辑玩出花了！图片

表情细节编辑

VLOGGER使得表情编辑更进一步，例如单独控制一只眼睛等。通过使用工具，将生成新的面部表情和动作，用以提升视频的创意。

谷歌发布超强AI视频编辑工具！施展魔法的VLOGGER，音频加图片就搞定唇形和手势，还把表情编辑玩出花了！图片

2.最终效果，进步了但未完全消除“恐怖谷”

谷歌发布超强AI视频编辑工具！施展魔法的VLOGGER，音频加图片就搞定唇形和手势，还把表情编辑玩出花了！图片

毫无疑问VLOGGER的视频留下了令人印象深刻的亮点。如讲话时自然的身体姿势，增加手部运动以在一定程度上提升了视频的真实感。然而，生成的表情和动作比起真实视频还存在机械感重、不流畅的问题，因此会存在一定的“恐怖谷”效应。

参考链接：https://twitter.com/hey_madni/status/1774832882902864327

想了解更多AIGC的内容，请访问：

51CTO AI.x社区

https://www.51cto.com/aigc/

本文转载于：https://www.51cto.com/article/785532.html 如有侵犯，请联系admin@zhengruan.com删除

上一篇：香橙派推出 Orange Pi 5 Pro 开发板：换用 LPDDR5 内存，搭载 40Pin GPIO 接头

下一篇：苹果13手写输入法在哪设置_苹果13添加手写键盘教程

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

IDC报告：iPhone全球出货量下滑，华为Mate 60系列势头强劲

据市场调研机构IDC最新发布的报告指出，2019年1月至3月期间，苹果iPhone的全球出货量出现了下滑，下降了9.6%。这是4月15日消费消息的微调。这一趋势实际早有预兆，从苹果近期的一系列促销活动中可窥一斑。在圣诞节以及中国新年的促销季中，苹果对iPhone进行了降价销售，甚至在其官方网站上直接推出了优惠活动。而在第三方销售渠道，iPhone的价格更是进一步下滑，原本7899元的iPhone15Pro256GB版本，现在消费者大约只需7200元左右即可入手，价格差接近2000元。然而，即使有如此明显的

12分钟前苹果 0
正版软件

苹果终止电车项目后大裁员，押注家用机器人，这会是Next Big Thing吗？

新的出路，苹果能让我们耳目一新吗？苹果公司压力山大，何以见得？苹果公司的电动汽车项目在今年二月份取消了，他们还决定放弃为AppleWatch自主生产下一代屏幕的尝试。这两个项目都因成本超支和上市延迟而受阻。此外，混合现实眼镜还需要多年时间才能成为苹果主要的盈利点。在这样的情况下，苹果面临着巨大的收入压力。图源：彭博社一些电动汽车项目的少数剩余员工将被转移至苹果公司的生产式AI项目。其他人将有90天时间在公司内部找到其他角色的重新分配，否则就会被解雇。内部员工透露，在取消前，汽车项目仍有大约1400名员工在

27分钟前产业苹果公司家用机器人 0
正版软件

比亚迪“豹 3”预告图曝光，春季发布会引爆期待

4月13日消息，比亚迪旗下品牌程豹近日发布了旗下新款车型“豹3”的预告图，引起了车迷们的热烈关注。据悉，这款备受期待的新车将在即将到来的4月16日方程豹汽车春季发布会上揭开神秘面纱。豹3以独特的设计理念和鲜明的个性特点吸引了众多目光。其设计理念可概括为以潮酷之“方”，创造张扬灵动的个性之“华”。这款车型定位为纯电动硬派SUV，是基于DMO超级混动越野平台精心打造的杰作。相较于豹5，豹3的车身尺寸更为紧凑，成为方程豹“583硬派家族”中的全新一员。数据小编了解到，从先前曝光的谍照中可以看出，豪华的外观设计与

42分钟前 0
正版软件

明天起这些新规将影响你我生活：含新的《快递服务》国家标准等

本站3月31日消息，本站从中国政府网获悉，4月起，一系列新规将实施，影响你我生活。新修订的《快递服务》国家标准4月1日起实施市场监管总局日前发布了新修订的《快递服务》国家标准，自2024年4月1日起实施。《标准》对用户下单和投递方式进行了细分，更好适应寄递用户个性化需求。增加智能化服务要求，包括智能安检系统和智能邮箱、智能快件箱、无人车等智能投递服务终端相关要求，推动新技术在快递行业的应用。《限制商品过度包装要求生鲜食用农产品》自4月1日起实施该标准明确主要技术指标包括三方面：一是针对不同类别和不同销售包

57分钟前人脸识别快递 0
正版软件

超越GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k

在大模型落地应用的过程中，端侧AI是非常重要的一个方向。近日，斯坦福大学研究人员推出的Octopusv2火了，受到了开发者社区的极大关注，模型一夜下载量超2k。20亿参数的Octopusv2可以在智能手机、汽车、个人电脑等端侧运行，在准确性和延迟方面超越了GPT-4，并将上下文长度减少了95%。此外，Octopusv2比Llama7B+RAG方案快36倍。不少网友感叹：设备端AI智能体的时代到来了！论文：Octopusv2:On-devicelanguagemodelforsuperagent论文地址：h

1小时前 13:55 产业斯坦福大学 AI 智能体 0