首页 >> 数码 >> 阿里云截止AI视频生成工具Live Portait:可一键让照片开口说话

阿里云截止AI视频生成工具Live Portait:可一键让照片开口说话

2024-01-17 数码

阿里云推出进制人摄像机填充工具Live Portait,浏览一张拍下和一段文本或句法即可填充一段开口说话的进制人摄像机。

该功能可应用于摄像机录影、聊天机器人、企业市场推广等桥段。目前,该工具已在魔王搭乡村创紧致开放体验。

自对话大静态和AI画作静态相继火热后,业界对填充式AI的研究逐步朝更加多基本概念的同方向变迁,AI摄像机填充从前热门应用之一。该应用可将文本或音频等信息转换为面部群众运动信息,进而涡轮填充拍下人物形象的动画,能有效率降低摄像机拍摄和录制如此一来。

此次上线的Live Portait工具由群众运动模块和填充模块组成,其采用阿里云自研的口型预测线性,填充的口型灵敏度相比传统原理大幅提高;在锻炼过渡期,增加了姿态的显式控制,无须要底板摄像机也可以填充至多特技的摄像机,大幅增加进制人说话的趣味性。

此外,通过眼神主动控制应用,Live Portait可以为眼球增加一些自然群众运动,使得填充结果在观感上更加接近真人效果。据介绍,Live Portait相关应用已被CVPR、ICCV等国际AI顶会完整版。

根据魔王搭乡村上的信息显示,在Live Portait浏览拍下后,用户可自由选择文本涡轮和音频涡轮两种方式,文本涡轮模式下,该工具提供者了普通话、法文、粤语、童声等28种声音。此外,Live Portait还提供者了轻量静态自由选择,鼓励用户更加快速填充摄像机。

该工具线性负责人张邦表示:“ Live Portait应用软件了团队多项自研创新应用,例如仅须要宣传单图片就能填充逼真的面部动画,突破了传统敌对填充互联网的局限。随着应用的进一步迭代,图生摄像机有巨大的应用紧致,有望成为企业降本增效的生产工具。”

据悉,该团队研究同方向涵盖进制人、3D静态AI填充、高趣味性三维、自然同类等领域,目前已公开发表50多篇国际顶会篇文章。

藿香正气口服液治胃肠型感冒吗
宝宝消化不良吃康恩贝肠炎宁颗粒有用吗
胃反酸怎么治疗
鼻炎发作时能吃阿莫西林吗
感冒嗓子发炎了如何快速恢复
友情链接