Character.AI 突破性技术:实时 AI 角色视频互动
创始人
2025-07-05 14:10:52

IT之家 7 月 5 日消息,AI 聊天机器人平台 Character.AI发布研究论文和视频演示,展示了名为 TalkingMachines 的自回归扩散模型,让 AI 角色互动更加逼真。

该模型尚未部署在 Character.AI平台上,根据研究论文和视频演示,用户只需要输入一张图片和声音信号,该模型就能实现类似 FaceTime 的通话视觉互动。

该模型基于 Diffusion Transformer(DiT)技术,本质上是一种能够从随机噪声中创建详细图像的“艺术家”,并不断优化图像直至完美。Character.AI所做的就是让这一过程变得极其迅速,达到实时效果。

TalkingMachines 模型采用了流匹配扩散(Flow-Matched Diffusion)、音频驱动的交叉注意力(Audio-Driven Cross Attention)、稀疏因果注意力(Sparse Causal Attention)和不对称蒸馏(Asymmetric Distillation)等多种关键技术。

其中流匹配扩散技术通过训练大量动作,包括细微的面部表情和更夸张的手势,确保 AI 角色动作更加自然。音频驱动的交叉注意力技术则让 AI 不仅能听到单词,还能理解音频中的节奏、停顿和语调,并将其转化为精确的口型、点头和眨眼。

稀疏因果注意力技术让 Character.AI能够以更高效的方式处理视频帧,而不对称蒸馏技术则让视频能够实时生成,营造出类似 FaceTime 通话的效果。

Character.AI强调,这一研究突破不仅仅是关于面部动画的,它是朝向实时互动的音频视觉 AI 角色迈出的一步。该模型支真实感人类、动漫和 3D 虚拟形象等多种风格。

IT之家附上参考地址

相关内容

热门资讯

自驾三亚亚龙湾自驾,后山徒步俯... 山海为笺:亚龙湾后山徒步,把蔚蓝揉进车轮与脚步里 当城市的早高峰车流把尾气揉成灰色雾霭,当电脑屏幕的...
【欢度端午】《玩具总动员5》胡... 迪士尼-皮克斯工作室正式官宣,《玩具总动员5》将于6月19日同步北美在中国内地上映。 从1995年首...
夕照海岛鹭翩飞 唐山国际旅游岛... 摄制|马英杰 郭宝强 6月20日,唐山国际旅游岛菩提岛草木繁茂、生态怡人,夕阳余晖下成群鹭鸟在此筑巢...
皖美夏日| 云海、飞瀑、秋沙鸭... 九子岩飞瀑引客来 青阳县九子岩风景区内,山间瀑布沿陡峭岩壁层层倾泻,山林满目青翠,溪潭清冽透亮。不...
去西北度蜜月如何选择西北本地私... 近年来西北成为国内蜜月出行的热门目的地,辽阔的草原、澄澈的盐湖、壮美的雅丹地貌与沙漠星空,能够为新婚...