您现在的位置是:欧交易所app官方下载 > 休闲
巨人网络AI Lab发布多模态生成新成果,相关技术将开源
欧交易所app官方下载2025-11-29 04:19:59【休闲】1人已围观
简介新浪科技讯 11月27日下午消息,巨人网络AI Lab与清华大学SATLab、西北工业大学联合推出三项音视频领域的多模态生成技术成果,相关研究成果将陆续在GitHub、HuggingFace等平台开源 欧交易所app下载
新浪科技讯 11月27日下午消息,巨人巨人网络AI Lab与清华大学SATLab、网络西北工业大学联合推出三项音视频领域的布多欧交易所app下载多模态生成技术成果,相关研究成果将陆续在GitHub、模态HuggingFace等平台开源。生成术
本次发布的新成三项研究成果——音乐驱动的视频生成模型YingVideo-MV、零样本歌声转换模型YingMusic-SVC与歌声合成模型YingMusic-Singer,果相关技展现了团队在音视频多模态生成技术上的开源最新成果。
据悉,巨人欧交易所app下载YingVideo-MV模型实现“一段音乐加一张人物图像”即可生成一个音乐视频片段。网络该模型能够对音乐进行节奏、布多情绪与内容结构的模态多模态分析,从而使镜头运动与音乐的生成术高度同步,具备推、新成拉、果相关技摇、移等镜头语言,并通过长时序一致性机制,有效缓解了长视频中常见的人物“畸变”与“跳帧”现象。
在音频领域,YingMusic-SVC主打“真实歌曲可用”的零样本歌声转换能力。它通过针对真实音乐场景的全面优化,有效抑制了伴奏、和声与混响对歌声转换的干扰,显著降低了破音与高音失真的风险,为高质量的音乐再创作提供了稳定的技术支撑。
而YingMusic-Singer歌声合成模型则支持在给定旋律下输入任意歌词,即可生成发音清晰、旋律稳定的自然歌声。该模型的主要特点在于能够灵活适应不同长度的歌词,并支持零样本音色克隆,提升了AI演唱在创作过程中的灵活度与实用性,降低音乐创作的门槛。
海量资讯、精准解读,尽在新浪财经APP 责任编辑:宋雅芳
很赞哦!(85256)
相关文章
热门文章
站长推荐
友情链接
- 小米汽车首例定金案败诉 “未交车催收尾款”被判双倍返还定金
- 蚂蚁集团:捐赠1000万港元支援香港火灾救援,祈愿平安!
- 《全面战争》系列25岁了,我们和主创聊了聊
- 大众 Polo“火辣版”:Cupra Raval 高性能纯电小车官方预告,最高 233 马力
- 已完成审核:直播电商监管新规拟近期出台
- “小钢炮”Abarth 电动化后市场表现糟糕,Stellantis 证实将重新打造燃油版
- 新能源汽车性价比榜单:享界S9系列获双料冠军
- 蓝宝石 PURE 极地 X870A WIFI 7 主板外观、规格曝光,白银灰设计
- 俞敏洪回到北京上班,选了100个周年鼠标垫送东方甄选会员
- 阿里智能信息事业群总裁吴嘉:夸克AI眼镜发布,将内置千问助手




