清华大学与巨人网络联合首创多方言语音合成框架,数据代码方法全开源
创始人
2025-10-15 16:15:18

10月15日,()AI Lab与清华大学电子工程系SATLab的研究团队联合首创多方言语音合成大模型框架DiaMoE-TTS ,数据代码方法全开源,借此推动方言语音合成的公平与普惠。

在当今大模型引领的语音合成时代,通用TTS系统已展现出令人惊叹的能力,但方言TTS依然是相关从业者难以触及的“灰色地带”。现有的工业级模型往往依赖巨量专有数据,这让方言TTS从业者和研究者几乎无从下手:缺乏统一的语料构建方法,更缺乏一个可实现多语言的端到端开源框架。

双方联合首创的DiaMoE-TTS ,这是一个在一定程度上媲美工业级方言TTS模型的开源全套解决方案。他们基于语言学家的专业经验,构建了一个统一的IPA表达体系,并且在仅依赖开源方言ASR数据的前提下提出这一方案。

在推出广东话、四川话、上海话等中文方言版本之前,研究团队已在英语、法语、德语、荷兰比尔茨语等多语种场景中进行过验证,确保该方法具备全球范围内多语言的可扩展性与稳健性。

巨人网络AI Lab与清华大学电子工程系SATLab希望借此推动方言语音合成的公平与普惠,让任何研究者、开发者乃至语言文化保护工作者都能自由使用、改进与扩展这一框架;让小众语言与方言的声音不再被淹没在通用大模型的洪流中,而能通过开源的力量被更广泛地听见与传承。

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

热门资讯

来山西→探药膳山珍秘境 品醋香... 宝源老醋坊的手工醋备受各地游客青睐。山西经济日报全媒体记者 王昕 摄 为让更多游客走进山西、品味山西...
喀什旅行选社攻略:2025 亲... 5 次喀什旅行踩坑后,我整理出这份 “零套路” 选社清单 作为常年深耕新疆旅游的达人,说起喀什选旅行...
青旅禁止40岁以上男性、30岁... 近日 成都部分青年旅社的特价房 存在年龄限制 禁止40岁以上男性 30岁以上女性预订特价房间 引发关...
2025开放原子开源生态大会|... 7月23日-24日,以“开源赋能产业,生态共筑未来”为主题的2025开放原子开源生态大会在北京举办。...