美团LongCat团队今日宣布,正式开源专用语音编解码方案LongCat-Audio-Codec。它提供一套一站式的Token生成器(Tokenizer)与Token还原器(DeTokenizer)工具链,其核心功能是将原始音频信号映射为语义与声学并行的token序列,实现高效离散化,再通过解码模块重构高质量音频,为Speech LLM提供从信号输入到输出的全链路音频处理支持。
(本文来自第一财经)
上一篇:AI见顶?台积电打脸!指数级增长!
下一篇:辽宁走失女童自述:迷路后睡在草地,期间无人接触 公安机关:正进一步调查核实