IT时报记者郝俊慧
“一颗心值多少钱?”“一颗心值一个亿。”这句“土味情话”背后的深意,如今被AI轻松破解。
近日,“AI国家队”——中国电信人工智能研究院(TeleAI)正式面向全球社区开源升级版星辰语义大模型TeleChat2.5(35B参数)和复杂推理大模型T1正式版(115B参数),不仅大幅提升了模型在逻辑推理、数学推导等方面的准确性,能做对考研数学真题,即使找一些刁钻的文字游戏或者脑筋急转弯来为难它,T1 也能秒懂背后的“土味”深意,轻松破解。
“通用问答+复杂推理”大模型的双双开源,标志着我国自主研发大模型技术迈上新台阶。其中,TeleChat2.5综合能力表现优异,在AlignBench和MATH-500评测基准中评分均超过OpenAIGPT-4o。基于TeleAI独特的数据处理和训练方法,TeleChat2.5的数学和工具调用能力出色,整体效果较上一代版本提升显著,其中数学推理提升超过15%。
复杂推理大模型T1是TeleAI继今年1月Preview版之后推出的正式版本,综合能力超过OpenAIo1-mini及DeepSeek-R1蒸馏版,并在工具调用和数学推理两个维度表现出色。在BFCL和MATH-500两项专业评测基准中,T1的工具调用评分超过DeepSeek-R1蒸馏版,数学推理评分与之持平。
作为央企背景的科研中坚,TeleAI依托中国电信万卡集群与国产深度学习框架,从基础算力、数据处理到模型训练全链条自主可控。团队在数据合成、课程化学习、模型融合和多阶段微调等环节持续创新,实现了算力和算法的深度融合,为“AI国家队”提供了坚实底座。
星辰语义大模型(TeleChat 系列)自 2024 年起分批开源,至今已涵盖从 7B 至115B不同规模版本,从单一规模到多模型、多规格的全覆盖开源格局,充分体现了TeleAI在国产化算力、训练框架及模型优化方法上的持续突破,其中 TeleChat2-115B 在华为昇思大模型平台下载超 37 万次,是全平台下载次数最高的大模型;TeleChat2-3B 在 HuggingFace 开源社区下载逐月增加,已累计近 2 万次。
作为央企科研机构,TeleAI 持续深耕原创技术的研发和落地,目前已打造全模态、全尺寸、全国产的“三全”星辰大模型体系。此次 TeleChat2.5 和 T1 的发布和开源,进一步推动了国内自研大模型技术的迭代和进步。
与此同时,TeleAI 还通过对家族式同源模型协同的深入研究,进一步探索智传网(AI Flow)的创新和应用,并与 AI 治理、智能光电(包含具身智能)、智能体形成“一治+三智”完整科研布局。