腾讯发布自研推理模型混元T1 性能比肩DeepSeek

(北京/香港综合讯)中国科技巨头腾讯推出自研人工智能(AI)模型混元T1,性能比肩深度求索(DeepSeek)模型,但价格更便宜,反映中国AI竞争日益激烈。

腾讯混元星期五(3月21日)在微信公众号说,混元T1是腾讯自研的强推理模型,特点是吐字快、能秒回,擅长超长文处理,且摘要幻觉低。

腾讯介绍,混元T1的吐字速度是每秒60至80 tokens(处理文本的最小单元),远快于DeepSeek-R1模型。由于R1在生成答案前,需进行深度思考,并列出思维链,因此存在回应速度慢的短板。

综合测试结果,混元T1在逻辑推理能力优于R1和OpenAI的o1,但在数学和代码能力测试中劣于R1。

混元T1沿用了腾讯2月底发布的混元Turbo S架构,这有助降低训练和推理成本。但腾讯没有披露模型的参数量级,尚不清楚该模型使用了多少数据训练。

目前混元T1已在腾讯云官网上线,输入价格为每百万tokens 1元(人民币,下同,0.2新元),输出价格为每百万tokens 4元,价格是R1的四分之一。

DeepSeek今年1月底发布低成本高效能的R1开源模型后,不少中国科技大厂纷纷跟进推出开源模型,如阿里巴巴的通义千问QwQ-32B、字节跳动的豆包等。

这些企业都通过进一步压缩训练成本、提高训练效率,最终向客户提供更便宜的服务,让模型竞争日益激烈。

中国AI专家、零一万物创始人李开复星期五(3月21日)接受《南华早报》专访时表示,该公司已将所有赌注押在DeepSeek上。

他说,R1模型推出后,许多中国软硬件厂商纷纷将服务与该模型对接,其公司如此押注的理由也是显而易见。

成立于2023年的零一万物是最早关注大语言模型的独角兽企业之一,该公司原从事模型开发,但在R1模型推出后,转而为企业部署DeepSeek模型提供解决方案。

李开复坦言,在DeepSeek等开源替代方案的冲击下,初创企业已难以证明开发昂贵模型的必要性。

您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。