阿里巴巴发布Qwen系列人工智能新模型,称该模型可处理文本、图片、音频和视频,可以直接在手机和笔记本电脑上运行。
据彭博社报道,阿里星期三(3月26日)在声明中称,新的Qwen2.5-Omni-7B系统在语音理解和生成方面性能特别高。
阿里称,目前公开发布于Hugging Face和GitHub的这个新模型将被用于构建所谓的AI智能体,例如,可以通过实时音频描述帮助视障人士确定他们周边的状况。
阿里巴巴不是唯一一家开发多模态模型的AI开发商。OpenAI和Alphabet Inc.的谷歌都提供了生成式AI工具,可处理包括文本和音频在内的不同类型输入。
您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。