通义千问再开源 推出最大尺寸1100亿参数模型

4月28日,通义千问宣布开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型,并在多项基准测评中都创下可与Llama3-70B媲美的成绩。目前Qwen1.5系列已累计开源10款大模型,通义千问开源模型下载量超过700万。

据了解,通义千问1100亿参数模型延续了Qwen1.5系列的Transformer解码器架构,采用了分组查询注意力方法(GQA),使得模型在推理时更加高效。110B模型支持32K上下文长度,具备优秀的多语言能力,支持中、英、法、德、西、俄、日、韩、越、阿拉伯等多种语言。

Qwen1.5-110B在MMLU、TheoremQA、GPQA等多个基准测评中展现出卓越性能,基础能力可与Meta刚刚发布的Llama-3-70B模型相媲美,相比通义千问720亿参数开源模型也有明显提升。研发团队指出,Qwen1.5-110B的预训练方法与同系列其他模型并无明显差异,性能提升主要来自参数规模的扩增。

研发团队还在MT-Bench和AlpacaEval 2.0两个测评集上对1100亿参数模型的Chat版本做了评估,通义千问110B比通义千问72B的效果有显著提升。

今年2月初,通义千问团队推出最新开源模型系列Qwen1.5,随后在不到3个月的时间连续开出8款大语言模型,模型参数规模涵盖5亿、18亿、40亿、70亿、140亿、320亿、720亿、1100亿;Qwen1.5系列还推出了一款基于LLM开发的代码模型CodeQwen1.5-7B和一款混合专家模型Qwen1.5-MoE-A2.7B,均在开源社区收获热烈反响。

开发者可在魔搭社区ModelScope和HuggingFace等开源社区下载使用Qwen1.5-110B。据悉,目前通义千问开源模型下载量超过700万。

通义大模型的落地应用也开启了加速度,近期,新东方、同程旅行、长安汽车、西部机场集团、亲宝宝等多家企业宣布接入通义大模型。通义大模型开始“上天入地”支持千行百业,比如,中国科学院国家天文台人工智能组基于通义千问开源模型开发了新一代天文大模型“星语3.0”,大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义大模型支持的新型矿山重大风险识别处置系统,这是大模型在矿山场景的首次规模化落地。


本文转载自互联网,如有侵权,联系删除

本文地址:http://jzyqby.com/post/3758.html

相关推荐

兴业银行今日股价分析报告

兴业银行今日股价分析报告

本文将对兴业银行今日股价进行深入研究,探讨其背后的原因和趋势,通过对兴业银行的基本面、技术面和市场环境等方面的分析,我们可以得出一些有价...

每日财经 6小时前 0 2

广发证券股票行情分析

广发证券股票行情分析

本文将对广发证券的股票行情进行全面的分析,包括其历史表现、当前走势、行业地位、财务状况以及未来展望等方面,通过对这些方面的深入研究,我们...

每日财经 6小时前 0 1

中兴通讯股份股票

中兴通讯股份股票

中兴通讯股份有限公司(以下简称“中兴通讯”)是中国最大的通信设备制造商之一,全球市场份额约占中国市场的20%左右,中兴通讯股票是深圳证券...

每日财经 7小时前 0 1

中材节能股票股吧

中材节能股票股吧

中材节能股票投资机遇与挑战随着环保意识的日益增强和能源资源的日益紧缺,节能降耗已成为社会发展的重要任务,中材节能作为一家专业的节能技术公...

每日财经 7小时前 0 2

发布评论