您的位置:首页 >> 行业研究 >> 文章正文

计算机行业点评报告:通义千问开源千亿模型,中文大模型生态加速发展

加入日期:2024-5-13 17:54:12

  顶尖财经网(www.58188.com)2024-5-13 17:54:12讯:

(以下内容从开源证券《计算机行业点评报告:通义千问开源千亿模型,中文大模型生态加速发展》研报附件原文摘录)
事件:阿里云发布通义千问2.5并开源千亿参数大模型
(1)2024年5月9日,阿里云正式发布通义千问2.5。相比上一版本,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。在中文语境下,文本理解、文本生成、知识问答&生活建议、闲聊&对话、安全风险等多项能力赶超GPT-4。
(2)2024年4月28日,阿里通义千问团队开源千亿级参数模型Qwen1.5-110B,是Qwen1.5系列中规模最大的模型,支持32K tokens的上下文长度,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。
通义千问坚持开源路线,110B参数版本对标Meta-Llama-3-70B
通义千问于2023年4月正式发布,于2023年8月开源。通义千问坚持“全模态、全尺寸”的开源路线,陆续推出十多款开源模型,包括0.5B至110B的八款大语言模型,以及视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。大语言模型方面,小尺寸模型(0.5B、1.8B、4B、7B、14B参数)支持在手机、PC等端侧设备部署,阿里云携手MediaTek,1.8B和4B参数大模型可在天玑9300移动平台部署;大尺寸模型(72B、110B参数)支持企业级和科研级的应用。最大参数版本的Qwen1.5-110B基础能力对标Meta-Llama-3-70B,在MMLU、TheoremQA、GPQA等基准测评中超越Meta的Llama-3-70B;在HuggingFace的开源大模型排行榜Open LLMLeaderboard上,Qwen1.5-110B冲上榜首。
生态伙伴持续扩容,大模型应用持续落地
根据阿里云数据,通义模型通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,下载量已经超过700万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。目前已有中国一汽、新东方、长安汽车、微博、众安保险、完美世界、小米等企业宣布接入通义大模型,生态伙伴持续扩容。此外,阿里云还推出百炼大模型平台,率先兼容LlamaIndex等开源框架,提供一站式、全托管的大模型定制与应用服务,支持大型企业和成熟开发者的需求,阿里云与通义千问共同加速大模型应用落地。
投资建议
持续看好AI投资机会。(1)AI算力领域,推荐中科曙光神州数码淳中科技、海光信息、软通动力、卓易信息中国软件国际、浪潮信息,受益标的包括寒武纪紫光股份景嘉微广电运通高新发展烽火通信拓维信息等;(2)AI应用推荐金山办公科大讯飞同花顺三六零鼎捷软件普元信息彩讯股份焦点科技拓尔思上海钢联致远互联等,受益标的包括汉王科技泛微网络、汉仪股份、润达医疗新致软件福昕软件万兴科技汉得信息等,(3)AI监管领域,受益标的包括美亚柏科、永信至诚、人民网等。
风险提示:AI落地不及预期;市场竞争加剧风险;公司研发不及预期风险。





编辑: 来源: