阿里云“通义”大模型家族扩容 剑指“大模型自由市场”

正在上海举行的2023年WAIC(世界人工智能大会),参展企业数量、展览面积创下历届之最。超400家企业集中展示包括大模型、芯片、机器人、智能驾驶等领域的最新科技成果,ChatGPT大热引发的“百模大战”也在继续。


(资料图片)

《中国经营报》记者了解到,包括百度文心一言、科大讯飞星火认知大模型、华为云盘古大模型、阿里云通义千问、京东云言犀大模型、清华大学ChatGLM、360智脑大模型等10余家厂商研发的基础应用大模型,都将集体亮相WAIC。

WAIC同时也是新产品与新技术的秀场。7月7日,在2023世界人工智能大会上,阿里云宣布AI绘画创作大模型“通义万相”开启定向邀测。这是继大语言模型“通义千问”、聚焦音视频内容的“通义听悟”之后,阿里云通义大模型家族的又一位新成员。

该模型可辅助人类进行图片创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团CTO周靖人表示,这是阿里云大模型全面掌握多模态能力的关键一步,该能力将逐步向行业客户开放。

“通义万相”亮相

周靖人在现场演示了“通义万相”如何通过语言文字生成图片。

当输入“沉浸在全页灰度涂色的迷人世界中,有一只老虎在曼陀罗宁静的森林中,画面采用线条、笔画”后,系统能迅速生成线条细节丰富的老虎图片,如果继续使用风格迁移功能,还可随意切换图片风格。

据阿里云方面介绍,“通义万相”将首批上线3大能力:在基础文生图功能中,可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D卡通和素描等风格图像;在相似图片生成功能中,用户上传任意图片后,即可进行创意发散,生成内容、风格相似的AI画作;该模型还在业内率先支持图像风格迁移,用户上传原图和风格图,可自动把原图处理为指定的风格图。

据了解,“通义万相”基于阿里研发的组合式生成模型Composer,其可通过对配色、布局、风格等图像设计元素进行拆解和组合,提供高度可控性和极大自由度的图像生成效果,仅需一个模型即可支持多类图像生成类任务能力。

在去年的世界人工智能大会上,阿里云“通义”大模型系列首次亮相,在此之后,“通义千问”“通义听悟”等模型和产品相继推出,“通义万相”的问世意味着阿里云在大模型领域已经具备处理或生成文本、语音和图片等模态的能力。目前,阿里云大模型正逐步走进千行百业,已有超过30万家企业申请测试“通义千问”,“通义听悟”累计用户数达到36万人。

“多模态是大模型演进的必然路径,我们希望用不同模态的能力服务千行百业,帮助企业全面拥抱智能化时代。”周靖人表示。

意在“大模型生态”

不过加速发力大模型只是阿里云发力大模型的A面,作为硬币的另一面,搭建大模型生态,吸引更多的玩家进入,使其成为生态底座,显然是更大的市场。

“找大模型上魔搭,我们将努力把魔搭社区培育成中国最大的‘大模型自由市场’。”周靖人在WAIC上广撒“英雄帖”。

“阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。”周靖人在演讲中还明确表示。

据周靖人介绍,在开发者生态层,阿里发起的AI模型社区魔搭集聚了180多万名AI开发者和900多个优质AI模型。模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等(排名不分先后),贡献了30多个10亿以上参数规模大模型。

据阿里云方面介绍,在魔搭这个自由市场,所有模型生产者都可上传模型,验证模型的技术能力,探索模型的应用场景和商业化模式。魔搭社区打通了与灵积平台的部署链路,支持社区的模型通过灵积平台来实现服务化。

值得注意的是,大模型的“国家队”也在本届WAIC上诞生。

据2023世界人工智能大会的最新消息,国家标准委指导的国家人工智能标准化总体组宣布我国首个大模型标准化专题组组长,由上海人工智能实验室与百度、华为、阿里等企业联合担任,现场进行了证书颁发,并正式启动大模型测试国家标准制订工作。这意味着百度、华为、阿里等入局了“大模型国家队”。

据悉,国家人工智能标准化总体组设立大模型专题组时,要求组长单位需要在大模型理论研究和产业应用等方面具有较高专业水平,熟悉该领域国际前沿科技发展态势、法规制度与标准规范等。牵头起草过国际、国家或行业标准,具有在主要国际组织或标委会中有大模型标准化相关工作经验的优先。

(文章来源:中国经营网)

关键词: