商汤大语言模型应用“商量SenseChat”即日起全面向广大用户开放服务
(相关资料图)
8月31日,商汤科技日日新大模型旗下自然语言应用“商量SenseChat”正式面向广大用户开放服务。
商汤“商量SenseChat”今年4月正式推出,是国内最早的基于千亿参数大语言模型之一,并不断迭代更新。目前,基模型为商汤联合多家国内顶级科研机构发布的书生·浦语InternLM-123B,拥有1230亿参数,在语言、知识、理解、推理和学科五大能力上均处于行业领先水平,并在全球51个知名评测集(包括MMLU,AGIEVAL,ARC,CEval,Race,GSM8K等)共计30万道问题集合上测试成绩整体排名全球第二,超过GPT-3.5-turbo以及Meta新发布的LLaMA2-70B等模型,在主要评测中12项成绩超越GPT-4,排名第一。
商量SenseChat背后依托商汤AI大装置SenseCore,其上线GPU数量由2023年3月底的27000块提升至日前的约30000块,算力规模提升20%至6ExaFLOPS,可有效支持语言大模型的训练、升级迭代和服务。
在训练数据方面,商汤每月可产出约2万亿token的高质量数据,支持更加强大的基模型的训练,预计年底高质量数据储备将突破10万亿token。同时,商汤还投入了数百台服务器搭载千卡GPU的计算资源,采用算法结合人工的方法对原始语料数据进行分门别类的精细化清洗,以确保数据的质量、安全性和价值观都符合要求。
截至目前,商汤商量在金融、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作,通过提供多种灵活的API接口和服务,为客户提供大模型的各项AI技术和服务,低门槛、低成本、高效率地实现各类生成式AI应用。
商汤“日日新SenseNova”大模型体系和生成式AI产品系列,包括商量、秒画、如影、琼宇、格物,分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的生成式AI应用。未来,商汤将依托强大的基模型,以及在算力、数据、算法基础上的积累和丰富Know-how,持续升级商汤日日新大模型体系下的多种生成式AI产品,满足各类用户的需求。
(文章来源:证券日报)
关键词: