您的位置：首页 > 快讯 >

全球今日报丨ChatGPT的挑战者：大模型的“安卓时刻”

来源：方正证券研究所 • 2023-03-31 18:28:11

一、开源“大语言模型”龙头：Meta-LLaMA 。

1)开源大语言模型龙头：LLaMA模型发布，可能会加速大型语言模型的开放；

(资料图片仅供参考)

2) LLaMA开发团队：Meta AI首席AI科学家为YannLeCun；

3) Meta大模型演变：Meta迄今为止开源过三个大模型(OPT、OPT-IML、 LLaMA)；

4) LLaMA的项目地址&预训练数据集：在发布时，Meta 表示LLaMA 可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者；

5)开源模型比较：开源模型中LLaMA的使用量位居前列，且有大量基于LLaMA的项目出现；

6)微调版LLaMA—Alpaca:指令遵循语言模型Alpaca羊驼，是Meta开源的LLaMA 7B模型上进行微调得到，产生了以低得多的成本(不到500美元)获得的52K指令。

二、ChatGPTvs LLaMA:参数& 效果。

1)模型参数：LLaMA-13B的性能优于GPT-3，体积却小了10倍以上；

2)算力成本：LLaMA模型在同等规模下训练算力需求更大，开源后有更多的开发者可以在更小的显卡上更快地运行使用LLaMA；

3)效果比较：“常识推理”略优于GPT-3，语言理解能力高于GPT-3弱于PaLM，社会偏见评测上，LLaMA模型与另外两个模型相比略胜一筹，编程能力和 ChatGPT 还有一些差距。

三、安卓&SD经验：开源如何提高大模型水平。

1)大语音模型开源后的两种开发方向：模型结构调整和在模型基础上微调；

2)模型基础上微调分为两种情况：微调和领域数据微调；

3)复盘iOS和安卓的竞争：安卓系统凭借开源，被诸多手机厂商所采用；

4)Stable Diffusion开源效果：StableDiffusion的开源属性使得用户自发丰富模型生态，使得大量用户进入。

四、投资建议：

1、大模型：国内大模型或迎来井喷

1.1 大模型，随着开源的成熟，大厂均有望通过迭代做成自己的大模型(通过开源模型进行调整或者数据包)：百度、腾讯、360、昆仑万维(之前就参与到开源模型领域)

1.2 大模型需要的训练要素

1.2.1 算力需求，大模型门槛降低后，涌入大模型赛道的公司有望迎来井喷：芯原股份(GPU设计)、寒武纪和景嘉微

1.2.2 数据需求：中国科传(高质量科学数据，参股万方)、海天瑞声

2、应用：开源大模型或带来国内应用百花齐放

2.1 AI娱乐游戏应用：海外有软件产品能接ChatGPT，类似汤姆猫接入ChatGPT.游戏出海公司标的有三七互娱、宝通科技、巨人网络、汤姆猫、盛天网络、神州泰岳、姚记科技、吉比特、恺英网络和完美世界；数字人标的：蓝色光标、三人行、捷成股份。

2.2 AI办公类应用：万兴科技、彩讯股份(邮箱)、福昕软件(PDF)、金山办公(WPS)

3、大模型入口：

3.1 AI入口型应用：

3.1.1 海外有硬件产品，能接ChatGPT，类似于Siri接入ChatGPT API接口。智能音箱标的：百度、小米、国光电器、漫步者；目前是白牌最好的时间，海外巨头的产品不会接入ChatGPT.

3.1.2 软件产品：有声读物。中文在线、掌阅科技

（文章来源：方正证券研究所）

关键词：