Page 16 - 网络电信2024年7月刊

P. 16

3.2 算法要素分析理数据等敏感信息的安全和隐私。大模型算力体系是一个集计
大模型算法目前正面临着开源和闭源之争。OpenAI在算、存储、网络和管理于一体的综合体系，支持大模型的训练
ChatGPT2发布之后选择了闭源发展，而Facebook母公司Meta于和推理。通过高性能的计算服务器集群、存储系统、高带宽、
2023年7月18日表示，将发布其开源大模型Llama的商用版本，低延迟的网络互联、日渐完善的管理和监控系统以及安全和隐
为初创企业和其他企业提供了一个强大的免费选择，以取代私保护机制，可以实现高效、安全、可靠的大模型训练和推
OpenAI和谷歌出售的昂贵专有模型。国内阿里云、智谱和清华理。
EKG、百川智能等选择开源，阿里云公布1+4开源战略，推出大
模型方向的开源新势力魔搭GPT。开源生态有助于大模型的繁 3.4 生态体系要素分析
荣，但华为的盘古大模型为了其数据隐私和商业收益选择闭国内大模型中，参与主体站位于架构层、模型层和应用层
源。 3种不同层级。首先，架构层的进入门槛是最高的，需要具备

表1 国内外大模型数据集分析

3.3 算力要素分析设计4D混合并行策略能力以及并行策略与智算硬件协同，功能
大模型的算力体系是指为实现大模型训练和推理而构建的有点类似大模型基础设施，主要参与对象是各大云计算厂商；
计算资源和基础设施体系，由5个部分组成。其次，模型层的一大重点是基础大模型，对算力、算法、数据
(1）计算服务器集群。大模型算力体系的核心，由大量高和人才的要求非常高，一般的创业公司资金与能力都达不到，
性能的计算服务器组成。所以部分公司选择在基础大模型之上做一些微调，有针对性地
(2）存储系统。模型参数、训练数据和推理数据等需要一推出行业大模型；最后，应用层是基于前两类大模型再调用
个强大的存储系统进行存储。 API开发应用，这是大部分创业公司能做的事。如大众所熟知的
(3）网络互联。用来实现计算服务器之间的数据传输与通 ChatGPT，其实是OpenAI对GPT-3.5微调后开发出来的对话机器
信。人应用。
(4）管理和监控系统。用来实现对计算服务器、存储系
统及网络互联的监控和管理，可以发挥实时的性能监控资源分科技公司在布局时，往往会采用交叉覆盖三大层级的方
配、故障诊断和任务调度等功能。式。基础做法是先发布通用大模型或行业大模型底座，其他公
(5）安全和隐私保护。用来保护模型参数、训练数据及推司会利用这些基础大模型，再结合自身拥有的行业数据微调出
属于自己的大模型应用。有野心的头部企业实现架构层和模型

网络电信二零二四年八月 13

11 12 13 14 15 16 17 18 19 20 21