Page 20 - 网络电信2024年10月刊
P. 20

运营商专栏

划。在组网方面,应充分考虑与东部热点地区的网络通道,长                                     OL].[2024- 01-20].https://arxiv.org/abs/2403.15796.
远规划集群内组网,并慎重考虑广域跨集群训练的可行性。最                                           [5]Ray T.Gen AI training costs soar yet risks are poorly
后,智算中心的运维管理应具备算网存统一运维能力,提供资
源管理、性能监控、告警监控等功能,以支持大模型的高效运                                     measured,says Stanford AI report[EB/OL].[2024-01-20].
行。                                                              https://www.zdnet.com/ article/gen-ai-training-costs-soar-
                                                                even-as-risks-are-poorly- measured-says-stanford-ai-report/.
      本文的分析和建议旨在为运营商智算中心的规划和建设提
供参考,推动人工智能技术的进一步发展。                                                   [6]李国杰.大数据与计算模型[J].大数据,2024,10(1):
                                                                9-16.
参考文献:
                                                                      [7]LENNART,SEVILLA J,HOBBHAHN M,et al.Estimating
      [1]舒文韬,李睿潇,孙天祥,等.大模型语言模型:原理、实                             training compute of deep learning models[EB/OL].[2024-01-
现与发展[J].计算机研究与发展,2024,61(2):351-361.                            20].https://www.alignmentforum.org/posts/HvqQm6o8KnwxbdmhZ/
                                                                estimating-training-compute-of-deep-learning-models.
      [2]KAPLAN J,MCCANDLISH S,HENIGHAN T,et al.Scaling laws
for neural language models[EB/OL].[2024-01-20].https://               [8]冯杨洋,汪庆,谢旻晖,等.从BERT到ChatGPT:大模型训
arxiv.org/abs/2001.08361.                                       练中的存储系统挑战与技术发展[J].计算机研究与发展,2024,61
                                                                (4):809-823.
      [3]HOFFMANN J,BORGEAUD S,MENSCH A,et al.Training
compute-optimal large language models[C]//Proceedings of the          [9]Stanford University Human-Centered Artificial
36th International Conference on Neural Information Processing  Intelligence. Artificial intelligence index report 2023[R/
Systems.Red Hook:Curran Associates Inc.,2024:30016-30030.       OL].[2024-01-20].https://aiindex.stanford.edu/wp-content/
                                                                uploads/2023/04/HAI_AI-Index- Report_2023.pdf.
      [4]DU Z X,ZENG A H,DONG Y X,et al.Understanding emergent
abilities of language models from the loss perspective[EB/            [10]殷凯凯.基于电信运营商视角的智算中心规划建设关键要点
                                                                分析及建议[J].现代信息科技,2024,8(1):22-27.

                     中国移动发布九天善智多模态基座大模型及30款自研行业大模型

      10月12日,在第12届中国移动全球合作伙伴大会主论坛上,中国移动发布九天善智多模态基座大模型,并推出30款自研行业
大模型。

      本次发布的九天善智多模态基座大模型是九天系列通用大模型的最新研发成果,模型四大功能显著提升:一是长文本智能化
解析,支持超十万字的文本理解,从多份文档中自动分析提炼关键信息,准确解析信息背后的核心观点,最终实现图文并茂、逻辑
严谨的专业报告,可高效提升信息处理及决策效率;二是全双工语音交互,支持多种方言翻译,用户随时打断的情况下也可保持连
贯性和一致性,精准解答用户问题,智能识别客户意图和情绪,生成个性化回复,可广泛应用于智能客服及个人助理等场景,为用
户带来全新的交互及服务体验;三是视频与图像处理的双重飞跃,通过少量提示词即刻创作出高质量、高清晰度、高创意性的图片
与视频,对于细节的精准捕捉、复杂的视角构图、光线与光影的准确运用、东方美学的理解表达可媲美专业级摄影水平,让创意触
手可及;四是结构化数据的深度洞察,支持大规模多类型结构化数据分钟级处理分析,具备复杂数据理解和逻辑推理能力,全面支
持分类、回归、预测、异常检测等行业领域典型任务,在零样本或少样本情况下即可实现跨域应用,服务复杂系统智能化,为业务
决策提供前瞻性依据,推动产业向着更加智能化的方向发展。

      九天善智多模态基座大模型多项关键技术指标达到业界领先水平,语音合成技术在INTERSPEECH全球顶赛中荣登榜首,多任务
语言理解能力在权威BBH榜单上名列第二,图像内容理解对话和视频内容理解对话分别在MME-P榜单和MVBench榜单位列第三名,文
生视频能力在VBench榜单位列亚军。在这些优秀能力的背后,是中国移动的特有技术积累。一是自主创新,九天善智多模态基座大
模型是以长期深厚技术积累为依托,自主训练的生成式人工智能大模型,实现了大模型数据构建、预训练、微调、推理等全链路核
心技术自主创新;二是全栈国产化,九天善智多模态基座大模型是基于万卡国产算力集群和国产算法框架训练的全栈国产化全模态
基座模型,适配了11个厂家17款国产AI芯片,支持模型在异构芯片间的平滑转化和续训;三是体系化AI原创技术,面向日益丰富的
智能化业务需求,依托算力网络禀赋优势,在开放环境中可实现AI能力的灵活高效配置、调度、训练和部署;四是复杂系统智能化
能力,对于通信、能源等重点行业的关键生产、管理、运营环节,可深度理解复杂业务逻辑,将智能与行业应用进行有机深度融合。

      为促进国民经济智能化转型升级,基于九天系列通用大模型,中国移动深入金融、交通、能源、制造等10+个行业,全自研
30+横跨多领域的行业大模型,推动基于大模型的规模化行业应用蓬勃发展,加快形成面向经济社会各领域的赋能辐射圈。目前,
九天海算政务大模型已与黑龙江合力打造全国首例政务领域综合搜索平台;九天医疗大模型已在协和医院、广州120等龙头机构落
地部署。同时,中国移动正与中国石油联合打造昆仑大模型,助力能源化工行业AI+转型。

22 网络电信 二零二四年十月
   15   16   17   18   19   20   21   22   23   24   25