分析丨华为大模型计划如何应用到华为云之中? 当前信息
2023-06-16 21:31:04面包芯语

从算力上来看,云计算能够借助通用服务器和专属硬件为大模型提供更优化的计算资源的调度和管理,以保证良好的运力稳定性。

纵观国内已经入局大模型的大厂,无一不是在云计算领域有着超前技术优势的企业。

由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,目前已实现等AI场景落地。


(资料图片)

华为盘古大模型本质上是L0基础模型,在过往几年里也尝试在不同行业进行了落地应用。

华为云盘古大模型的核心定位是为各行各业进行赋能,分为三个层级。

L0是类似于GPT3这样的基础通用大模型;

L1是基础模型与行业数据结合进行混合训练后的行业大模型,已经发布了矿山、气象、药物、分子、电力、海浪、金融等行业的大模型;

L2是把L1再具体下游业务场景进行部署后生成的部署模型,如金融OCR模型、电力巡检模型等。

华为盘古Chat将于今年7月7日举行的华为云开发者大会上对外发布以及内测,产品主要面向To B/G政企端客户。

这意味着,在国产大模型军备竞赛中,继阿里、百度之后,又一重要科技巨头入局。

对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:

①模型要大,可以吸收海量数据;

②网络结构要强,能够真正发挥出模型的性能;

③要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。

①[鲲鹏+昇腾],打造盘古算力底座。

鲲鹏:华为自主芯片→鲲鹏芯片→鲲鹏服务器→欧拉操作系统→高斯数据库→行业应用向外扩张,构建鲲鹏生态,提供算力支撑。

昇腾:昇腾AI处理器→CANN异构计算架构→MindSpore AI框架→应用使能→行业应用,助力打造华为昇腾全栈AI软硬件平台,构筑智能世界基石。

②MindSpore高效易开发,可实现全场景覆盖。

CANN:作为华为昇腾AI基础软硬件平台的核心,CANN向上支持多种AI框架,向下服务AI处理器与编程,助力芯片使能。

MindSpore:是国内首个支持千亿参数大模型训练AI计算框架,最佳匹配昇腾处理器算力。

③ModelArts强势赋能开发者,精度效率双提升。

为机器学习与深度学习提供海量数据预处理及交互式智能标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力。

华为整体业务的核心进化逻辑,是将数字化转型过程中积淀的技术、工具与经验,以云服务的形式开放、输出、赋能给全行业。

数字化既是华为业务发展的驱动力,也是华为当下的战略前进方向。

以云业务为例,政企云的个性化定制需求,决定了它无法大规模复制。

华为云是最早意识到,政企云需要的不仅是技术和资源,更有经验服务背后的超强战略意志。

对应华为云盘古大模型的一系列更新,可以预想,华为云若是加入这场[百模大战,依旧是继续To B专注行业市场,做产业化升级,而不是To C。

华为云没理由再去无限制地开放盘古大模型给C端市场,既不安全,也很难带来真正意义上的生产模式颠覆和生产力释放。

华为云盘古大模型沉淀了大量丰富的行业应用实践,覆盖矿山、气象、医药、能源、金融等等重点领域,并打造出了诸多垂直类的行业大模型。

如盘古矿山大模型、盘古气象大模型、盘古海浪大模型等。

华为云有着庞大的行业伙伴生态,走To B的行业路径,能高效带动其他生态伙伴参与到大模型升级中。

尽管盘古大模型在中文语言的处理方面具有很高的准确度和质量,但在语义理解方面仍存在一定的局限性,尤其是在处理复杂的语言结构和语义推理方面。

同时,盘古Chat大模型也将面临着行业激烈的竞争压力,需要不断优化和提高模型的性能和质量,才能以保持在市场中的领先地位。

部分资料参考:锌产业:《华为大模型,亟需回到大众视野》,: 壹零社:《华为AI大模型“盘古”究竟有多强》,财联社:《首个多模态千亿AI大模型上线在即,产业链上市公司一览》,新摘商业评论:《华为大模型要为华为云铺路》

关键词:

下一篇: 最后一页
上一篇: 缉毒警20秒抓获正在交易毒贩

相关新闻

热搜榜