华为的盘古ai大模型是华为云推出的一项人工智能技术。该大模型以"AI for industries"为核心理念,包含了多个领域的大型模型,包括自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、预测大模型和科学计算大模型。
华为盘古AI大模型的目标是建立一个通用且易用的人工智能开发工作流,以赋能更多的行业和开发者,实现人工智能的工业化开发。它已经在煤矿、铁路、气象、金融、代码开发、数字内容生成等领域发挥作用,提升生产效率并降低研发成本。
华为盘古AI大模型的具体细节和技术实现可能需要进一步了解华为云的相关资料和文档。
华为开发者大会2023(HDC.Cloud 2023:华为开发者大会2023_HDC.Cloud2023-华为云 (huaweicloud.com)
一、盘古大模型是干什么的?
3.0 版的盘古大模型是一个面向行业的大模型系列,具有「5+N+X」三层架构:从 AI 能力的基础层,到行业的第二层,再到应用层面向场景的各个接口,华为围绕深耕行业面向开发者持续打造了新的竞争力。
华为盘古大模型
第一层 L0 层:是盘古的 5 个基础大模型,包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,它们提供满足行业场景的多种技能。
第二层 L1 层:是 N 个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等;也可以基于行业客户的自有数据,在盘古的 L0 和 L1 上,为客户训练自己的专有大模型。
第三层 L2 层:是为客户提供更多细化场景的模型,它更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。
二、盘古大模型申请入口:
盘古大模型申请已经开放,用户可以进入盘古大模型官网申请体验,下面是申请入口:https://pangu.huaweicloud.com/
盘古大模型3.0申请地址:https://pangu.huaweicloud.com/
三、盘古AI大模型主要模型:
1、盘古NLP大模型
盘古NLP大模型可用于内容生成、内容理解等方面,并首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。在下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。
2、盘古CV大模型
盘古CV大模型可用于分类、分割、检测方面,也是首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力。基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。
3、盘古多模态大模型
盘古多模态大模型融合语言和视觉跨模态信息,实现图像生成、图像理解、3D生成和视频生成等应用。优势在于原生支持中文,拥有更佳中文理解能力。
4、盘古预测大模型
面向结构化数据,基于神经网络Transformer架构,可用于工艺指标预测、销售预测、财务异常检测等应用场景。
5、盘古科学计算大模型
面向气象、医药、水务、机械、航天航空等领域,使用AI模型更快更准的解决科学计算问题。
6、盘古气象大模型
盘古气象大模型实现气象预报精度首次超过传统数值方法,速度提升1000倍,提供秒级天气预报,例如重力势、湿度、风速、温度,气压等变量的1小时-7天预测。国际顶级学术期刊《Nature》正刊北京时间7月6日发表了华为云盘古大模型研发团队独立研究成果——《三维神经网络用于精准中期全球天气预报》
7、盘古药物分子大模型
华为云盘古药物分子大模型,赋能药物研发的全链条任务,旨在帮助医药企业机构显著提升药物研发的效率。
四、盘古大模型有什么用?
华为云盘古大模型3.0已在煤矿、铁路、气象、金融、代码开发、数字内容生成等领域发挥作用,提升生产效率、降低研发成本。
华为云盘古大模型的核心定位是为各行各业进行赋能,分为三个层级:L0、L1、L2。不同的层级对应着人工智能深入到行业中的不同阶段,而在未来,一定是AI为垂直行业带来新的变革。
盘古大模型本质是解决传统AI开发的难题,包括作坊式开发、样本标注、代价大、模型维护困难、模型泛化不足、行业人短缺等难题。数据显示,2022年华为云盘古大模型主要在做AI for Industries(AI 赋能产业),例如视觉大模型已经在工业质检、缺陷检测、电力巡检等100多个场景得到验证。