此前市场有消息称华为大模型“盘古Chat”已申请相关商标,将于7月7日发布,而华为官方表示不会有“盘古Chat”此类命名。
jB^OP1 4DO/rtkVq 华为轮值董事长胡厚崑出席参加了今日2023世界人工智能大会开幕式并发了表演讲。他表示:华为将在7月7日的华为云开发者大会上推出盘古大模型3.0。
.Nx
W=79t _#qe# 据介绍,从通用大模型走向行业大模型。基础大模型,行业大模型,场景模型。盘古大模型已经深耕行业10+,业务场景400+。
-lRhz!E] gw3NS8
A+ eE/%6g F}rPY: 他表示,去年年底ChatGPT的出现,把人工智能推向了新的风口。人工智能将帮助我们改写身边的一切。
c! H 9yk "t&{yBQ0u 他介绍了华为在人工智能方面的布局,在深耕算力方面实现了架构创新、发展生态、共建算力;在架构创新上重新定义计算架构,对等平构架构节点性能提升30%,昇腾AI集群效率提升10%。
f'dK73Xof ^4`&EF 此外,华为在发展生态上还联合5700+鲲鹏/昇腾合作伙伴,以及硬件合作伙伴30+,实现了国内大模型近一半创新使能,包括场景化系列AI硬件100+,孵化/适配大模型30+,鲲鹏/昇腾开发者380万+。
CYB=Uq, O
rk 在共建算力方面,他表示华为已经在构建城市算力基础设施,帮助各地政府打造了25个昇腾人工智能计算中心。
bv\ A,+ LnMwx#^* 华为盘古系列基础大模型于2021年正式对外发布,包括NLP(自然语言处理)、CV(机器视觉)和科学计算大模型;后续又发布了矿山、药物分子、气象、海浪等行业大模型。
jgvh[@uB? 6|;0ax4:P 据介绍,NLP是首个千亿参数中文预训练大模型,CV大模型则首次达到30亿参数。盘古CV大模型业界最大CV大模型、首次实现兼顾判别与生成能力、在ImageNet上小样本学习能力上的业界第一;盘古气象大模型提供秒级天气预报;紫东.太初是全球首个图、文、音三模态大模型。
hZNEv| )hL^+Nn bR d0C8*ifFO 2Yyb#Ow 对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
3GmK3uM {>.>7{7 华为云官网显示,盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等等。
T~Y g5J ":&|[9/ rqvU8T7A YbvX$/zGu 华为表示,盘古NLP大模型由华为云、循环智能和鹏城实验室联合开发,具备领先的语言理解和模型生成能力:在权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,向人类水平(85.61)迈进了一大步。
^L~ [+| *t=i 具体来看,盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配,这一模型在智能舆论以及智能营销方面都有不错的表现。
PbUI!Xqe` \3 KfD'L