当前位置: 首页 >  资讯  >  正文

首个全模态大模型将登场!华为昇腾“朋友圈”曝光
2023-06-14 09:32:01 电脑报


(资料图片仅供参考)

01

华为大模型创新中心来了

人工智能框架生态峰会2023即将在上海召开,本届峰会由上海临港经济发展(集团)有限公司、上海人工智能研究院、昇思MindSpore开源社区联合举办。根据已披露的议程,三大要点备受关注:华为首次正式官宣昇思AI框架&大模型创新中心启动暨伙伴入驻仪式;共建AI开源生态,宣布昇思MindSpore社区理事会成立;全球首个全模态大模型紫东太初2.0正式登场。AI框架类似Windows、安卓一般,是“AI领域的操作系统”,所有人工智能的算法及应用都要通过AI框架进行训练与部署。目前谷歌的TensorFlow,和Meta的PyTorch两款AI框架走在前面。昇思MindSpore基于昇腾系列处理器,是华为在2020年开源的新一代全场景AI框架,也是华为盘古大模型的底层AI框架。据华为介绍,其着重提升易用性并降低AI开发者的开发门槛,可以实现数据模型的训练-推理-全场景部署,大到地球系统模拟、自动驾驶,小到蛋白质结构预测,统统都可以通过昇思MindSpore实现。据媒体报道,截至5月,昇腾已经协助搭建超过30个主流国产大模型建设,且已有25座城市基于昇腾技术建立了人工智能计算中心,其中14座已经开始正常运营且运转稳定。今年5月,华为昇腾计算业务总裁张迪煊表示:“昇腾AI”基础软硬件平台已孵化和适配了30多个主流大模型,我国一半以上的原生大模型是基于“昇腾AI”基础软硬件平台打造,包括鹏程系列、紫东系列、华为云盘古系列等。目前,华为云盘古大模型重点聚焦AI在工业领域的应用,有望赋能工业场景,提升智能化水平,帮助实现降本增效。建议关注华为产业链相关厂商,以及在工业领域有优质数据积累的厂商.昇思拥有完善的生态伙伴体系与强大的“朋友圈”。基于昇思MindSpore AI框架,中科院自动化所、武汉大学等科研单位先后发布业界首个图文音三模态大模型“紫东.太初”、全球首个智能遥感框架“武汉.LuoJia”、业界首个基于扩散模型和最大开源中文数据集生成的中文生图大模型“悟空.画画”等多个大模型。

02

全球首个全模态大模型将登场

紫东太初2.0大模型便是基于华为全栈国产化软硬件平台昇腾AI与昇思MindSpore,由中国科学院自动化研究所和武汉人工智能研究院联合打造。在文本、图片、音频的基础上,“紫东太初” 2.0可融入3D、视频、传感信号等更多模态数据,并优化语音、视频和文本的融合认知以及常识计算等功能,进一步突破感知、认知和决策的交互屏障。“模态”即大模型可以处理的数据类型,可以理解为机器感知方式,模态越多,就能让AI以更接近人类的方式理解这个世界。目前在多模态大模型方面,Meta走在前列,其最新6模态大模型ImageBind以视觉为核心,结合文本、声音、深度、热量(红外辐射)、运动(惯性传感器),最终可以做到6个模态之间任意的理解和转换。而紫东太初1.0仅仅是三模态大模型,可利用文本、图片、音频三种模态数据进行跨模态的统一表征和学习,可以预见的是,紫东太初2.0这样的全模态大模型是通向通用人工智能道路上必不可少的一步。

03

AI大模型风口下的算力需求

AI大模型掀起新一轮人工智能应用热潮。百度、腾讯、华为、阿里等互联网巨头均发布了AI大模型产品,我国AI大模型产业化发展加速。科技部新一代人工智能发展研究中心日前发布的《中国人工智能大模型地图研究报告》显示,目前,中国和美国研发的大模型数量占全球总数的80%以上。其中,中国10亿参数规模以上的大模型已发布79个。AI大模型应用规模呈爆发式增长,算力则体现了数据处理能力的强弱。随着国内外厂商加速AI大模型训练,接入用户数量激增,算力需求将迎来井喷。百度在一季度财报电话会议上称,截至一季度末,超过300家生态伙伴参与“文心一言”内测。“全球AI训练所需的计算量呈指数级增长。”华为昇腾计算业务CTO周斌在2023中关村论坛上告诉中国证券报记者,大约每隔4个月,AI计算需求会翻倍。据广发证券分析师李雪峰等人测算,随着国内生成对话式AI产品加速推广,在乐观假设下,国内AI大模型在训练与推理阶段或产生相当于1.1万台至3.8万台高端AI服务器的算力需求。以英伟达单片A100 GPU产品售价10万元、AI加速卡价值量占服务器整机约70%计算,则对应126亿元至434亿元增量AI服务器市场规模。在如此庞大的市场刚需下,AI大模型无疑会成为整个科技生态未来很长一段时间里的核心。编辑|张毅审核|吴新

热门推荐