DeepSeek算力卡脖子,高校AI研究遇瓶颈?华为联合15校给出解法
来源:本站原创 浏览:161次 时间:2025-02-14
梁文峰说,钱从来都不是问题,唯一担心的是缺算力。不过,基于国产昇腾算力的DeepSeek R1系列推理API,性能已经直接对标高端GPU了!而且,华为已经率先携手国内15所头部高校,打造出了独一份的科教创新卓越/孵化中心,通过产教融合、科教融汇破解高校科研的算力困局。
全美TOP5高校的机器学习博士,实验室却连一块能够提供大量算力的GPU都没有?
2024年中旬,一位网友在reddit上发的帖子,立刻引发了社区大讨论——
图片
年底,Nature的一篇报道更是揭露了学术界在GPU获取上面临的严峻挑战——研究者竟然需要排队申请学校GPU集群的使用时间。
图片
同样,在我国高校的实验室内,GPU严重匮乏的问题也很普遍。甚至还曾曝出过大学要求学生自备算力上课这样十分离谱的新闻。
可见,「算力」这个瓶颈,甚至让AI本身都变成了一件门槛极高的课程。
AI人才紧缺,且算力不足
与此同时,大模型、具身智能等前沿技术的迅猛发展,则正在全球范围内引发人才短缺。
根据牛津大学教授的计算,在美国,要求具备AI技能的工作岗位的比例增加了5倍。
放眼全球,技术人工智能(Tech-AI)的工作岗位增长了9倍,广义人工智能(Broad-AI)的工作岗位增长了11.3倍。
在这一时期内,亚洲的增长尤为显著。
虽然世界各地的大学都在试图帮助学生掌握关键的AI性能,但正如前文所说,算力如今已经成为了一种「奢侈品」。
为了弥合这一差距,企业与高校的合作便成了一个重要手段。
鲲鹏昇腾科教创新孵化中心,开启高校科研布局
好在,为了在我国高校培养起同样的创新体系,华为已经开始布局了!
现在,华为已经和北大、清华、上交、浙大、中科大这5所顶尖高校,共同签订了「鲲鹏昇腾科教创新卓越中心」的合作。
此外,华为也同步推进和复旦大学、哈尔滨工业大学、华中科技大学、西安交通大学、南京大学、北京航空航天大学、北京理工大学、电子科技大学、东南大学、北京邮电大学等10所高校,开展了「鲲鹏昇腾科教创新孵化中心」的合作。
卓越中心和孵化中心的成立,是产教融合的典范:
通过引入昇腾生态,弥补了高校的算力短缺,极大促进了更多科研成果的迸发;
通过改革课程体系,以科研课题、产业课题、竞赛课题驱动,来培养计算产业的顶尖人才;
通过攻坚体系架构、计算加速能力、算法能力、系统能力,力争孕育世界级的创新成果;
通过打造诸多「AI+X」交叉学科,引领智能化的生态发展。
为AI科研构建完全自主的国产算力
如今,AI for Science的意义,已经不言自明。
根据谷歌DeepMind的最新调查,每三位博士后研究员中就有一位使用大语言模型来协助完成文献综述、编程和文章撰写等工作。
而今年的诺贝尔物理学奖和化学奖,更是都颁发给了AI领域的研究人员。
可以看到,在AI赋能科研的过程中,GPU凭借着在这些对高性能计算有需求的领域里出色的性能,以及针对 LLM 训练和推理的强大能力,成为了弥足珍贵的「黄金」,遭到了微软、xAI、OpenAI等各大公司的疯抢。
然而,美国针对GPU的封锁,让我国在AI和科研领域的进展举步维艰。
为了跨越这道鸿沟,我们必须构建起自主完整的生态体系并将其发展壮大。
在算力层面,华为昇腾系列AI处理器承担起了重塑我国竞争力的重任。
而在算力之上,我们还需要有一个自研的计算框架去适配,以便充分发挥出NPU/AI处理器的优势。
众所周知,专为英伟达GPU而设计的CUDA架构,在AI和数据科学领域较为常见。
在国内真正与之抗衡的,实现替代的就只有CANN了。
作为华为针对AI场景推出的异构计算架构,CANN对上支持PyTorch、TensorFlow以及昇思MindSpore等业界主流AI框架,对下使能昇腾AI处理器,是提升昇腾AI处理器计算效率的关键平台。。
正因如此,CANN天生就在技术上拥有诸多优势。其中最为关键的,是对AI计算更深入的软硬结合优化以及更加开放的软件栈:
首先,它可以支持多种AI框架,包括自家的昇思MindSpore,以及第三方的PyTorch、TensorFlow等;
其次,它针对多样化应用场景,提供了多层次编程接口,支持用户快速构建基于昇腾平台的AI应用和业务;
而且,它还提供了模型迁移工具,方便开发者将项目快速迁移到昇腾平台。
目前,CANN已经初步构建起了自己的生态系统。在技术层面,CANN囊括了大量的应用、工具、库,拥有完善的技术生态,给用户提供了一站式的开发体验。同时基于昇腾技术底座的开发者队伍也逐步壮大,为未来的技术应用和创新埋下了沃土。
图片
在异构计算架构CANN之上,我们还需要AI模型搭建的深度学习框架。
几乎所有的AI开发者,都需要用深度学习框架,而且几乎所有DL算法和应用,也都要通过深度学习框架去实现。
如今市面上已有熟知的谷歌TensorFlow,以及Meta的PyTorch等主流框架,并且形成了巨大的生态。
迈入大模型训练的时代,深度学习框架更需要在面对数千台计算机规模时,进行有效训练。
2020年3月正式开源的全场景深度学习框架——华为昇思MindSpore,弥补了国内在这一领域的空缺,实现了真正的自主可控。
MindSpore具备云边端全场景部署、原生支持大模型训练、支持AI+科学计算等关键特性,构建了全场景协同且全流程极简的原生开发环境,加速了国内科研创新和产业应用。
全美TOP5高校的机器学习博士,实验室却连一块能够提供大量算力的GPU都没有?
2024年中旬,一位网友在reddit上发的帖子,立刻引发了社区大讨论——
图片
年底,Nature的一篇报道更是揭露了学术界在GPU获取上面临的严峻挑战——研究者竟然需要排队申请学校GPU集群的使用时间。
图片
同样,在我国高校的实验室内,GPU严重匮乏的问题也很普遍。甚至还曾曝出过大学要求学生自备算力上课这样十分离谱的新闻。
可见,「算力」这个瓶颈,甚至让AI本身都变成了一件门槛极高的课程。
AI人才紧缺,且算力不足
与此同时,大模型、具身智能等前沿技术的迅猛发展,则正在全球范围内引发人才短缺。
根据牛津大学教授的计算,在美国,要求具备AI技能的工作岗位的比例增加了5倍。
放眼全球,技术人工智能(Tech-AI)的工作岗位增长了9倍,广义人工智能(Broad-AI)的工作岗位增长了11.3倍。
在这一时期内,亚洲的增长尤为显著。
虽然世界各地的大学都在试图帮助学生掌握关键的AI性能,但正如前文所说,算力如今已经成为了一种「奢侈品」。
为了弥合这一差距,企业与高校的合作便成了一个重要手段。
鲲鹏昇腾科教创新孵化中心,开启高校科研布局
好在,为了在我国高校培养起同样的创新体系,华为已经开始布局了!
现在,华为已经和北大、清华、上交、浙大、中科大这5所顶尖高校,共同签订了「鲲鹏昇腾科教创新卓越中心」的合作。
此外,华为也同步推进和复旦大学、哈尔滨工业大学、华中科技大学、西安交通大学、南京大学、北京航空航天大学、北京理工大学、电子科技大学、东南大学、北京邮电大学等10所高校,开展了「鲲鹏昇腾科教创新孵化中心」的合作。
卓越中心和孵化中心的成立,是产教融合的典范:
通过引入昇腾生态,弥补了高校的算力短缺,极大促进了更多科研成果的迸发;
通过改革课程体系,以科研课题、产业课题、竞赛课题驱动,来培养计算产业的顶尖人才;
通过攻坚体系架构、计算加速能力、算法能力、系统能力,力争孕育世界级的创新成果;
通过打造诸多「AI+X」交叉学科,引领智能化的生态发展。
为AI科研构建完全自主的国产算力
如今,AI for Science的意义,已经不言自明。
根据谷歌DeepMind的最新调查,每三位博士后研究员中就有一位使用大语言模型来协助完成文献综述、编程和文章撰写等工作。
而今年的诺贝尔物理学奖和化学奖,更是都颁发给了AI领域的研究人员。
可以看到,在AI赋能科研的过程中,GPU凭借着在这些对高性能计算有需求的领域里出色的性能,以及针对 LLM 训练和推理的强大能力,成为了弥足珍贵的「黄金」,遭到了微软、xAI、OpenAI等各大公司的疯抢。
然而,美国针对GPU的封锁,让我国在AI和科研领域的进展举步维艰。
为了跨越这道鸿沟,我们必须构建起自主完整的生态体系并将其发展壮大。
在算力层面,华为昇腾系列AI处理器承担起了重塑我国竞争力的重任。
而在算力之上,我们还需要有一个自研的计算框架去适配,以便充分发挥出NPU/AI处理器的优势。
众所周知,专为英伟达GPU而设计的CUDA架构,在AI和数据科学领域较为常见。
在国内真正与之抗衡的,实现替代的就只有CANN了。
作为华为针对AI场景推出的异构计算架构,CANN对上支持PyTorch、TensorFlow以及昇思MindSpore等业界主流AI框架,对下使能昇腾AI处理器,是提升昇腾AI处理器计算效率的关键平台。。
正因如此,CANN天生就在技术上拥有诸多优势。其中最为关键的,是对AI计算更深入的软硬结合优化以及更加开放的软件栈:
首先,它可以支持多种AI框架,包括自家的昇思MindSpore,以及第三方的PyTorch、TensorFlow等;
其次,它针对多样化应用场景,提供了多层次编程接口,支持用户快速构建基于昇腾平台的AI应用和业务;
而且,它还提供了模型迁移工具,方便开发者将项目快速迁移到昇腾平台。
目前,CANN已经初步构建起了自己的生态系统。在技术层面,CANN囊括了大量的应用、工具、库,拥有完善的技术生态,给用户提供了一站式的开发体验。同时基于昇腾技术底座的开发者队伍也逐步壮大,为未来的技术应用和创新埋下了沃土。
图片
在异构计算架构CANN之上,我们还需要AI模型搭建的深度学习框架。
几乎所有的AI开发者,都需要用深度学习框架,而且几乎所有DL算法和应用,也都要通过深度学习框架去实现。
如今市面上已有熟知的谷歌TensorFlow,以及Meta的PyTorch等主流框架,并且形成了巨大的生态。
迈入大模型训练的时代,深度学习框架更需要在面对数千台计算机规模时,进行有效训练。
2020年3月正式开源的全场景深度学习框架——华为昇思MindSpore,弥补了国内在这一领域的空缺,实现了真正的自主可控。
MindSpore具备云边端全场景部署、原生支持大模型训练、支持AI+科学计算等关键特性,构建了全场景协同且全流程极简的原生开发环境,加速了国内科研创新和产业应用。