笔趣阁

最新地址:www.22biqu.com
笔趣阁 > 科研系学霸 > 第130章 Apache 2.0 许可证

第130章 Apache 2.0 许可证

第130章 apache 2.0 许可证

ppt翻到下一页,出现一个矩阵乘法(gemm)的动画演示。

“不同厂商的gpu,其计算核心、缓存、內存带宽、甚至指令集都有巨大差异,直接为每种架构手写优化內核几乎是不可能完成的任务,这也是过去跨平台方案性能不佳的主要原因。

而我们的“tie分割”技术,可以动態地根据目標gpu的硬体参数配置文件做到这一点。”

隨后,动画演示开始,一个巨大的矩阵被高效地切割成多个大小不一的tie,算法开始自动计算出最优的tie大小、形状,以及数据在全局內存、共享內存、寄存器之间的搬运策略。

“可以看到,即便是同一个gemm计算,针对不同架构,编译器生成的底层机器代码在tile大小、循环展开次数、寄存器分配和使用上都是完全不同的。

这正是为什么,在演示中,我们能在amd显卡上获得接近n卡cuda性能的原因。“

说到这,周昀又笑了笑:“大家可能会说,既然都这么好了,是不是完全可以取代cuda了?虽然我也很希望做到这点,但还是很遗憾地告诉各位,不行,目前,aetosvo.1仅支持有限的核基础算子,如各位所见,relu,gemm,reduce

等等。”

ppt上展示了现有能够支持的算子列表。

周昀等待议论声稍歇,才继续开口:“如各位所见,现阶段想要全面超越cuda,那是不现实的,我们做到的,只是在最核心的矩阵运算上,通过算法和编译器的优化,尽力弥补了硬体架构本身的差异,为其他平台的开发者提供了多一种可能的选择。

我们都知道,构建一个生態困难重重,需要无数开发者的共同努力和时间积累,但不管是aetos还是其他国產的gpu计算生態,或许它们现在就像一颗种子,非常弱小,需要合適的土壤才能生长,但是某些领域,或许正需要这样一颗完全自主的种子。“

他话音落下,整场报告结束。

报告厅內,所有人都被周昀展示的东西所震撼,也不是没有其他厂商想要做这样的事情,比如amd就做过类似的事情,但最终的结果就是大败而归。

其中的困难,所有人都心知肚明。

几秒钟的寂静之后,掌声响起,虽然也有的人並不看好,但这並不妨碍他们对周昀的佩服,能够迈出这一步,已经足够厉害了。

掌声稍缓,主持人刚宣布进入提问环节,台下立刻举起了一片手臂。

第一位获得提问机会的是一位中年男性:“周博士,非常感谢您精彩的报告,您提到了动態根据目標gpu的硬体参数配置文件』进行优化,我想请问,这个配置文件是內置在编译器中的,还是需要硬体厂商提供?如果是后者,你们如何获取诸如指令集细节这类通常被严密保护的內部信息?”

周昀点点头,这的確是制约他们重写算子还有优化编译器的重要阻碍之一:“目前v0.1版本的配置文件主要由我们通过大量基准测试和逆向工程自行构建和维护,但我们更希望这是一种过渡方案,长远看来,如果想要真正超越cuda,还需要和其他品牌gpu厂商进行沟通,推动一种標准化的硬体描述接口,生態的建立需要软硬体协同,我们希望用我们的工作,反过来促进硬体接口在一定程度上的开放与標准化,这对整个行业都是有益的。”

第一个问题回答完,紧接著就是第二个问题:“周博士您好!您刚才提到性能接近n

卡cuda,能否分享一些更具体的benchmark数据?

比如在特定模型上,在amd某款主流显卡和nvidia同档次显卡上的对比?谢谢!“

“当然。”周昀笑著操纵著电脑,屏幕切换:“限於时间,ppt上没有展示全部数据,这里是我们內部测试的部分结果,在fp16精度下,针对特定规模的gemm计算,在amdrx7900xt上,我们的性能可以达到nvidiartx4090上cuda相应操作的约92%,但在更复杂的网络整体层面,由於算子覆盖不全,整体加速比会有下降,目前大约在70%-85%区间,这也是我之前说的,现阶段aetos想要全面取代cuda是完全不现实的。”

最后一个问题,提问的是一个软体公司的工程师:“aetos的技术理念令人振奋,您提到生態建设需要广大开发者的共同参与,那么aetos是否有开源计划?“

“会,並且是全面开源!”

“这可能是今晚最重要的宣布。”周昀顿了顿,继续道:“aetosvo.1將在本次会议结束后即开源,採用apache2.0许可证。”

所谓apache2.0许可证是一个在开源软体界极其流行且广泛使用的许可证,它是一种宽鬆的、对商业友好的开源协议。

包括:允许个人或公司免费使用apache2.0授权的软体、可以任意修改原始码以满足自己的需求、可以重新分发原始代码或你修改后的代码、可以將apache2.0授权的代码集成到你自己的商业软体或產品中,然后进行销售,而不需要將你自己的原始码开源。

不过也对使用者有一些非常“轻微』的使用要求,在分发的任何副本中,必须包含原始的版权声明、专利声明和许可证文本,而且如果修改了代码,必须在修改过的文件中添加明確的说明,告知他人你对此文件做了更改。

其对贡献者也有一些保护,软体以“现状”提供,作者和贡献者不承担任何,如果软体出了问题,不能起诉原始作者,风险由使用者自行承担,许可证明確不授予商標权,这意味著不能使用原始项目的名称、logo或其贡献者的商標来推广你的衍生產品,除非得到额外授权。

“我之前说过,单靠我们团队的力量是有限的,但通过开源,我们希望能匯聚全球开发者的智慧,共同解决跨平台gpu计算的难题,无论是amd、intei还是任何其他架构的gpu,我们都欢迎硬体厂商和开发者一起,为aetos贡献代码,完善支持,最后,原始码仓库的地址会后会公布,欢迎每一位开发者star、fork、以及提交第一个pr,让我们一起,种下这颗种子,共同培育它成长为参天大树。“

“谢谢大家!”

『记住本站最新地址 www.22biqu.com』
相邻小说: 推演,道成元始 清冷直男,被疯批皇帝强制爱了 天幕宝可梦:曝光小智弒神救世! 穿越菩提老祖,西游第一劫难 我有了透视眼之后,运气好到爆 开局青云宗主,召唤大帝境老祖 赶你去封地,你竟带着北凉王造反 我堂堂魔修,让我加综漫聊天群? 海贼:从奴役和之国开始! 修炼消耗血条?可我无限回血啊!