欢迎访问江南电竞入口安卓版

关于抄袭,华为最新回应

2025-07-08 来源:国际电子商情综合报道 原创文章
96

关键词:华为盘古大模型,昇腾生态,AI 抄袭争议,知识产权保护,模型评估监管

6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE),这一举措被视为构建昇腾生态的关键一步。然而,仅仅四天后,一场突如其来的争议将华为推上了舆论的风口浪尖。

2025年6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,这一举措被视为构建昇腾生态的关键一步。然而,仅仅四天后,一场突如其来的争议将华为推上了舆论的风口浪尖。

争议爆发:相似度分析引发抄袭质疑

7月4日,一项发布于GitHub的研究引发了业界的广泛关注。用户@HonestAGI 通过“LLM 指纹”技术对华为盘古Pro MoE模型与阿里巴巴通义千问Qwen-2.5 14B模型进行了深入分析。结果显示,两者的注意力参数分布相似性高达0.927(1.0为完全一致),这一数值远远超出了业内0.7以下的正常差异范围。由于深度学习模型训练的高度随机性,如此高的相似度自然引发了人们对盘古大模型是否涉嫌抄袭的质疑。

不仅如此,研究者还在盘古开源的代码文件中发现了明确指向阿里巴巴的版权声明——“Copyright 2024 The Qwen team, Alibaba Group”。这一发现进一步加剧了外界对盘古大模型的质疑声浪,不少人认为这是盘古抄袭通义千问的“铁证”。

华为回应:强调独立开发与开源合规

面对汹涌而来的质疑,7月5日下午,华为旗下负责开发盘古大模型的诺亚方舟实验室迅速发布声明,坚决否认了抄袭指控。声明指出,盘古Pro MoE开源模型是基于昇腾硬件平台独立开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。华为还特别强调了其在架构设计、技术特性等方面的关键创新,例如全球首个面向昇腾硬件平台设计的分组混合专家模型(MoGE)架构,该架构有效解决了大规模分布式训练的负载均衡难题,显著提升了训练效率。

对于代码中出现的阿里版权声明,华为方面解释称,盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,其中涉及其他开源大模型的部分开源代码。华为表示,他们严格遵循开源许可证的要求,在开源代码文件中清晰标注了开源代码的版权声明,这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。

内部爆料:员工自曝存在套壳、续训、洗水印现象

然而,就在华为官方发布声明后的第二天,7月6日凌晨,一位自称是盘古大模型团队的员工在网络上自曝,称团队内部确实存在套壳、续训、洗水印的现象。该员工表示,由于团队初期算力有限,尽管做出了诸多努力,但效果并不理想,内部质疑声和领导压力与日俱增。在这种情况下,小模型实验室多次套壳竞品,而领导层对此采取了默许的态度,以换取短期成果。

网传华为诺亚方舟实验室员工爆料长文截图

自曝内容还称,经过内部分析,盘古Pro MoE实际上是使用Qwen 1.5 110B进行续训,并通过加层、扩增ffn维度、添加盘古pi论文的一些机制等方式,凑够了大约 135B的参数。为了洗掉千问的水印,团队甚至采取了故意训练脏数据等手段。此外,该员工还提到团队曾选择套壳DeepSeekv3进行续训,通过冻住DeepSeek加载的参数来进行训练。最后,该员工表示出于对技术伦理的坚持,决定离职并曝光这些内幕。截至目前,华为尚未对此自曝内容发表声明。

业内观点:争议暴露AI大模型开源的模糊地带

此次华为盘古大模型的抄袭争议,引发了业内的广泛讨论。许多业内人士认为,仅凭“模型指纹”的相似度来判定抄袭并不完全科学,因为不同模型在架构设计、训练数据和优化算法等方面存在诸多差异,单一的相似度指标难以全面反映模型之间的关系。此外,代码中出现的开源版权声明,只能说明华为在开发过程中使用了相关的开源代码,并且遵循了开源协议,不能直接等同于抄袭。

这起争议也暴露了当前AI大模型开源领域存在的一些问题。目前,行业对于模型权重的开源、借鉴乃至“化用”,缺乏统一、清晰的法律和道德标准。使用开源模型架构进行重新训练、参考部分实现代码、直接使用或微调他人训练好的模型权重,这三者之间的界限并不明确,存在着较大的灰色地带。此次事件无疑给整个行业敲响了警钟,如何在开源的同时保护知识产权,如何建立更加科学、规范的模型评估和监管机制,成为了亟待解决的问题。

截至目前,涉事的GitHub库已被删除,阿里巴巴方面也尚未对此事发表公开回应。华为盘古大模型是否真的存在抄袭行为,目前尚无确凿证据。但无论最终结果如何,这起争议都将对AI大模型行业的发展产生深远影响,促使企业和研究者更加重视技术创新和知识产权保护,推动行业朝着更加健康、有序的方向发展。




Baidu
map