关于抄袭，华为最新回应

2025-07-08 来源：国际电子商情综合报道原创文章

1072

6月30日，华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE)，这一举措被视为构建昇腾生态的关键一步。然而，仅仅四天后，一场突如其来的争议将华为推上了舆论的风口浪尖。

2025年6月30日，华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE)，包括70亿参数稠密模型和720亿参数的混合专家模型，这一举措被视为构建昇腾生态的关键一步。然而，仅仅四天后，一场突如其来的争议将华为推上了舆论的风口浪尖。

争议爆发：相似度分析引发抄袭质疑

7月4日，一项发布于GitHub的研究引发了业界的广泛关注。用户@HonestAGI 通过“LLM 指纹”技术对华为盘古Pro MoE模型与阿里巴巴通义千问Qwen-2.5 14B模型进行了深入分析。结果显示，两者的注意力参数分布相似性高达0.927(1.0为完全一致)，这一数值远远超出了业内0.7以下的正常差异范围。由于深度学习模型训练的高度随机性，如此高的相似度自然引发了人们对盘古大模型是否涉嫌抄袭的质疑。

华为回应：强调独立开发与开源合规

面对汹涌而来的质疑，7月5日下午，华为旗下负责开发盘古大模型的诺亚方舟实验室迅速发布声明，坚决否认了抄袭指控。声明指出，盘古Pro MoE开源模型是基于昇腾硬件平台独立开发、训练的基础大模型，并非基于其他厂商模型增量训练而来。华为还特别强调了其在架构设计、技术特性等方面的关键创新，例如全球首个面向昇腾硬件平台设计的分组混合专家模型(MoGE)架构，该架构有效解决了大规模分布式训练的负载均衡难题，显著提升了训练效率。

内部爆料：员工自曝存在套壳、续训、洗水印现象

然而，就在华为官方发布声明后的第二天，7月6日凌晨，一位自称是盘古大模型团队的员工在网络上自曝，称团队内部确实存在套壳、续训、洗水印的现象。该员工表示，由于团队初期算力有限，尽管做出了诸多努力，但效果并不理想，内部质疑声和领导压力与日俱增。在这种情况下，小模型实验室多次套壳竞品，而领导层对此采取了默许的态度，以换取短期成果。

网传华为诺亚方舟实验室员工爆料长文截图

自曝内容还称，经过内部分析，盘古Pro MoE实际上是使用Qwen 1.5 110B进行续训，并通过加层、扩增ffn维度、添加盘古pi论文的一些机制等方式，凑够了大约 135B的参数。为了洗掉千问的水印，团队甚至采取了故意训练脏数据等手段。此外，该员工还提到团队曾选择套壳DeepSeekv3进行续训，通过冻住DeepSeek加载的参数来进行训练。最后，该员工表示出于对技术伦理的坚持，决定离职并曝光这些内幕。截至目前，华为尚未对此自曝内容发表声明。

业内观点：争议暴露AI大模型开源的模糊地带

这起争议也暴露了当前AI大模型开源领域存在的一些问题。目前，行业对于模型权重的开源、借鉴乃至“化用”，缺乏统一、清晰的法律和道德标准。使用开源模型架构进行重新训练、参考部分实现代码、直接使用或微调他人训练好的模型权重，这三者之间的界限并不明确，存在着较大的灰色地带。此次事件无疑给整个行业敲响了警钟，如何在开源的同时保护知识产权，如何建立更加科学、规范的模型评估和监管机制，成为了亟待解决的问题。

截至目前，涉事的GitHub库已被删除，阿里巴巴方面也尚未对此事发表公开回应。华为盘古大模型是否真的存在抄袭行为，目前尚无确凿证据。但无论最终结果如何，这起争议都将对AI大模型行业的发展产生深远影响，促使企业和研究者更加重视技术创新和知识产权保护，推动行业朝着更加健康、有序的方向发展。

行业动态

莫迪宣布印度首款国产芯片年底问世

四年后王者归来，华为重夺中国智能手机市场榜首

宇树科技发布新款人形机器人预告：31个关节，身高1.8米跳芭蕾舞

热读文章

苗圩出席统筹推进疫情防控和产业转型升级促进制造业通信业稳定发展发布会

一图读懂2020年《政府工作报告》

工业富联：拟7763万美元收购鸿海精密美国子公司相关资产