斯坦福AI团队抄袭，套壳中国公司开源成果！

AI新闻快讯 6个月前玲珑居

3,485 0 450

中国的大模型，居然被美国知名学府的AI团队抄袭了，这谁能想得到？

斯坦福大学是国际名校吧，是某些人心中的顶尖学府了吧，嗨，就是这个学校，里面的AI研究团队套壳中国大模型，你说说，他们都干了这是个什么“鸡鸣狗盗”之事。

事情要从5月29日说起，当时这个AI团队发布了一个大模型Llama3V，并宣称可以用极低的成本就能训练出一个SOTA（最先进的）的多模态模型，并且效果可与GPT-4V、Gemini Ultra等主流模型相媲美。

然而搞笑的是，该团队将Llama3V的代码在社区开源，质疑声随之而来，有人在该模型开源区评论，其与中国的面壁智能公司发布的MiniCPM-Llama3-V 2.5模型存在高度相似性，有抄袭的嫌疑。

虽然，质疑的帖子被开发团队删除了，但随后面壁智能的测试结果显示，Llama3V在一些特定案例上的表现与MiniCPM-Llama3-V 2.5百分百地一致，这不仅仅是在正确答案上的一致，甚至在错误答案上也完全相同，这种“胎记”般的雷同性几乎无法用巧合来解释。

在这之后，社区成员通过深入分析，整理出了几点强有力的证据，表明Llama3V实际上是对MiniCPM-Llama3-V 2.5的套壳。

比如，Llama3V的模型结构、配置文件和代码与MiniCPM-Llama3-V 2.5高度相似，唯一的区别在于变量名的不同和一些格式化上的差异。这表明，Llama3V的代码几乎确定了是通过修改MiniCPM-Llama3-V 2.5的代码得到的，老陈认为这与套壳无异。

此外，Llama3V使用了与MiniCPM-Llama3-V 2.5相同的标记器（英文为：tokenizer），更搞笑的是，就连后者新定义的特殊标记他都直接拿去使用。这一点，根本无法用简单的借鉴来解释，你要说这也不算抄袭或者搬运使用，连鬼都不相信。

值得注意的是，斯坦福AI团队此前在Hugging Face上的Llama3V模型，已经可以确定是直接从MiniCPM-V的代码导入并重命名而来。虽然，这个团队成员声称他们只是尝试使用了MiniCPM-Llama3的配置，没有实际使用，但社区成员随后展示了一遍：如何通过修改变量名来使Llama3V模型运行MiniCPM-Llama3-V 2.5的代码。

这下，已经完全确认Llama3V模型就是抄袭MiniCPM-Llama3-V 2.5的代码，美国当地时间6月4日，该团队再也瞒不住了，就在X平台上发表了正式的道歉声明，并承诺将撤下所有 Llama3-V 模型。

这些证据的曝光，揭示了斯坦福大学AI团队的学术不端行为，也引发了对学术诚信和公平性的大讨论。学术抄袭不仅侵犯了原创者的权益，也阻碍了学术界的进步和创新。这种行为损害了斯坦福大学的声誉，更对学术界的诚信和公平造成了严重冲击。

然而，这件事也从侧面反映了中国AI大模型的实力正在迅速增长。面壁智能的MiniCPM-Llama3-V 2.5模型被斯坦福大学的研究团队所“借鉴”，这本身就证明了中国在AI领域的研究已经达到了世界领先水平。中国的AI研究者们不单单只是在追赶，更在某些领域引领着技术的发展，这值得我们每一个中国人感到自豪。

老陈还想提醒大家一句，从这件事上可以知道，国外的技术并不总是无可挑剔，抄袭和不端行为同样存在于国际学术界。我们要知道哪里都有抄袭者，而且国外的抄袭者连个“谢谢”都没说，说明素质并不分国度，外国的月亮越来越不圆了。

中国AI技术的崛起，不仅是技术层面的胜利，更是文化自信和自主创新精神的体现。我们应该以此为荣，并继续支持和鼓励国内的研究和创新，推动中国AI技术走向更广阔的国际舞台。同时，我们也应该倡导和维护学术诚信，确保每一份原创劳动都得到应有的尊重和保护。

所以，我们要多一份民族自信、少一点崇洋媚外。那么，就请为中国科技、科研人员点个赞吧。

4070 AI AI大模型 ai技术 ai领域 Gemini GPT-4 x 大模型

版权声明：玲珑居发表于 2024-06-05 8:51:51。
转载请注明：斯坦福AI团队抄袭，套壳中国公司开源成果！ | 玲珑居

暂无评论

暂无评论...

斯坦福AI团队抄袭，套壳中国公司开源成果！

苹果正在商谈让谷歌的大模型 Gemini 为 iPhone 的AI功能提供支持

没有更多了...

暂无评论