斯坦福大学是国际名校吧,是某些人心中的顶尖学府了吧,嗨,就是这个学校,里面的AI研究团队套壳中国大模型,你说说,他们都干了这是个什么“鸡鸣狗盗”之事。
事情要从5月29日说起,当时这个AI团队发布了一个大模型Llama3V,并宣称可以用极低的成本就能训练出一个SOTA(最先进的)的多模态模型,并且效果可与GPT-4V、Gemini Ultra等主流模型相媲美。
然而搞笑的是,该团队将Llama3V的代码在社区开源,质疑声随之而来,有人在该模型开源区评论,其与中国的面壁智能公司发布的MiniCPM-Llama3-V 2.5模型存在高度相似性,有抄袭的嫌疑。
虽然,质疑的帖子被开发团队删除了,但随后面壁智能的测试结果显示,Llama3V在一些特定案例上的表现与MiniCPM-Llama3-V 2.5百分百地一致,这不仅仅是在正确答案上的一致,甚至在错误答案上也完全相同,这种“胎记”般的雷同性几乎无法用巧合来解释。
在这之后,社区成员通过深入分析,整理出了几点强有力的证据,表明Llama3V实际上是对MiniCPM-Llama3-V 2.5的套壳。
比如,Llama3V的模型结构、配置文件和代码与MiniCPM-Llama3-V 2.5高度相似,唯一的区别在于变量名的不同和一些格式化上的差异。这表明,Llama3V的代码几乎确定了是通过修改MiniCPM-Llama3-V 2.5的代码得到的,老陈认为这与套壳无异。
此外,Llama3V使用了与MiniCPM-Llama3-V 2.5相同的标记器(英文为:tokenizer),更搞笑的是,就连后者新定义的特殊标记他都直接拿去使用。这一点,根本无法用简单的借鉴来解释,你要说这也不算抄袭或者搬运使用,连鬼都不相信。
值得注意的是,斯坦福AI团队此前在Hugging Face上的Llama3V模型,已经可以确定是直接从MiniCPM-V的代码导入并重命名而来。虽然,这个团队成员声称他们只是尝试使用了MiniCPM-Llama3的配置,没有实际使用,但社区成员随后展示了一遍:如何通过修改变量名来使Llama3V模型运行MiniCPM-Llama3-V 2.5的代码。
这下,已经完全确认Llama3V模型就是抄袭MiniCPM-Llama3-V 2.5的代码,美国当地时间6月4日,该团队再也瞒不住了,就在X平台上发表了正式的道歉声明,并承诺将撤下所有 Llama3-V 模型。
这些证据的曝光,揭示了斯坦福大学AI团队的学术不端行为,也引发了对学术诚信和公平性的大讨论。学术抄袭不仅侵犯了原创者的权益,也阻碍了学术界的进步和创新。这种行为损害了斯坦福大学的声誉,更对学术界的诚信和公平造成了严重冲击。
然而,这件事也从侧面反映了中国AI大模型的实力正在迅速增长。面壁智能的MiniCPM-Llama3-V 2.5模型被斯坦福大学的研究团队所“借鉴”,这本身就证明了中国在AI领域的研究已经达到了世界领先水平。中国的AI研究者们不单单只是在追赶,更在某些领域引领着技术的发展,这值得我们每一个中国人感到自豪。
老陈还想提醒大家一句,从这件事上可以知道,国外的技术并不总是无可挑剔,抄袭和不端行为同样存在于国际学术界。我们要知道哪里都有抄袭者,而且国外的抄袭者连个“谢谢”都没说,说明素质并不分国度,外国的月亮越来越不圆了。
中国AI技术的崛起,不仅是技术层面的胜利,更是文化自信和自主创新精神的体现。我们应该以此为荣,并继续支持和鼓励国内的研究和创新,推动中国AI技术走向更广阔的国际舞台。同时,我们也应该倡导和维护学术诚信,确保每一份原创劳动都得到应有的尊重和保护。
所以,我们要多一份民族自信、少一点崇洋媚外。那么,就请为中国科技、科研人员点个赞吧。