信息发布→ 登录 注册 退出

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

发布时间:2024-06-04

点击量:

斯坦福团队抄袭清华系大模型事件后续来了——

Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生还跟另一位作者切割了。

最新致歉推文,由Siddharth Sharma(悉达多)和Aksh Garg(阿克什)发出。

不在其中、来自南加利福尼亚大学的Mustafa Aljadery(简称老穆)被指是主要过错方,并且自昨天起人就失踪了:

我们希望由老穆首发声明,但自昨天以来一直无法联系到他。

悉达多、我(阿克什)和老穆一起发布了Llama3-V,老穆为该项目编写了代码。

悉达多和我的角色是帮助他在Medium和Twitter上推广这个模型。我询查了最近的论文以验证工作的创新性,但我们没有被告知和发现面墙智能先前的工作。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

被指跑路的老穆本人,X主页目前已经开启保护锁定状态,申请才能关注:

整体来看,这条致歉推文和昨天那条发出后又急忙删掉的推文内容大差不差,主要是突出了道歉和进一步甩锅

毕竟连斯坦福人工智能实验室主任Christopher Manning都下场开喷:

这是典型的不承认自己错误!

他认为团队在事发后避重就轻,用“架构相似”、“MiniCPM比我们更快实现”的借口推脱,拒不承认是抄袭。

但全新道歉声明,并没有止住网友们的质疑。并且最新爆料还指出,这几位老哥根本就是抄袭惯犯,之前写的教材也是一整个大抄特抄。

而原作者团队面壁智能这边,除CEO李大海昨天回应“也是一种受到国际团队认可的方式”外,首席科学家刘知远也已在知乎出面“亲自答”:

已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳。

人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。我们这次开源的MiniCPM-Llama3-V 2.5就用到了最新的Llama3作为语言模型基座。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。他们在受到质疑后已在Huggingface删库,该团队三人中的两位也只是斯坦福大学本科生,未来还有很长的路,如果知错能改,善莫大焉。

新的证据

还是先来简单回顾一下这个大瓜。

一句话总结就是,有网友发现,最近在开源社区大火的斯坦福团队多模态大模型Llama3-V,架构和代码与国产MiniCPM-Llama3-V 2.5几乎一毛一样,并列举了诸多证据直指Llama3-V抄袭。

随着事件逐渐发酵,斯坦福AI团队删库跑路,面壁智能团队也就此事展开了调查。

面壁智能首席科学家、清华大学长聘副教授刘知远给出的判断Llama3-V是MiniCPM-Llama3-V 2.5套壳的一大理由,正是对于清华简的识别能力

这是MiniCPM-Llama3-V 2.5的“彩蛋”能力,是他们用了从清华简逐字扫描并标注的数据集训练的,并未公开。而Llama3-V的表现和MiniCPM-Llama3-V 2.5一模一样,不仅做对的题一样,出错的地方都一样

今天,在第一波证据的基础之上,又有其他网友扒出了新线索。

有人研究后发现,Llama3-V几乎每一层的权重差值都符合均值为0、标准差为1.4e-3的高斯分布。

于是推测,Llama3-V只是直接在MiniCPM的权重上添加了低方差噪声

除此之外,那个跑路的大兄弟老穆还被曝之前写了本关于“计算机网络设计”的书,也是抄的

从书中随便抽出一章,用抄袭检测器检测一下就是一堆红点:



以及,这本书的作者栏里,据网友爆料也有悉达多的名字。

也有网友认为抄书这事儿是不是真的还有待考究。不过,现在这本书也404了。


说回这次的抄袭,悉达多和阿克什的致歉声明中也有提到他们之所以和穆哥一起宣传这个项目,最初也是被这个多模态模型惊艳到了,特别喜欢穆哥所描述的基于Idefics、SigLip和UHD的架构扩展。

但实际上网友一早扒出Llama3-V在空间模式等很多方面的具体实现都和LLaVA-UHD不同,却跟MiniCPM-Llama3-V 2.5出奇一致。

根据MiniCPM-Llama3-V 2.5主页介绍,MiniCPM-Llama3-V 2.5是面壁智能MiniCPM-V系列的最新开源模型,基于SigLip-400M和Llama3-8B-Instruct构建,总共8B参数。

从性能上讲,MiniCPM-Llama3-V 2.5在OpenCompass上取得了65.1的平均分,性能超过如GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max等专有模型,且显著超越其他基于Llama 3的多模态语言模型。

此外,MiniCPM-Llama3-V 2.5的OCR能力也很强,在OCRBench上得分700+,超越GPT-4o、GPT-4V-0409、Qwen-VL-Max和Gemini Pro。

基于最新的RLAIF-V方法,MiniCPM-Llama3-V 2.5在Object HalBench上的幻觉率为10.3%,也低于GPT-4V-1106的13.6%。

“中国大模型被忽视了”

尽管甩锅甩得飞快,但网友们很快又从阿克什和悉达多童鞋的道歉声明里发现了华点:

合着你俩啥也没干,帮着搞搞推广就算项目作者啦?

宣发的时候说是你们仨的项目,出事了就把锅全甩给一个人?

如果是老穆一个人写了所有代码,那你俩是干啥的,就发发帖吗?

还有网友挑起了一个更关键的话题,进一步引发热议——

开源社区是否忽视了来自中国的大模型成果?

谷歌DeepMind研究员、ViT作者Lucas Beyer就提到,Llama3-V是抄的,但成本低于500美元,效果却能直追Gemini、GPT-4的开源模型确实存在:

但相比于Llama3-V,MiniCPM得到的关注要少得多,包括我自己也有所忽略。

主要原因似乎是这样的模型出自中国实验室,而非常春藤盟校。

抱抱脸平台和社区负责人Omar Sanseviero说的更加直接:

社区一直在忽视中国机器学习生态系统的工作。他们正在用有趣的大语言模型、视觉大模型、音频和扩散模型做一些令人惊奇的事情。

包括Qwen、Yi、DeepSeek、Yuan、WizardLM、ChatGLM、CogVLM、Baichuan、InternLM、OpenBMB、Skywork、ChatTTS、Ernie、HunyunDiT等等。

对此,不少网友表示赞同,“他们推出了目前最好的开源VLM”。

从更客观的大模型竞技场的角度看,此言不虚。

在模型一对一PK的视觉大模型竞技场中,来自零一万物的Yi-VL-Plus排名第五,超过了谷歌的Gemini Pro Vision。智谱AI和清华合作的CogVLM也跻身前十。

此外,DeepSeek、通义千问和这次遭到抄袭的MiniCPM系列多模态模型,也都有不错的表现。

在更受到广泛认可的LMSYS Chatbot Arena Leaderboard竞技场榜单中,来自中国的大模型也同样在不断刷新“最强开源”的新纪录。

正如刘知远老师所说:

从横向来看,我们显然仍与国际顶尖工作如Sora和GPT-4o有显著差距;同时,从纵向来看,我们已经从十几年前的nobody,快速成长为人工智能科技创新的关键推动者。

此瓜甚巨,吃瓜者众,或许更重要的是,一些成见正在破壁。你觉得呢?

MiniCPM原论文https://arxiv.org/abs/2404.06395


相关文章: 文心一言回复删除攻略,告别困扰,畅享无忧交流,某某ai合成  文心独运,巧呈一言,打造沉浸式阅读盛宴,ai坠龙  文一言心与豆包,经典零食的优劣对决,昆明ai全网通价格  AI模型训练攻略,关键要素与最佳实践深度解析,支持中文的ai写作  AI营销,正负样本智慧应用与深度解析,ai仔怎么做  AI金融科技领航者,大模型专家预见未来金融智慧之光,AI黑体是什么意思  我国人工智能领域的璀璨明珠,360大模型AI深度揭秘,精准Ai智能  AI缩写文本:助力智能生活的革新力量,ai智能写作生成神器下载  轻松写出高质量论文,选择论文写作网站的正确方式  未来智能新,AI四维模型引领无限探索,ai怎么做名片  文心一言申请攻略,揭秘通过流程及时长揭秘,ai小黑人  解锁心理学新视野,AI大模型软件助你轻松入门与进阶,我要自学网视频教程ai  人工智能赋能内容创作,重塑产业格局的秘密,鲁路修 卡莲 ai  SEM和SEO的区别:如何根据需求选择适合的网络营销策略  AI模型下载大揭秘,热门一网打尽,ai影人  2025百度收录优化:提升网站排名,助力企业数字化转型,第一ai做  人AI判断模型构建方法与实践深度解析,制作手机壁纸ai  AI模型融合之路,技术交汇与实践探索,ai相机app  中电兴发,AI赋能创新,探秘AI模型应用新格局,ai黑白转矢量图  文心一言攻略,畅游全球文化交流地,讨厌ai到使用ai  文心一言3.5 API升级发布,收费政策全解析,ai晓晓写作文  国内AI翘楚,揭秘最火AI模型公司与创新,ai房间空寂  文心一言,揭秘高效写作的缩写文章神器,ai做小碎片  AI赋能3D样机建模,重塑设计流程,加速产品开发,AI则善  画科比寺庙拜佛,文心一言中的之旅,圆球ai  内容创作新时代:自动生成文章的AI如何改变写作生态  ChatGPT网页版免费版:开启智能对话的全新体验  文心一言经典句,古文智慧火花探寻之旅,ai33888888  AI训练大模型失败案例分析及优化策略研究,ai 打散  AI公众号项目怎么样?打造未来商业的全新机会  AI聊天新,下载新型聊天模型,体验智能交互,AI新兴  AI缩短短文-提升创作效率,写作新体验,光速写作业ai写作app  全I模型全览,国外热门深度解析,手写信ai  一键体验智能未来,小爱AI大模型安装指南,多页pdf导入ai  清华AI团队创新突破,打造全新动力学模型,开启智能科技新时代,元萝卜ai围棋  AI大模型,揭秘潜在缺陷与应对,AI做植物  国内开源AI大数据模型引领产业升级与技术革新,3d建筑建模ai  小艺AI大模型升级,下载新体验,开启智能生活新篇章,ai胖女孩头像  文心一言,会议记录智能助手高效整理攻略,ai教程哪个好  怎么用AI润色文章,让你的文稿瞬间高大上  AI网页版智能问答,开启智慧沟通新时代,ai梦境档案用不了手柄  SEMSEO是啥?全面解析这两大数字营销策略  豆包AI数字人,解码数字人制作科技秘境,港大ai面试  未来写作新模式文章撰写AI如何助力内容创作  好用的AI写作软件免费推荐:创作新境界!  打造个人AI大模型,开启智能生活新时代,AI软件下载电子书  网页中嵌入AI:开启数字化新时代,提升用户体验与业务效率  释放网站潜力,外链发布工具助力SEO优化  文心一言版插件攻略,轻松拓展功能,打造个性化体验,ai如何平滑  AI驱动制造革新,3D打印模型的智能,AI中怎么转换成曲线 

标签:# https  # 昨天  # 多模  # 这是  # 阿克  # 写了  # 中国  # 也有  # 清华  # 斯坦福  # 开源  # llama  # gpt  # 开源协议  # ai  # ocr  # 人工智能  # 算法  # 事件  #   # Object  # 架构  # qwen  # claude  # gemini  # 通义千问  # deepseek  # 智能科技  
在线客服
服务热线

服务热线

400 8905 500

微信咨询
二维码
返回顶部
×二维码

截屏,微信识别二维码

打开微信

微信号已复制,请打开微信添加咨询详情!