在全球人工智能竞技日趋激烈的背景下,大模型抄袭事件并不罕见,国产大模型通常是被指责抄袭的一方;但近期斯坦福大学生AI团队爆出抄袭国产面壁大模型,整体事件反转速度之快、接力证伪力度之大,引发了中美双边“破圈”级关注。
5月29日,斯坦福大学两位本科生和一位工程师组成的AI团队,发布了Llama3-V开源模型,声称该模型只用了500美元成本,就能实现比肩头部开源多模态模型的性能效果;随后Llama3-V一度冲上了著名开源大模型排行榜HuggingFace首页。
但是HuggingFace用户们迅速发现该模型涉嫌“套壳”清华大学与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5,证伪参与群体后续扩大到其他开发者社区和X等社交平台,网友们罗列出两个模型结构、代码、实现效果高度相似等特征,还指出Llama3-V技术博客漏洞百出。作为回应,斯坦福团队声称他们只是使用了 MiniCPM-Llama3-V 2.5的tokenizer(词元生成器),并宣称自己在 MiniCPM发布前就开始了这项工作。
最后原创团队亲自下场举证,指出MiniCPM-Llama3-V 2.5能够识别特殊且罕见的战国时期古文字清华简,相关训练数据的采集和标注均由清华NLP实验室和面壁智能团队完成,相关数据尚未对外公开,然而Llama3-V却具有相同能力,而且犯错情形都相同。
层层重压之下,6月4日斯坦福Llama3-V团队的两位作者在社交平台上向面壁MiniCPM团队正式道歉,也“甩锅”另一位失联的团队成员;斯坦福人工智能实验室主任Christopher David Manning发文谴责,并对MiniCPM这一中国开源模型表示赞扬。
对于本次“破圈”认可,面壁CEO李大海发表了感慨,对事件本身深表遗憾,同时呼吁共建开放、合作、有信任的社区环境;联合创始人刘知远也发文回应, Llama3-V团队未能遵守开源协议对前人成果尊重和致敬,严重破坏了开源共享的基石,表示三位作者还很年轻,“如果知错能改,善莫大焉”;同时客观指出中美AI领域的纵、横差距。
这场抄袭风波暂告段落,也让中美科技圈进入双向反思:有国内IT界从业人员感叹,此事是不是可以给国产大模型多一点信心?也有美国工程师感慨忽视中国机器学习生态系统的工作,感慨如果不是硅谷、常青藤这些光环加持,非美国的大模型能否会赢得这么多关注?
无论如何,在人工智能时代,即便谎言被再精致地包装,也无法成为真相;另一方面,与人类命运息息相关的人工智能,却抬高了认知门槛,客观上也制约了民众知情与参与,专业、开放、透明的开源社区已日渐成为AI时代信息重要的“去伪存真”渠道,但客观来讲,并不一定每个“套壳”都能被层层审视、最终落槌定论;开源社区“打假”的自发性、偶发性,恐怕很难兼顾到AI行业长期发展需要;AI行业的关键商业主体如何平衡技术发展与公开透明度,成为越发关键的命题。
日前,7名OpenAI前员工、4名现任匿名员工和谷歌DeepMind前任与现任员工就发布公开信,警告商业公司竞相开发人工智能产品存在风险,该行业缺乏足够的监管,并可能对吹哨人打击报复,呼吁对AI行业进行全面改革,包括提高透明度和保护吹哨人。信中指出,人工智能公司掌握着大量非公开信息,包括其系统的能力和局限性、保护措施的充分性以及不同类型伤害的风险水平。然而,公司目前只有很弱的义务向政府分享部分信息,而对民间社会则没有任何义务。
提升人工智能行业透明度与民众知情度,不仅是打假的需求,也是对行业安全发展的呼吁。人工智能行业的透明度,不能也不应该成为稀缺品。
Bloomberg美元现货指数(DollarSpotIndex)在过去九个月里上涨了7%以上,在同一时期配资什么意思,全球31种主要货币中除了两种货币,美元兑其他货币均实现走强。