配资什么意思【e公司观察】斯坦福团队抄袭国产大模型风波后 AI“打假”靠什么？

2024-07-30 21:21
64

在全球人工智能竞技日趋激烈的背景下，大模型抄袭事件并不罕见，国产大模型通常是被指责抄袭的一方；但近期斯坦福大学生AI团队爆出抄袭国产面壁大模型，整体事件反转速度之快、接力证伪力度之大，引发了中美双边“破圈”级关注。

5月29日，斯坦福大学两位本科生和一位工程师组成的AI团队，发布了Llama3-V开源模型，声称该模型只用了500美元成本，就能实现比肩头部开源多模态模型的性能效果；随后Llama3-V一度冲上了著名开源大模型排行榜HuggingFace首页。

但是HuggingFace用户们迅速发现该模型涉嫌“套壳”清华大学与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5，证伪参与群体后续扩大到其他开发者社区和X等社交平台，网友们罗列出两个模型结构、代码、实现效果高度相似等特征，还指出Llama3-V技术博客漏洞百出。作为回应，斯坦福团队声称他们只是使用了 MiniCPM-Llama3-V 2.5的tokenizer（词元生成器），并宣称自己在 MiniCPM发布前就开始了这项工作。

最后原创团队亲自下场举证，指出MiniCPM-Llama3-V 2.5能够识别特殊且罕见的战国时期古文字清华简，相关训练数据的采集和标注均由清华NLP实验室和面壁智能团队完成，相关数据尚未对外公开，然而Llama3-V却具有相同能力，而且犯错情形都相同。

层层重压之下，6月4日斯坦福Llama3-V团队的两位作者在社交平台上向面壁MiniCPM团队正式道歉，也“甩锅”另一位失联的团队成员；斯坦福人工智能实验室主任Christopher David Manning发文谴责，并对MiniCPM这一中国开源模型表示赞扬。

对于本次“破圈”认可，面壁CEO李大海发表了感慨，对事件本身深表遗憾，同时呼吁共建开放、合作、有信任的社区环境；联合创始人刘知远也发文回应， Llama3-V团队未能遵守开源协议对前人成果尊重和致敬，严重破坏了开源共享的基石，表示三位作者还很年轻，“如果知错能改，善莫大焉”；同时客观指出中美AI领域的纵、横差距。

这场抄袭风波暂告段落，也让中美科技圈进入双向反思：有国内IT界从业人员感叹，此事是不是可以给国产大模型多一点信心？也有美国工程师感慨忽视中国机器学习生态系统的工作，感慨如果不是硅谷、常青藤这些光环加持，非美国的大模型能否会赢得这么多关注？

无论如何，在人工智能时代，即便谎言被再精致地包装，也无法成为真相；另一方面，与人类命运息息相关的人工智能，却抬高了认知门槛，客观上也制约了民众知情与参与，专业、开放、透明的开源社区已日渐成为AI时代信息重要的“去伪存真”渠道，但客观来讲，并不一定每个“套壳”都能被层层审视、最终落槌定论；开源社区“打假”的自发性、偶发性，恐怕很难兼顾到AI行业长期发展需要；AI行业的关键商业主体如何平衡技术发展与公开透明度，成为越发关键的命题。

日前，7名OpenAI前员工、4名现任匿名员工和谷歌DeepMind前任与现任员工就发布公开信，警告商业公司竞相开发人工智能产品存在风险，该行业缺乏足够的监管，并可能对吹哨人打击报复，呼吁对AI行业进行全面改革，包括提高透明度和保护吹哨人。信中指出，人工智能公司掌握着大量非公开信息，包括其系统的能力和局限性、保护措施的充分性以及不同类型伤害的风险水平。然而，公司目前只有很弱的义务向政府分享部分信息，而对民间社会则没有任何义务。

提升人工智能行业透明度与民众知情度，不仅是打假的需求，也是对行业安全发展的呼吁。人工智能行业的透明度，不能也不应该成为稀缺品。

Bloomberg美元现货指数(DollarSpotIndex)在过去九个月里上涨了7%以上，在同一时期配资什么意思，全球31种主要货币中除了两种货币，美元兑其他货币均实现走强。

上一篇：上一篇：配资杠杆朝阳科技董事长沈庆凯病逝后其妻郭丽勤将成为公司实控人

下一篇：下一篇：最信得过的炒股配资宁波地区大宗商品产业培训班（第3期）报名正在进行中