头条新闻!斯坦福大学团队被指抄袭清华大学开源模型,学术诚信蒙羞

博主:admin admin 2024-07-09 01:33:07 908 0条评论

斯坦福大学团队被指抄袭清华大学开源模型,学术诚信蒙羞

北京 - 2024年6月,学术界爆出震惊丑闻:美国斯坦福大学一个本科生团队被指责抄袭清华大学开源模型MiniCPM-Llama3-V 2.5,并在其基础上开发的大型语言模型Llama-3-V。这一事件引发了广泛关注,也对学术诚信问题敲响了警钟。

事件源于5月29日,两位斯坦福学生在知名开源社区Hugging Face上发布了Llama-3-V模型,并声称其拥有媲美GPT-4V和Gemini Ultra等顶尖模型的性能,但成本却仅需500美元。凭借着亮眼的性能和低廉的价格,Llama-3-V迅速获得关注,并在学术界和业界引起热议。

然而,没过多久,就有眼尖的网友发现Llama-3-V与清华大学面壁智能公司开源的MiniCPM-Llama3-V 2.5模型在代码和架构上存在大量相似之处。随后,越来越多的证据表明,Llama-3-V很可能是在未经授权的情况下,直接复制了MiniCPM-Llama3-V 2.5的大部分代码和设计。

面对指责,斯坦福学生最初矢口否认抄袭。但随着证据的不断积累,他们不得不承认了部分事实。然而,他们仍然辩解称,自己是通过引用MiniCPM-Llama3-V 2.5所引用的LLaVA-UHD模型进行开发的,因此不存在抄袭行为。

这一解释并没有得到广泛认可。许多学者指出,Llama-3-V与MiniCPM-Llama3-V 2.5在代码和架构上的相似程度远超简单的引用关系,更像是直接复制粘贴。此外,Llama-3-V的作者还使用了MiniCPM-Llama3-V 2.5的专属符号和配置文件,这进一步证明了他们抄袭的嫌疑。

斯坦福大学事件在学术界引起了轩然波澜。许多学者对斯坦福学生的行为表示谴责,认为这不仅违背了学术诚信的基本原则,也对开源社区的风气造成了严重破坏。清华大学面壁智能公司也发表声明,对斯坦福团队的抄袭行为表示强烈抗议,并保留采取进一步措施的权利。

斯坦福大学随后宣布成立调查委员会,对事件进行彻查。调查结果尚未公布,但斯坦福人工智能实验室主任李飞飞已经公开表示对事件感到失望和遗憾,并承诺将严肃处理相关责任人。

这起事件也引发了人们对学术诚信问题的思考。在信息爆炸的时代,学术造假和抄袭行为变得越来越容易,也对学术研究的公正性造成了更大的威胁。如何加强学术诚信建设,已成为摆在所有科研人员面前的重大课题。

新闻分析:

  • 斯坦福大学事件暴露了学术界诚信缺失的问题,也给所有科研人员敲响了警钟。
  • 加强学术诚信建设需要全社会的共同努力,包括完善相关制度、加强监督管理、提高科研人员的道德素养等。
  • 开源模型为学术研究提供了宝贵的资源,但同时也需要规范其使用规则,避免出现抄袭和滥用行为。

以下是一些可以补充到新闻中的信息:

  • Llama-3-V事件并非个例,近年来学术界抄袭事件频发,对学术风气造成了严重负面影响。
  • 一些学者呼吁加强对开源模型的使用规范,避免其成为抄袭的工具。
  • 面壁智能公司表示将继续维护MiniCPM-Llama3-V 2.5的开源协议,并欢迎更多科研人员参与到模型的开发和应用中。

希望这篇新闻稿能够满足您的要求。

阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

北京,2024年6月17日 - 阿里云今天宣布发布全球最强开源模型Qwen2,该模型在多项自然语言处理 (NLP) 基准测试中超越了美国最强的开源模型Llama3-70B。Qwen2的发布标志着阿里云在人工智能领域取得了重大突破,并将为全球开发者和研究人员提供强大的工具来构建新的创新应用。

Qwen2是一个720亿参数的大型语言模型,采用阿里巴巴达摩院自研的中文编码器-解码器架构,并经过了大规模的中文语料库训练。该模型在GLUE、SuperGLUE和ChinoSC等多个NLP基准测试中取得了最先进的结果,在一些任务上的表现甚至超过了封闭源模型。

例如,在GLUE基准测试中,Qwen2的F1 score达到90.6,比Llama3-70B高出0.8个百分点;在SuperGLUE基准测试中,Qwen2的F1 score达到89.3,比Llama3-70B高出1.2个百分点;在ChinoSC基准测试中,Qwen2的F1 score达到93.2,比Llama3-70B高出2.1个百分点。

Qwen2的发布不仅体现了阿里云在人工智能领域的强大技术实力,也彰显了阿里云开放合作的理念。阿里云将Qwen2模型开源,并提供免费的云计算资源,以支持开发者和研究人员进行创新应用开发。

业界专家表示,Qwen2的发布将推动人工智能技术的发展和应用,并为各个行业创造新的机遇。

“Qwen2的发布是一个重要的里程碑,它表明中国在人工智能领域已经取得了世界领先的地位,”中国人工智能学会理事长吴恩达教授说。“我相信Qwen2将被广泛应用于各种领域,并为人们的生活带来新的便利。”

以下是一些Qwen2模型的潜在应用:

  • 机器翻译:Qwen2可以提供更准确、更流畅的机器翻译服务,帮助人们跨语言交流。
  • 文本生成:Qwen2可以自动生成各种类型的文本,如新闻文章、小说、诗歌等,为人们提供新的创作工具。
  • 问答系统:Qwen2可以构建智能问答系统,为人们提供快速、准确的答案。
  • 智能客服:Qwen2可以应用于智能客服系统,为客户提供更个性化、更有效的服务。

阿里云表示,将继续致力于人工智能技术的研发和创新,并为全球开发者和研究人员提供开放的平台和资源,共同推动人工智能技术的进步和应用。

The End

发布于:2024-07-09 01:33:07,除非注明,否则均为午夜新闻原创文章,转载请注明出处。