文心一言4.0,综合性能不逊于ChatGPT4

文心一言4.0,综合性能不逊于ChatGPT4。我说我为此感到非常高兴,也希望大家不要对我们国家的科技发展感到悲观,要有信心。然后就有网友怼我:你有没有用过百度的文心一言?好像我在那里带节奏。

也有网友说,如果是大语言模型的算法,技术是公开的,那么中国模仿觉得这是可能的。如果要中国自己来搞创新,觉得这不可能。在这里就想做一些解释,当然我还没有用过百度的文心一言4.0。但是我想既然百度公开这么讲,如果水平差的很多,我想他也不至于就这么说。我们过去承认它,相信它。

文心一言4.0,综合性能不逊于ChatGPT4

主要的原因是因为对大语言模型我还是做了研究的。我还是知道大概是怎么一回事情。我写的《人工智能技术》的书的最后一章,也就是大语言模型,为了写那一章我看了很多的资料,包括也读了很多的论文。

这个网友说的不错,大语言模型的技术实际上应该说是公开的,或者准确的说一开始的时候确实是公开的。到了后来GPT4了,他就保密了。因为一开始为什么公开?一开始这个模型其实是大家没有觉得这个模型能产生如此神奇的功效,包括作者,他们也没有想到。最早的GPT模型可以称它是1.0版本。

当时是open AI的几个作者发了一篇文章,这篇文章是发表在open AI公司的官网上以博客的形式发表的。这么一篇重要的论文。

为什么不发表到一些知名的期刊上去?原因很简单,因为这篇文章没有什么创新,被认为没有什么创新,就很多期刊都没有接受。确实1.0训练出来的效果也不是很理想。包括后来GPT2.0也是有一篇文章发表在open AI的官网上,以博客的形式发表的,也没有被那些期刊认可接受。理由还是一样的,因为训练出来的结果也不是特别好。

直到GPT3发现威力强大、功能非常强大,后来就被正式的期刊接受了,所以你们可以去查一下。三篇文章的来源就很清楚。实际上通过研究这三篇论文发现第一篇文章是最重要的。第二篇文章跟第三篇文章比起来其实并没有太多的创新,模型还是同样的架构。只不过模型做的更大一点,就像房子一样。本来是一个小别墅造成了一个更大的别墅,训练的数据更多了,使用的机器更多了,训练一次的费用也更贵了。

所以从理论上来讲实际上没有什么太大的创新之处。既然第一篇文章也没有什么创新,也可以说这三篇文章都没有什么重大的创新。它们只是在以前的一些模型的基础上进行了利用了以前的模型,但是却收到了非常好的效果。当然这也是通过不断的探索、训练最后得出的结论。

所以我觉得网友说的对也不对,说的对的话确实是算法公开的。也可以说中国人在模型上,包括百度、阿里这些公司都在做,可以说他们是模仿人家。但是话说回来,大家都是一个摸索的过程。所以这种情况我就相信这一次百度的文心一言4.0应该是能够取得很好的成果。只要训练、功夫做到家,模型本身没有什么太多的秘密。

另外我还想指出的一点是什么呢?虽然说GPT的模型最早的时候确实是美国人在做,但是那些文章也可以看得出来,里面也是有中国人的参与的。因为这个作者的署名看得出来应该是其中有一些是中国人的名字,所以我一直说中国人很聪明就是这个意思。

当然有一个网友还扯到了以爱国带节奏。这个我倒是没想到,因为我只是想给大家鼓鼓气,不要有悲观的失败主义的情绪在里面。因为一旦有了这种情绪以后你会感染很多人。我还希望大家来正确的看待有一些差距。确确实实我是从内心里感觉到什么呢?一个国家不管是哪个国家,它要强大科技是最重要的。

上一篇:ChatGPT4.0长眼睛了,世界要变了,再造入组织变革下一篇:ChatGPT:论文写作工具如何提高学生论文质量?

相关文章

如何免费使用ChatGPT4?  (2023-5-27 17:29:3)

ChatGPT4简直离谱,我一个连代码都不懂的人,用它做出了这些!  (2023-5-13 10:57:19)

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。