Fork me on GitHub

出一份试题,评测国内各种对标 ChatGPT 的大语言模型(二)

以下文章来源于 https://zhuanlan.zhihu.com/p/631532268

最近我在持续推进对标 ChatGPT 的大语言模型的评测工作,这是第二篇文章。 目前我已经测试了如下一些模型, 测试结果 具体得分情况如下所示:题目出的较难,而且紧扣用户的真实使用目标。因此,模型的得分情况差距较为明显。 ChatGPT 和 GPT4 :分别得分82分

出一份试题,评测国内各种对标 ChatGPT 的大语言模型(二)


本文地址:https://www.6aiq.com/article/1684823553569
本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出