谷歌Gemini刚发就惹质疑：测试标准有失偏颇，效果视频疑似剪辑

值得一看 2023-12-07 23:28 83 0

谷歌最近发布的双子座（Gemini）大模型在测试中取得了优秀的成绩，尤其在MMLU多任务语言理解数据集测试中，其表现甚至超越了人类专家。然而，该产品在发布后遭到了一些质疑。批评者认为，Gemini在测试中的表现之所以优秀，部分是因为它使用了思维链提示技巧和32次尝试，而对比产品GPT-4并未享有这些提示，只尝试了5次。此外，Gemini的原始图片比例尺亦存在问题。对于该产品展示的视频，有人质疑其经过了剪辑处理。

尽管有上述质疑，Gemini的发布依然为其他研发团队带来了信心，使得曾经在相关领域一骑绝尘的GPT-4不再是独一无二、难以超越的存在。Gemini Pro版本已经被更新到谷歌的聊天机器人Bard中。相比于GPT-4，Gemini在编程水平方面有保证，但在一些领域，如SQL语句编写和图形推理方面表现则有所欠缺。然而，Gemini遵循指令方面的能力在对比Bard升级之前有显著进步。

总的来说，Gemini在一些方面超越了GPT-4，但也还存在需要改进的空间。对于未来，Gemini计划在明年结合AlphaGo的能力进行升级。该产品的发布无疑是谷歌对OpenAI的一次有效反击，并在一定程度上取得了成功。然而，长远的效果还需要进一步观察。

消费电子“爬坑”：小米回血、苹果硬撑

2023年底，云计算“水逆”

博客评论

还没有人评论，赶紧抢个沙发~

发表评论

说明：请文明发言，共建和谐网络，您的个人信息不会被公开显示。

分类

技巧分享（0）

宅家自学（5）

生活（10）

活动分享（20）

绿色软件（5）

值得一看（167）

新闻资讯（397）