谷歌Gemini刚发就惹质疑:测试标准有失偏颇,效果视频疑似剪辑

值得一看   2023-12-07 23:28   83   0  

谷歌最近发布的双子座(Gemini)大模型在测试中取得了优秀的成绩,尤其在MMLU多任务语言理解数据集测试中,其表现甚至超越了人类专家。然而,该产品在发布后遭到了一些质疑。批评者认为,Gemini在测试中的表现之所以优秀,部分是因为它使用了思维链提示技巧和32次尝试,而对比产品GPT-4并未享有这些提示,只尝试了5次。此外,Gemini的原始图片比例尺亦存在问题。对于该产品展示的视频,有人质疑其经过了剪辑处理。

尽管有上述质疑,Gemini的发布依然为其他研发团队带来了信心,使得曾经在相关领域一骑绝尘的GPT-4不再是独一无二、难以超越的存在。Gemini Pro版本已经被更新到谷歌的聊天机器人Bard中。相比于GPT-4,Gemini在编程水平方面有保证,但在一些领域,如SQL语句编写和图形推理方面表现则有所欠缺。然而,Gemini遵循指令方面的能力在对比Bard升级之前有显著进步。

总的来说,Gemini在一些方面超越了GPT-4,但也还存在需要改进的空间。对于未来,Gemini计划在明年结合AlphaGo的能力进行升级。该产品的发布无疑是谷歌对OpenAI的一次有效反击,并在一定程度上取得了成功。然而,长远的效果还需要进一步观察。

博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。