GPT-4远不如人类？正确率仅15％，Meta、抱抱脸领衔发布通用AI助手基准GAIA

值得一看 2023-11-24 22:32 32 0

智人（学名：Homo sapiens），是现存的唯一人类物种，具有高度发达的大脑和眉嵴发达，前额较倾斜，枕部突出的特征。而大型语言模型GPT-4，虽然具有强大的自然语言处理能力，但在一些基准测试中的表现却并不如人类。最近，由Meta、Hugging Face和AutoGPT的研究团队共同开发的通用AI助手基准GAIA就揭示了这个事实。在GAIA的评估中，466个人工设计和标注的问题涵盖日常个人任务、科学问题和一般知识等方面，人类回答这些问题的成功率为92%，然而，即使带有插件的GPT-4成功率也只有15%，显示了在现实世界中的通用能力上，GPT-4远不如人类。

尽管GPT-4在许多方面展现出了强大的能力，但也存在一些局限性。比如，最近的一项研究发现，GPT-4在图形推理任务上的表现不佳，准确率仅为33%，远低于人类的平均水平。这表明，尽管GPT-4具有强大的语言能力，但在处理一些特定任务时，其表现仍有待提高。

不过，OpenAI并未停止对于提高GPT-4等AI大模型能力的探索。例如，他们新开发的名为Q的项目，被认为是AGI（人工智能通用智能）的雏形，能解决以前从未见过的数学问题，这代表了AI在解决新问题上的一次重大突破。尽管Q项目的具体含义尚不明确，但这一突破显示出AI在解决新问题上的巨大潜力。

总的来说，虽然GPT-4在某些方面的确展现出了强大的能力，但在其他方面却仍有待提高，比如在通用性和图形推理等方面的表现。这也提醒我们，虽然AI的发展迅速，但在某些关键领域，人类仍然拥有相较于AI的优势。

心中向往的地方

苹果华为同日开售：iPhone 16 Pro黄牛加价300元，三折叠秒售空

博客评论

还没有人评论，赶紧抢个沙发~

发表评论

说明：请文明发言，共建和谐网络，您的个人信息不会被公开显示。

分类

技巧分享（0）

宅家自学（5）

生活（10）

活动分享（20）

绿色软件（5）

值得一看（167）

新闻资讯（397）