GPT-4远不如人类?正确率仅15%,Meta、抱抱脸领衔发布通用AI助手基准GAIA

值得一看   2023-11-24 22:32   32   0  

智人(学名:Homo sapiens),是现存的唯一人类物种,具有高度发达的大脑和眉嵴发达,前额较倾斜,枕部突出的特征。而大型语言模型GPT-4,虽然具有强大的自然语言处理能力,但在一些基准测试中的表现却并不如人类。最近,由Meta、Hugging Face和AutoGPT的研究团队共同开发的通用AI助手基准GAIA就揭示了这个事实。在GAIA的评估中,466个人工设计和标注的问题涵盖日常个人任务、科学问题和一般知识等方面,人类回答这些问题的成功率为92%,然而,即使带有插件的GPT-4成功率也只有15%,显示了在现实世界中的通用能力上,GPT-4远不如人类。

尽管GPT-4在许多方面展现出了强大的能力,但也存在一些局限性。比如,最近的一项研究发现,GPT-4在图形推理任务上的表现不佳,准确率仅为33%,远低于人类的平均水平。这表明,尽管GPT-4具有强大的语言能力,但在处理一些特定任务时,其表现仍有待提高。

不过,OpenAI并未停止对于提高GPT-4等AI大模型能力的探索。例如,他们新开发的名为Q的项目,被认为是AGI(人工智能通用智能)的雏形,能解决以前从未见过的数学问题,这代表了AI在解决新问题上的一次重大突破。尽管Q项目的具体含义尚不明确,但这一突破显示出AI在解决新问题上的巨大潜力。

总的来说,虽然GPT-4在某些方面的确展现出了强大的能力,但在其他方面却仍有待提高,比如在通用性和图形推理等方面的表现。这也提醒我们,虽然AI的发展迅速,但在某些关键领域,人类仍然拥有相较于AI的优势。

博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。