套壳的大模型,为何还活着?

值得一看   2023-11-17 20:59   92   0  

尽管国产大模型“套壳”现象引发了业界的热议和质疑,但这并不意味着国产大模型的前景黯淡。在国内AI大模型创业公司零一万物陷入“套壳”争议的同时,其首款预训练大模型Yi-34B在多个核心指标上达到了世界第一梯队水平。对于“套壳”的争议,企业回应称这更像是开发过程中基于测试的疏忽,而非刻意为之。

事实上,全球大模型架构正在形成通用标准,类似于手机APP开发者并不会去自创全新的基础架构。零一万物团队也在回应中表示,大模型研发的核心不仅在于架构,更在于训练得到的参数,他们投注大部分精力在调整训练方法、数据配比、数据工程、细节参数等方面。

“套壳”现象普遍,背后原因包括算力、人才和资金短缺,以及大模型创业时间窗口的逐渐缩小。在市场竞争压力下,部分团队选择以开源模型为基础进行改进和定制,因为成熟的开源框架具有庞大的社区支持,可以协助团队更快地解决问题。

所以,国产大模型“套壳”现象并不意味着行业前景黯淡。长远来看,更多具有创新潜力的企业有望在初期“大过滤器”中幸存,并为未来的自主创新奠定基础。


博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。