近一场IDEA年度大会上,IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋展示了一种名为T-Rex的视觉提示模型。据描述,这个新模型能实现开箱即用,它主要由图像编码器、提示编码器以及框解码器组成,T-Rex模型不受预定义类别限制,能利用视觉示例指定检测目标,提高提示效率。此外,它还支持多轮正例模式、正例+负例模式和跨图模式。这种以图识图的技术可能在未来科技创新中发挥重大作用。
值得注意的是,T-Rex模型在检测类任务领域具有广泛应用场景,能够有效解决罕见、复杂物体难以用文字描述的问题。它的使用步骤简单,无需重新训练或微调,即可检测模型在训练阶段未见过的物体。
此次IDEA大会上,除了T-Rex模型,IDEA研究院还分享了其他研究成果,如Think-on-Graph知识驱动大模型等。这些新的技术和研究成果可能会对未来的科技创新和产业应用产生积极影响。