安全提示:即将离开云搜,稍后自动跳转...
自动驾驶之心
自动驾驶vla的空间理解能力,亟需新的突破。 多模态大语言模型(mllms)已展现出强大的视觉-语言推理能力,但仍缺乏鲁棒的3d空间理解能力,而这种能力对自动驾驶至关重要。这一局限