4月下旬,AUTOPILOT 2026(CVPR Workshop)国际计算机视觉顶级挑战赛圆满落幕,在这场角逐中,中控信息eCityAI团队在VQA Challenge Track中取得了亚军的优异成绩。从全球顶尖挑战队伍中脱颖而出,充分展示了中控信息在多模态理解与推理领域的深厚技术积淀;这也是易智大模型继ICCV 2025“多模态推理与慢思考”后,在国际顶级赛事中取得的又一突破。
CVPR(Computer Vision And Pattern Recognition)即国际计算机视觉与模式识别会议,曾被谷歌学术指标评为仅次于Nature的全球人工智能与计算机视觉领域的顶级学术盛会。作为大会的核心Workshop之一,AUTOPILOT 2026汇聚了Waymo、英伟达 (NVIDIA)、Zoox等全球顶尖科技巨头与名校学者。
CVPR AUTOPILOT 2026 网站首页
CVPR AUTOPILOT 2026视觉问答挑战赛榜单(前五名)
核心技术
本次VQA(视觉问答)赛道依托于真实的行车记录仪视频与2COOOL交通安全数据集,要求参赛队伍利用前沿的多模态AI架构,针对视频片段精准输出多达25个维度的结构化标签,考验多模态大模型在复杂多变的城市交通安全动态场景中进行时间、空间与因果推理。具体包括:
Ø 时空与环境感知:精准判断事故时段、天气状况以及光照条件,考验模型在不同能见度与恶劣环境下的视觉鲁棒性。
Ø 道路与基础设施:识别事故发生地周边设施、道路类型、车道、交通管制设备或道路标志配置以及自车(Ego-vehicle)所处的位置。
Ø 事故主体与行为识别:对事故类别进行定性分类,并精确定位主要事件实体(肇事者或本可避免事故的一方)与次要实体(受害者、次要原因或被撞实体),精细分类实体类型并解析潜在的风险行为。
Ø 因果推理分析:基于多模态因果推理,预测主次要实体可能采取的有效预防与避险措施。
Ø 碰撞分析:针对车辆实体,精确判定初始碰撞的具体位置以及接触面。
eCityAI团队提出了一种名为STRIVE(基于专家集成的结构化交通推理,Structured Traffic Reasoning with Inference Via Experts Ensemble)的多模态推理框架:
STRIVE框架推理工作流
该方法构建了一个涵盖不同视觉增强、提示词和模型配置的多元专家池进行并行推理,在视觉处理阶段运用了多尺度编码和低光增强锐化等技术手段,有效克服了不同光照条件和场景剧烈变化带来的视觉信息质量衰减。同时,STRIVE框架也结合了Gemma和Qwen3.5等基座模型的互补优势,基于交通安全的确定性规则先验知识创新地引入了逻辑约束模块,对模型结果进行全局二次校验与修正,兼具鲁棒性与垂域适配性的结构化场景理解,相关研究成果也将发表于此次CVPR 2026 Workshop。
易智通视产品
从国际赛场的前沿研究到城市治理的实战应用,中控信息将沉淀的技术转化为核心底座——eCityAI多模态大模型,“易智通视”是以此为基础打造的全链路AI视觉研判与事件治理平台。平台聚焦智慧城市领域,实现从视频感知、智能研判、事件降噪到运营分析的一体化闭环能力,为城市交通治理、道路安全管控等复杂动态场景提供高效、稳定、可规模化落地的AI解决方案。
易智通视平台具备强大的复杂场景适应能力,全面覆盖时空环境感知、道路设施识别、事故主体行为判定、因果推理、碰撞分析等多维结构化研判,满足实战场景高可靠、高精准的业务要求。
事件分析示例
易智通视一体机
平台还支持多源视频一站式接入与多模型高效调度,全流程降噪、智能复盘等事件分析模块,大幅降低人工复核成本;同时,轻量化的部署方案使其能无缝对接主流视频设备与业务系统。
凭借领先的多模态推理能力与工程化落地优势,易智通视正真正将AI大模型前沿技术转化为一线实战生产力,助力行业迈向更智能、更高效、更可靠的数字化治理新时代。
砥砺前行·产业深耕
此次在代表行业最高标准与前沿趋势的国际学术竞赛中勇夺亚军,充分彰显了中控信息在人工智能底座与复杂场景感知领域的硬核实力。以此为契机,我们将持续推动易智大模型的全方位能力跃升,加速AI技术从实验室走向真实世界的关键跨越。
中控信息将持续聚焦“AI+”在智慧城市等真实业务场景,致力于打造高可靠、可规模化落地的AI解决方案,以国际领先的技术底座赋能城市基础设施智能化升级,为行业数智化转型与安全管控提供更稳定、更智能的核心支撑,助力城市迈向更安全、更高效、更可持续的智能化未来。




