当前位置:

AI也会“学新忘旧”?我国团队让人群计数模型“温故知新”,跨场景误差降15%

给AI请位“学习教练”,专治“学新忘旧”

商场训练的AI,到地铁站就“失忆”?
你有没有过这样的经历:背单词时刚记住“abandon”,转头就忘了上周背的“accommodate”?人工智能模型也犯这种“健忘症”——在商场场景训练好的人群计数AI,换到地铁站就“失忆”,计数误差翻倍;学了新场景数据,旧场景的准确率暴跌50%。这就是困扰AI领域多年的“灾难性遗忘”难题。

想象一下,商场里的AI摄像头能精准数出客流(误差59.7人),可一旦用地铁站的数据继续训练,再回头数商场客流,误差直接飙到124.6人——相当于“学了第二课,第一课内容全忘光”。更麻烦的是跨场景“水土不服”:在明亮商场训练的模型,到光线昏暗的夜市,计数准确率骤降30%,因为人群密度、视角、背景差异太大,模型“认不出”新环境。传统模型要么“健忘”,要么得背着所有场景的数据“负重前行”(10个场景就要10倍存储),或者训练10个独立模型(地铁站一个、商场一个),部署成本高到“用不起”。

为啥AI这么“健忘”?三大“软肋”在作祟
传统人群计数模型的“健忘症”,根源藏在三个核心问题里。

首先是参数“黑板效应”:模型参数就像一块黑板,学新场景时会擦掉旧场景的“板书”。比如在SHA(商场)和SHB(地铁站)两个场景增量训练,传统模型在SHB上误差能控制在68.3人,但SHA的误差会从59.7人跌到124.6人,相当于“写新板书时,把旧板书擦得干干净净”。

其次是场景“认生”难题:不同场景的数据分布差太远——商场明亮稀疏,地铁站昏暗密集,模型就像“只见过白天鹅的人,看到黑天鹅就说不是天鹅”。单一域训练的模型,在没学过的场景(如广场、夜市)中,准确率能暴跌40%。

最后是存储“包袱”太重:要让模型记住所有场景,要么存下所有数据(存储开销随场景数量线性增长),要么训练多个独立模型,城市级部署时“模型比摄像头还多”,运维成本高到难以承受。

FLC框架:给AI请位“学习教练”,专治“学新忘旧”
近日,《Frontiers of Information Technology & Electronic Engineering》发表我国学者的研究,提出FLCB(Forget Less, Count Better)终身学习框架。这套技术就像给AI请了位“学习教练”,通过两大机制让模型“边学边复习”,彻底告别“金鱼记忆”。

“老师带学生”:让旧知识不被“擦掉”
训练新场景时,FLCB会把旧场景训练好的模型当“老师”,当前模型当“学生”。“老师”会把旧场景的“知识笔记”(特征层和输出层数据)传给“学生”,“学生”学新知识时必须同时“复习笔记”,确保新旧知识都掌握。比如在地铁站场景训练时,“学生”模型会对照“老师”(商场训练后的模型)的输出调整参数,就像学生边学新课文边翻旧笔记,避免“学一个忘一个”。

“学习计划表”:平衡“学新”与“温故”
传统模型只盯着新场景的“考试分数”(计数误差),FLCB则加了“复习分”(自蒸馏损失),用超参数λ平衡两者——λ就像“每日学习计划表”,学新内容时留30%时间复习旧内容,避免“只顾赶进度,忘了回头看”。这种平衡让模型在新场景训练时,既学好新知识,又不丢旧知识。

效果有多好?实测数据说话
这套“学习方法”到底行不行?研究团队在SHA、SHB、QNRF、NWPU四个真实场景数据集上做了测试,结果让人惊喜:

遗忘度“断崖式”下降
FLCB的“平均遗忘度”(归一化反向迁移nBwT,值越小遗忘越少)从传统方法的0.371降到了-0.010,相当于“从‘学完就忘’变成‘越复习越牢’”。部分场景甚至“旧知识掌握更扎实”:比如SFANet模型在商场场景的误差(MAE)从85.4人降到69.4人,准确率反升。

跨场景“认路”能力飙升
在没学过的JHU-Crowd++数据集上,FLCB的计数误差(MAE)达84.8人,比联合训练(89.8人)和传统终身学习方法(90.4人)都低,尤其在高密度、复杂遮挡场景(如春运地铁站)中,准确率比传统模型提升15%。

存储“减负”60%以上
FLCB不用存历史数据,单模型搞定多场景,存储开销降低60%以上,训练时间比联合训练缩短20%——相当于“从背着一书包课本上学,变成只带一本笔记本,轻装上阵”。

未来能去哪?从智慧城市到疫情防控
FLCB的突破不止于实验室,已在多个场景展现实用价值:

智慧城市:一个模型管遍商场、地铁、广场,动态监测客流,避免拥挤踩踏;
疫情防控:学了小区场景再学商场场景,人群聚集风险预警误差控制在10人以内;
数据隐私保护:在合成数据(GCC数据集)上训练后,对真实场景(如ShanghaiTech PartB)的泛化误差达16.1人,比传统合成转真实方法(CycleGAN,19.9人)更准,解决标注成本高、隐私数据难获取的难题。
当然,它也有“小缺点”:遇到极端稀疏(1-2人)或密集(2万人以上)人群,计数精度还有提升空间;目前还依赖标注数据,未来结合自监督学习,有望实现“无师自通”。

或许不久后,城市里的AI“计数员”会像老交警一样,无论晴天雨天、人多人少,都能准确“报数”,再也不会“学新忘旧”啦!

来源: 信息与电子工程前沿FITEE


152687
AI也会“学新忘旧”?我国团队让人群计数模型“温故知新”,跨场景误差降15%
1119
每日蝌普
新闻
信息与电子工程前沿FITEE
2025-10-20