噪声无处不在,在生产生活的方方面面中,在科研的信号处理中,到处都有噪声的身影。施工现场机器的轰鸣、集市上各种商贩的吆喝、交通要道上往来车辆的鸣笛声这些噪声都是人们在生活中“深恶痛绝”的对象。然而,你是否想过,这种“噪声”是否真正总是一无是处的呢?
以交通噪声为例,人们想方设法降低交通噪声以保护身心健康。然而,若你在一个不小心睡过的早上,朦胧之间听到了窗外的车流声,随着声音越来越清晰,你一定会猛然从睡梦中惊醒:时间不早了,再不起床就要迟到了!作为交通噪声的来源之一,传统燃油车的发动机声音对于车主而言也通常被视作一种噪声,怎么来降低发动机的声音也是车企的长期研发目标之一。然而,在电动车逐渐普及的今天,电车低速行驶时基本上没有声音的特点却意外产生了新的安全风险隐患,即行人由于听不到电车的“噪声”而没办法做到及时避让。一个常见的做法就是加入模拟声等提示音,来使得行人注意到驶过的电车。电钻声音作为建筑噪声也是生活中的常见噪声,然而电钻在木头、金属等不一样的材质上声音的区别,却也包含了施工信息,这告诉了我们,有些噪声与信号和信息是同源的。从这些场景来看,我们得知有些“噪声”在适当的时候是能发挥非消极作用的。
在工程科学中,各种“噪声”几乎不可避免,早慢慢的变成了科研人员不断尝试解决的重大困扰。我们大家都知道,噪声的来源往往是多元的,譬如由于仪器精度不足导致的仪器误差、人为操作中的失误导致的偏差、极端环境等外界干扰导致的信息失真等,因此噪声带来的影响同样十分广泛,例如医学超声图像中由于相干声波的路径差异会不可避免地导致斑点噪声,遥感图像成像中会因为特殊环境产生难以预料的噪声。
和日常生活中一样,过往的研究工作中的一个约定俗成的假设就是噪声对目标任务起负面作用,为此有大量的工作试图将噪声含量尽可能地降到最低。近期,西北工业大学光电与智能研究院(iOPEN)的李学龙教授在多年的科研中通过观察验证,对这一假设提出了疑问:噪声真的总是有害的吗?正如电钻在木头和金属等不一样的材质上发出的不同噪声。在图2所示的利用AI算法对图像进行分类的系统,在对图像加入适量的噪声时,识别准确率不降反增,整体上图像分类准确率随图像含噪率的变大“先增后减”。
图2 图像识别准确率随图像噪声强度的增大而“反直觉”地呈现出“先增后减”的关系
李学龙教授对这一问题进行了深入思考和系统地分析验证,归纳总结出了导致这一反直觉现象的核心原因有二:一是“任务”的变化,任务不仅包括了任务的本身,还有执行任务的人的先验知识;二是“噪声量”的多少。仍以交通噪声为例,绝大多数情况下,如果人们关心除车流声外的声音信息,则此时车流声音变为无用噪声;但是,如果将“判断时间起床”等“任务”视作一个与时间相关的语音识别任务,那么车流噪声的强弱则能够从某些特定的程度上提供时间信息,进而帮助简化该任务。需要强调的是,若这种噪声强度或含量过高,那么噪声就会“喧宾夺主”,即会导致语音识别任务中的主体声信号被大量遮掩,严重阻碍原本的任务。这也就是我们仍称这种信号分量为“噪声”的原因。
以噪声能否简化或提高目标任务为划分标准,噪声可以被分为“正激励噪声”(Positive-incentive Noise, Pi/-Noise)和“纯噪声”。正激励噪声就是我们提到的那些通常被忽略却又实则能起到正面作用的随机噪声;而被认为是“纯噪声”的部分,才是传统研究中假设的真正无用的、有害的噪声。
正激励噪声这一现象启发了我们重新审视对噪声的解决方法,这一思路能够适用于信号处理、人工智能、涉水光学等多个领域,也是临地安防的重要理论基础之一。譬如,在跨域遥感的目标检测中,传统认知里通常认为背景是需要剔除的“噪声”,圈定目标的外围框就应该越小越好;然而正激励噪声启发我们,在合适的场景下,利用部分背景反而能轻松实现更为精准的检测:比如我们想在遥感图像中检测出飞机等目标,在这个场景下,飞机都变成了比较小的目标,而飞机周围常常会出现的背景(如跑道、停机坪)则能够在这次场景下帮助提高检测率(见图3)。就是说,不要把圈定飞机的框画得太接近飞机,而是适当大一些,包括进来一些飞机旁边的场景,反而能让飞机识别得更好,因为外围的场景中包含了一些与飞机这个目标有语义关联的内容,例如跑道。不过,仍必须要格外注意的是,过多地引入背景信息显然也会影响检测效果。
图3 在传统目标检测中,一般认为检测框越小越好;然而在检测飞机时,适度扩大检测框引入跑道、停机坪等背景信息可提升检测效果
正激励噪声(Positive-incentive Noise, Pi/-Noise)成果发表在IEEE Transactions on Neural Networks and Learning Systems。论文中,李学龙教授首先提出要对特定任务定义“任务熵”(Task Entropy)
之间的“互信息”(Mutual Information)。互信息是信息论中用来度量两个随机变量“共有信息”的指标,在任意情况下,互信息总为非负值。在论文中,李学龙教授指出,若互信息非0,则意味着噪声
的复杂度不会被降低,则称此类噪声为纯噪声。论文还通过提高互信息的“激活阈值”
对应的“任务概率分布”。论文针对几种常见的任务给出了示例:如在常见的单目标分类任务中,数据集由数据样本集合
表示“已有数据样本(如图像)被赋予不同标签的概率”,它的熵可因此衡量“此数据集上单标签分类任务的不确定性/难度”。此外,李学龙教授还在论文中对随机共振、对抗训练、多任务学习、对比学习等进行了详细讨论。
“正激励噪声(Positive-incentive Noise)”和“信容(Information Capacity)”在系统的获取、处理、应用的所有的环节都有指导作用,是临地安防(Vicinagearth Security)技术体系中的重要理论基础,该体系(见图4)涉及航空航天、机械电子、量子通讯、新材料、人工智能等多个学科和交叉领域。