热点推荐
热门图文
在中国,身份证是公民身份的象征,办各种大事时都需要出示身份证来证明自己的身份。但是,身份证只是一张小小的卡片,便携的同时也很容易丢失,丢失身份证实在是一件麻烦事。如果能用什么东西替代身份证证明个人身份,该多好啊。也许未来,我们的声音可以达到这个目标。
声音如何证明身份
用声音作为身份证并不是什么稀奇事,事实上,每个人的声音都是独一无二的,完全可以作为身份的象征。
当我们说话时,空气从肺部排出,沿着气管上行,到达喉部,喉部的声带拦住了空气,声带放松或收缩时,空气的振动频率会发生改变,改变我们声音的音高。空气最终从嘴巴和鼻子排出到体外,从而发出声音。空气在嘴巴和鼻腔中来回碰撞,激发出不同的振动声波,我们所听到的语音是这些振动声波的组合。因此,不同人的音色会因为声带、嘴巴和鼻腔的构造不同而各具特色。
除了音色不同,由于地域、年龄甚至职业等差异,我们每个人还有独特的说话特点。比如同样一个“a”,有人读作“啊”(一声),有人读作“啊”(四声)。而“a”仅是一个普通的音素,不同的语言中这样的音素有许许多多,我们通过将音素组合在一起发出语音,如果每个人的音素发音都有一点不同,最终发出的语音就会有很大差异,就像北京话、河南话、闽南话听起来天差地别一样。
年龄和职业也会影响人们的语音,这决定着我们的说话方式和说话内容——说话方式是直接或委婉、感性或理性,说话内容是深刻或浅显、严肃或有趣,根据这些也可以识别不同的说话者。比如,对于熟悉的人,你可以通过音色来识别他们,但即使遇上不熟悉的人,通过他们的说话方式,也许你也能对他们的年龄和职业做出一些猜想。如我们所知,律师、老师、销售员或艺术家等不同职业的人,他们的说话方式并不相同。
声纹分析神通广大
如果人们可以通过自己的耳朵和大脑将他人进行粗略的识别,那么计算机同样可以做到,而且能做得更好。在计算机面前,发声者的大部分个人信息,包括身高、体重、年龄、面部特征,甚至连社会经济背景、收入水平、生理和精神状况等都能判断出来。
美国卡内基梅隆大学的声学专家丽塔·辛格在声纹分析领域已钻研了20多年,只要给她一段一定时长的录音,她就能将对应的说话者找出来。2014年,辛格用这个特长为美国海岸警卫队解决了一个大问题。
美国海岸警卫队每年要处理约1.6万个求助电话,而其中有1%是恶作剧。虽然假求助数量不多,但为了处理这些假求助,警卫队需要出动成本不小的直升机、搜救船和救援人员,而且假求助还可能占用真正需要救助的人的资源。因此,警卫队迫切需要一种识别假求助电话的方法,他们向辛格进行了求助。
辛格及其同事共同开发了一套声纹分析软件,将求助电话录音输入软件,可以分析出录音背后的信息。软件会把音频切成以毫秒为单位的片段,然后一段段地进行梳理和分析,通过识别独特的标识来获取信息。比如说,通过说话者的声调和音色,计算机可以得知说话者的肌肉运动速度、声道惯性、肺容量和骨骼结构等生理特征,这一切共同决定着语音,是无法作伪的。
声纹分析还能获知说话者的情绪状态,借此判断对方是否受到胁迫。因为我们的情绪会影响语音,开心时音调更高,难过时语音低沉,害怕时声音发颤等,一旦说话者的语气、习惯、呼吸发生变化,计算机就能借此分析其情绪状态。声音还会透露环境的信息,在空旷的地方说话和在密闭环境说话时的声音是不一样的。根据这些知识,计算机可以猜出说话者所在环境的一些信息。此外,计算机还可以根据当地电网的电压波动,判断出打电话的人的物理位置以及通话时间。
以上信息足以让美国海岸警卫队快速锁定求助者,有时候甚至不用出警,他们就能判断哪些是假的求助者。这样一来,假的求助者就不敢再冒着被处罚的风险恶作剧了,警卫队的难题得到了解决。
声音身份证不太远
不只辛格,还有许多科学家在研究声纹分析技术,甚至已经有一些公司面向普通消费者开展了声纹分析业务,让他们能从一段声音中获取想要的信息。
以色列“语音感知”公司向客户提出了一个有趣的承诺:只要提供某人的声音,便能预测出这个人的行为和性格,包括但不限于是否会逾期返还银行贷款、是否是合格的职场人和是否会购买推荐的产品等。通过将收集到的声音样本与被试者的职业、性格和行为模式等参数进行匹配和机器学习,“语音感知”公司开发了一套语音处理算法,这套算法能识别多种语言,并且每秒测量超过200个语音参数,包括声调、音高等,运用这些信息对被试者进行分析。
美国卡内基梅隆大学的声学专家丽塔·辛格
“语音感知”公司使用一家大型欧洲银行提供的数千名贷款者的语音样本测试了其技术。预测算法将这些样本按准时还款的可能性大小分为了低、中、高风险三组,而最终被归类为低风险组的贷款者中逾期还款的比例是6%,高风险组逾期的比例则为27%。在另一项针对员工离职概率的评估中,被算法归类为“低风险”的员工中有13%离职,而高风险组的离职率为39%。由此可见,用声纹进行行为预测还是具有很高参考价值的。
当然,想提高声纹分析的准确性,需要海量的样本和数据,而有许多国家已经在建立自己的声音数据库了。国际刑警组织与来自192个国家的执法机构合作,从许多知名的社交软件公司获取了用户录音,建立了一个包含海量录音信息的语音分析平台。警方可以将来自电话通话或社交媒体帖子的嫌疑人的语音样本与数据库中的犯罪分子的语音样本进行匹配,从而提高抓捕犯人的效率和语音证据的可靠性。
然而,任何技术都有两面性,声纹分析技术如此神通广大,也不禁让人担心,以后人们的隐私将更加难以得到保护。也许我们只要说上一段话,拥有相应技术的人就能将那些我们不愿被人知道的秘密通通挖出来。另外,当我们需要申请贷款、寻找工作、购买保险时,声纹分析的结果是否又会成为隐形的阻碍和额外的歧视?如何平衡好新技术的优缺点,是比开发新技术更复杂的问题。