努力加载中
  • 推荐
  • 要闻
  • 财经
  • 娱乐
  • 时尚
  • 情感

热点推荐

热门图文

谷歌想破解海豚语言,实现用“豚语”来和它们交流?
潜水游世界

在世界海豚日(4月14日),谷歌宣布,他们开发了一个帮助解码海豚交流的人工智能模型:DolphinGemma

这是第一个尝试理解海豚语言的大语言模型。他们不仅想知道海豚到底在说什么,还试图创造出豚言豚语来和海豚交流。

AI真的能让我们跟海豚说上话吗?

谷歌对海豚做了什么

DolphinGemma是谷歌与“野生海豚计划”(Wild Dolphin Project,WDP)合作开发的。

WDP是一个非盈利的研究机构,他们从1985年开始,一直在追踪巴哈马的大西洋斑海豚,收集了长达数十年的单个海豚的水下视频和音频,以及海豚的生活史和行为。

一只海豚一边觅食一边看着幼崽,她会用独特的哨音叫孩子回来,右图为这种哨音的可视化频谱图|DolphinGemma

WDP的音频数据库里,有一半是海洋噪音,剩下的则是海豚经常发出的三类声音。WDP根据几十年的观察,将一些声音与特定的行为情境匹配了起来:

海豚个体发出的独特且可以辨认的口哨音,有点像海豚的名字。海豚母亲和孩子之间常常用这种哨音来互相找回对方。

· 爆裂脉冲(burst pulses)

这种声音常常是海豚在打架时发出的尖锐短促的声音,听起来有点像刺耳的尖叫。

· 咔嗒声(clicks)

海豚通常会用咔哒声来定位和探测。快速连续的咔嗒声,连在一起听起来像“嗡嗡”声(buzzes),往往出现在海豚求偶时表达兴趣或者驱赶鲨鱼等猎食者。

DolphinGemma是一个音频输入、音频输出的模型。它先利用WDP的音频数据库进行训练,通过分析自然环境下海豚声音序列的模式和结构,最终预测出序列的下一个声音——就像打字的时候,输入法会联想你下一步想打什么字一样。

DolphinGemma在早期测试阶段产生的哨音(左)和爆裂脉冲(右)的可视化频谱。DolphinGemma将海豚的自然声音编码为声学单元进行处理,并输出生成新的模拟海豚声音的音频序列|DolphinGemma

此外,谷歌和WDP还试图创造一些新的语言来跟海豚交流。他们与佐治亚理工学院(Georgia Institute of Technology)合作,开发了一个名为“鲸类动物听力增强遥感”(Cetacean Hearing Augmentation Telemetry,CHAT)的系统。

摁一下面板上的按钮会发出特定的声音,用“海豚语”教海豚说海草这个词|DolphinGemma

这是一台水下计算机,研究者利用它发出一些类似海豚的声音,并将这些词汇与特地的物品联系起来(比如海藻、海草、研究者的围巾)。

比如,研究者A使用CHAT发出代表围巾的音,研究者B会将围巾递给A。研究者设想海豚在偷偷观察后会学会“围巾”怎么说|DolphinGemma

真的可以交流吗?

但这不意味着我们已经破译海豚的语言了。相反地,正如WDP的研究总监Denise Herzing所说:我们并不确定海豚是否有语言。

海豚常发出三种不同类型的声音,虽然这些声音与特定行为高度相关,但科学家尚不确定它们是否拥有明确、具体的含义——比如是否代表“某个物体”或“某个动作”。更重要的是,即使这些声音可以被视为“词汇”,我们仍然不清楚海豚是否具备类似的语法结构来组织这些词汇,从而表达更为复杂的含义。

如果DolphinGemma发现了某种固定的声音模式,WDP多年的观察结果则可以提供“发出这个声音时,海豚在做什么”的信息,这就有可能了解海豚的交流方式,甚至了解它们的语言和文化。不过从目前来看,我们最多只是理解了声音与行为之间的联系,还不算真正翻译出“海豚语言”。

一群大西洋斑海豚(Stenella frontalis)|Google

另外,不管是DolphinGemma对声音序列的解析,还是CHAT项目试图与海豚互动,这些研究都是基于WDP在巴哈马追踪的大西洋斑海豚。但不同地区、不同种群的海豚,发声方式可能存在差异,可能也有自己的方言和口音。因此,DolphinGemma目前的训练成果不一定能推广到其他海豚上。

谷歌表示,他们预计将在今年夏天开源DolphinGemma。届时,DolphinGemma还能用于其他鲸豚物种的声学研究。

AI加持下的动物研究

DolphinGemma并不是第一个想要破译动物语言的模型。在人工智能迅猛发展的这几年,越来越多的动物研究里都有了AI的身影。

一个名为“鲸类翻译倡议”(Cetacean Translation Initiative,CETI)的非盈利研究项目,专注于解码抹香鲸的交流。抹香鲸最常发出的声音是一连串的咔哒声,这种像摩斯密码一样的声音被称为“密码曲”。CETI收集了60头抹香鲸的8000多条密码曲,通过传统的统计分析和机器学习,发现咔哒声的数量、节奏和节奏的变化组成了不同的密码曲。他们认为,抹香鲸可以通过无限的组合创造出各种密码曲,从而拥有庞大的交流系统;但目前仍无法破解这些咔哒声和密码曲包含了什么信息。

CETI 项目尝试“解码”抹香鲸的交流系统。图中展示了从水下机器人和无人机收集语音与行为数据开始,经过数据处理、共享与可视化,结合鲸类社会行为、生物学观察、机器学习和语言学分析,逐步构建鲸类语言模型,尝试理解其语法、语义及交流内容|CETI

另一个研究团体“地球物种项目”(Earth Species Project)关注的物种更多,包括乌鸦、白鲸、大象等。他们同样希望利用人工智能,解码动物的交流。他们认为这有助于动物保护,比如帮助濒危物种保留它们的语言,或者通过破译鲸豚类动物的语言,在它们即将浮出水面时,提醒附近船只避开动物。

此外,还有用于分析啮齿类动物、非人灵长类动物叫声语义的模型。2022年发表在《自然-通讯》的一篇研究,通过机器学习,发现了斑胸草雀不同圈养种群之间求偶歌曲的差异,而且这种差异会影响雌性的选择。研究者认为,人工智能可以找出人类尚未发现细微的差别。

斑胸草雀(Taeniopygia guttata)|christoph_moning / Wikimedia Commons

今年年初,AI还帮人们发现了一种在当地消失近30年的鸟在澳大利亚墨尔本西部的草原上,保护组织安装了35个录音机,收集了数万个小时的录音。他们使用AI对录音进行筛选,AI从其中两个地点发现了一种轻柔低沉的“Ooming”声——这是领鹑的叫声,人类专家随后确认了AI的发现。

领鹑是澳大利亚特有种,因为栖息地的丧失,其种群数量大幅下降,现在属于极度濒危物种,上次在这片地区出现还是1989年。如果没有AI,人类要从海量的声音信息里发现领鹑,工作量将会大得多。

AI帮助研究者找到了领鹑(Pedionomus torquatus)的踪迹|JJ Harrison / Wikimedia Commons

我们好像总是想知道动物在说什么,家中的宠物在表达什么需求,大自然里的动物在交换什么情报……这可能只是出于本能的好奇,但如果能够了解动物之间的交流,我们就可以更懂动物,懂得它们的需求,或许也更懂得它们之间的情感和连结,懂得它们与人类的相似与平等。

但对我们人类来说,动物之间的交流还有太多的未知,自然还有太多的神秘。人工智能可以解开这些秘密吗?拭目以待吧。

参考文献

[1]https://blog.google/technology/ai/dolphingemma/

[5]https://www.theguardian.com/environment/2025/feb/12/plains-wanderers-spotted-in-melbournes-west-for-first-time-in-30-years-with-help-of-ai

作者:麦麦

编辑:黄线狭鳕

题图来源:Veronica Maglieri, Federica Vantaggio, Elisabetta Palagi, Livio Favaro

本文来自果壳自然(ID:GuokrNature)

如需转载请联系sns@guokr.com

相关推荐
x