• 首页 > 云计算频道 > 大模型

    当AI学会了闻味儿,人类就可以少工作70年

    2023年09月23日 19:18:01   来源:微信公众号GenAI新世界

      本文来自于微信公众号GenAI新世界(ID:gh_e06235300f0d),作者:李禾子。

      不知道有多少人还记得Google Nose。

      这个谷歌在 2013 年愚人节上线的搞怪项目声称有一个包含 1500 万种味道的气味资料库,用户只需要在谷歌搜索框输入关键词,点击“闻一闻”,就能直接在电脑旁闻到该物体的味道,比如新车的味道,篝火的味道,以及埃及古墓的味道(?)等等。

      就是这个十年前离谱但脑洞大开的玩笑,正在被它的发明者部分变成现实。

      今年 9 月初的《科学》杂志刊登了一篇由初创公司Osmo(从谷歌分拆)和莫奈尔化学感官中心(Monell Chemical Senses Center)等多个研究团队共同发布的论文,其中称,AI模型可以让机器拥有比人类更好的“嗅觉”。

      乍一听这简直太不可思议了,毕竟对大众来说,嗅觉是比视觉和听觉抽象得多的存在。RGB颜色图谱可以描述人眼看到的色彩,人耳听到的声音也可以转化为不同频率的波长,甚至让人感受到震动,但唯独嗅觉,看不见摸不着,更难以用量化的指标描述。

      换句话说,把气味数字化听起来就是件不可能的事。

      而这篇论文的研究人员核心要做的,正是去试图创建一个能够如实反映气味特征的人类嗅觉高维图谱,即POM(Principle Odor Map)。

      那么具体是怎么做的呢?

      我们知道,气味是人类嗅觉系统对散布于空气中的某些特定分子的感应。气味分子进入鼻孔后,会与鼻腔上方的嗅觉细胞产生(受体)反应,产生的生物电波再通过神经传到大脑,继而识别味道。

      而气味的构成实际要比色彩、声音复杂得多,有数以百万计的不同种类,每种气味又都由数百个化学分子组成,其性质各不相同。与之相应地,人类的功能性嗅觉受体有大约 400 个,远远超过了我们用于视觉的 4 个,以及用于味觉的约 40 个。

      所以面对如此复杂的嗅觉机制,研究人员首先做的事情就是创建了一个机器学习模型——消息传递神经网络(MPNN)。

      这是一种特定的图神经网络(GNN),因为图神经网络是一种基于图结构的深度学习方法,将传统的图分析引入,提供了对非规则数据提取特征的方法,因而也非常适合用来学习复杂的气味特征。

      模型搭好之后,接下来就要喂给它学习材料。

      研究人员结合了Good Scents and Leffingwell & Associates(GS-LF)香精香料数据库,建立了一个包含约 5000 个分子的参考数据集作为训练基础素材,每个分子可以有多个气味标签,比如果味、花香、芝士味和薄荷味等等。

      通过将分子的形状结构作为数据输入,模型得以输出最能描述某种气味的对应气味词。

      为了使训练结果更准确,研究者同样用到了各种方法来优化模型参数。比如将GS-LF香精香料数据库按照8: 2 的比例划分为训练集和测试集,训练集被进一步划分为五个交叉验证的子集;以及使用贝叶斯优化算法对数据进行交叉验证,并对GNN模型的超参数进行优化等。

      这张图直观表示了每种气味的感知距离,比如花香(floral)、肉味(meaty)和酒香(ethereal)几个大类彼此间是存在较大感知距离的;但每个大类下包括的更具体的气味,比如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距离则较为接近。

      论文将POM和此前有过研究先例的基于摩根指纹的气味空间图(Morgan fingerprint-based maps)进行了对比,发现后者尚无法体现上述感知距离:

      为了进一步验证模型训练效果,研究者接着找来了 15 位气味专家,来和模型比拼谁识别气味更准确。

      15 位专家每人需要闻 400 种气味,研究者会给出 55 个气味形容词,让他们就每种气味对这 55 个选项用1- 5 分来打分,评定每个气味形容词在多大程度上适合于这个气味。

      结果发现,对于其中53%的测试分子,模型的表现都优于小组成员的平均值。

      研究者还将模型的预测结果按气味描述词进行了分类,发现除麝香外,模型对分子气味的预测结果均在人类组的误差分布中,且在 30 个气味描述词的预测结果中优于人类组中位数:

      后续,研究者还对模型的性能进行了反复验证,获得了较为稳定的分子结构-气味关系。

      下面就进入到了最激动人心的气味图谱大规模绘制环节,并最终得到了下面这张图:

      你可以把上文那个表示气味感知距离的坐标图理解成是这张图的无限放大版。论文提到,这张图中包含了约 50 万种气味分子,当中甚至有许多还没有被发现或合成出来(但确实能计算出来)。

      做个更直观的比较,如果让一名训练有素的人类评价员寻找这些气味,大概需要连续工作 70 年才可以全部收集到。

      看起来,这篇论文着实是完成了一件大事。

      这时就有网友发问了,机器为什么需要闻气味呢?

      其他人也纷纷给出了自己的见解,比如认为可以用于工厂污水处理的质量控制,进行爆炸物、毒品或是尸体的嗅探等等:

      这样一来警犬和搜救犬可能要下班了

      有人希望可以据此研发出一款好的除臭剂,因为人在进行大量有氧运动比如跑步或举重后会散发出不好的气味:

      也有人对这一研究成果在医疗方面的应用很感兴趣,比如可以用来开发嗅觉丧失症的新疗法,或者通过气味检测疾病等等:

      还有香水行业的从业者觉得这帮了自己大忙,“让它告诉我的同事什么时候他们喷了太多古龙水”:

      这些预测事实上都不无道理。首先机器确实可以帮人类解决有时对气味辨别不准确的问题——研究表明,每个人对气味的感知程度都各不相同,会根据感觉和生理信号引发不同反应,其中也受到经验、期望、个性或情境因素的影响。

      而气味某些时候对人来说又十分重要。

      不好的气味就不用说了,某些有害气体还可能会危害健康,这时如果可以有机器代替某些特定职业帮助人类或动物作业就再好不过。

      而对另一些气味可以为之带来好处的职业,比如调香师、厨师、设计师、艺术家和建筑师等等,也有调配出更具功能性的气味的需要。一些场合会将气味应用在环境中,比如纽约Sloan-Kettering癌症中心会在空气中散布香草油,以降低患者对于磁共振成像(MRI)测试的幽闭恐惧症;芝加哥期货交易也会散布特定的香味以降低交易大厅的噪音分贝。

      还有研究表明,人类大多数与气味有关的记忆都来自婴儿及幼儿时期的最初十年,而语言和视觉所产生的记忆通常在10- 30 岁之间产生。这部分解释了气味可以唤起人遥远的回忆,而且透过气味所引起的回忆,经常比视觉或听觉所引起的回忆,更加情绪倾向。

      所以气味和人类的联系还是非常紧密的,只是我们在很多时候并不容易察觉。

      网友们的猜想也在论文的作者之一、来自Osmo公司的Alex Wiltschko那里得到了验证。他在发布在Osmo官网的一篇文章中写道,

      “气味图谱是我们实现更远大目标的基础。如果可以开发出能够复制我们鼻子或狗的鼻子的功能系统,我们就可以尽早发现疾病;人工智能也将帮助医生找到更有可能在临床上取得成功的药物,更好地帮助合成化学家和调香大师进行工作……我们未来的工作目标是,为改善人类健康和幸福奠定坚实的科学和商业基础。”

      不过他也表示,论文依然存在诸多不足。

      比如,无法体现分子气味的浓淡,只能预测它闻起来是什么样;只对单个分子气味进行了预测,现实生活中更多却是混合气味;而即便是所有的能力都达到了,对气味的复制和还原也将是很大的挑战等等。

      最后,说了这么多,有一个网友的评论倒是很朴实,“我觉得这会让品酒失去乐趣”:

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    TCL实业荣获IFA2024多项大奖,展示全球科技创新力量

    近日,德国柏林国际电子消费品展览会(IFA2024)隆重举办。凭借在核心技术、产品设计及应用方面的创新变革,全球领先的智能终端企业TCL实业成功斩获两项“IFA全球产品设计创新大奖”金奖,有力证明了其在全球市场的强大影响力。

    新闻

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。