突破叙事尺度 刻画极致人物 迷雾剧场《漂白》1月17日上线爱奇艺1月20日手机数码国补落地京东 超千万国补商品等你挑选超千万货品已备足 1月20日来京东购手机享国家补贴每件最高500元拥抱创新科技,探寻体育变革之路—— 第二届LALIGA EXTRATIME体育行业论坛在京成功举办斑马技术《2025全球消费者调查报告》:注重防损管理,增强顾客体验终端创企Nothing拟募资1亿美元 一加联合创始人创立恩智浦获欧洲投资银行 10 亿欧元贷款,用于在欧多国研发创新工作入手松下ZS99相机新品首选京东 售价2998元可先人一步入手1月20日打开京东搜索「1」 3C数码“疯狂星期一”爆款低至1元当代年轻人用上AI,从夸克开始消息称iPhone SE 4将有白色和黑色 预计3月份推出全球PC市场迎来温和复苏:2024年出货量增长1.3%,联想和苹果表现亮眼比亚迪已在韩国推出Atto 3 预计2月中旬开始交付发展新质生产力 赋能健康产品力 ——劲牌有限公司2024年度科技责任(成果)报告美光减产后 SK海力士也计划将上半年NAND闪存产量削减一成赵明离职信曝光:离开荣耀是人生中最艰难的决定消息称京东服饰换帅,阿里前高管担任负责人这年头,谁在互联网上学这么“硬核”的AI?开战2025,本地生活商家「另辟蹊径」年底Mini LED电视到底怎么选?认准这些新技术不踩雷!
  • 首页 > 云计算频道 > 大模型

    当AI学会了闻味儿,人类就可以少工作70年

    2023年09月23日 19:18:01   来源:微信公众号GenAI新世界

      本文来自于微信公众号GenAI新世界(ID:gh_e06235300f0d),作者:李禾子。

      不知道有多少人还记得Google Nose。

      这个谷歌在 2013 年愚人节上线的搞怪项目声称有一个包含 1500 万种味道的气味资料库,用户只需要在谷歌搜索框输入关键词,点击“闻一闻”,就能直接在电脑旁闻到该物体的味道,比如新车的味道,篝火的味道,以及埃及古墓的味道(?)等等。

      就是这个十年前离谱但脑洞大开的玩笑,正在被它的发明者部分变成现实。

      今年 9 月初的《科学》杂志刊登了一篇由初创公司Osmo(从谷歌分拆)和莫奈尔化学感官中心(Monell Chemical Senses Center)等多个研究团队共同发布的论文,其中称,AI模型可以让机器拥有比人类更好的“嗅觉”。

      乍一听这简直太不可思议了,毕竟对大众来说,嗅觉是比视觉和听觉抽象得多的存在。RGB颜色图谱可以描述人眼看到的色彩,人耳听到的声音也可以转化为不同频率的波长,甚至让人感受到震动,但唯独嗅觉,看不见摸不着,更难以用量化的指标描述。

      换句话说,把气味数字化听起来就是件不可能的事。

      而这篇论文的研究人员核心要做的,正是去试图创建一个能够如实反映气味特征的人类嗅觉高维图谱,即POM(Principle Odor Map)。

      那么具体是怎么做的呢?

      我们知道,气味是人类嗅觉系统对散布于空气中的某些特定分子的感应。气味分子进入鼻孔后,会与鼻腔上方的嗅觉细胞产生(受体)反应,产生的生物电波再通过神经传到大脑,继而识别味道。

      而气味的构成实际要比色彩、声音复杂得多,有数以百万计的不同种类,每种气味又都由数百个化学分子组成,其性质各不相同。与之相应地,人类的功能性嗅觉受体有大约 400 个,远远超过了我们用于视觉的 4 个,以及用于味觉的约 40 个。

      所以面对如此复杂的嗅觉机制,研究人员首先做的事情就是创建了一个机器学习模型——消息传递神经网络(MPNN)。

      这是一种特定的图神经网络(GNN),因为图神经网络是一种基于图结构的深度学习方法,将传统的图分析引入,提供了对非规则数据提取特征的方法,因而也非常适合用来学习复杂的气味特征。

      模型搭好之后,接下来就要喂给它学习材料。

      研究人员结合了Good Scents and Leffingwell & Associates(GS-LF)香精香料数据库,建立了一个包含约 5000 个分子的参考数据集作为训练基础素材,每个分子可以有多个气味标签,比如果味、花香、芝士味和薄荷味等等。

      通过将分子的形状结构作为数据输入,模型得以输出最能描述某种气味的对应气味词。

      为了使训练结果更准确,研究者同样用到了各种方法来优化模型参数。比如将GS-LF香精香料数据库按照8: 2 的比例划分为训练集和测试集,训练集被进一步划分为五个交叉验证的子集;以及使用贝叶斯优化算法对数据进行交叉验证,并对GNN模型的超参数进行优化等。

      这张图直观表示了每种气味的感知距离,比如花香(floral)、肉味(meaty)和酒香(ethereal)几个大类彼此间是存在较大感知距离的;但每个大类下包括的更具体的气味,比如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距离则较为接近。

      论文将POM和此前有过研究先例的基于摩根指纹的气味空间图(Morgan fingerprint-based maps)进行了对比,发现后者尚无法体现上述感知距离:

      为了进一步验证模型训练效果,研究者接着找来了 15 位气味专家,来和模型比拼谁识别气味更准确。

      15 位专家每人需要闻 400 种气味,研究者会给出 55 个气味形容词,让他们就每种气味对这 55 个选项用1- 5 分来打分,评定每个气味形容词在多大程度上适合于这个气味。

      结果发现,对于其中53%的测试分子,模型的表现都优于小组成员的平均值。

      研究者还将模型的预测结果按气味描述词进行了分类,发现除麝香外,模型对分子气味的预测结果均在人类组的误差分布中,且在 30 个气味描述词的预测结果中优于人类组中位数:

      后续,研究者还对模型的性能进行了反复验证,获得了较为稳定的分子结构-气味关系。

      下面就进入到了最激动人心的气味图谱大规模绘制环节,并最终得到了下面这张图:

      你可以把上文那个表示气味感知距离的坐标图理解成是这张图的无限放大版。论文提到,这张图中包含了约 50 万种气味分子,当中甚至有许多还没有被发现或合成出来(但确实能计算出来)。

      做个更直观的比较,如果让一名训练有素的人类评价员寻找这些气味,大概需要连续工作 70 年才可以全部收集到。

      看起来,这篇论文着实是完成了一件大事。

      这时就有网友发问了,机器为什么需要闻气味呢?

      其他人也纷纷给出了自己的见解,比如认为可以用于工厂污水处理的质量控制,进行爆炸物、毒品或是尸体的嗅探等等:

      这样一来警犬和搜救犬可能要下班了

      有人希望可以据此研发出一款好的除臭剂,因为人在进行大量有氧运动比如跑步或举重后会散发出不好的气味:

      也有人对这一研究成果在医疗方面的应用很感兴趣,比如可以用来开发嗅觉丧失症的新疗法,或者通过气味检测疾病等等:

      还有香水行业的从业者觉得这帮了自己大忙,“让它告诉我的同事什么时候他们喷了太多古龙水”:

      这些预测事实上都不无道理。首先机器确实可以帮人类解决有时对气味辨别不准确的问题——研究表明,每个人对气味的感知程度都各不相同,会根据感觉和生理信号引发不同反应,其中也受到经验、期望、个性或情境因素的影响。

      而气味某些时候对人来说又十分重要。

      不好的气味就不用说了,某些有害气体还可能会危害健康,这时如果可以有机器代替某些特定职业帮助人类或动物作业就再好不过。

      而对另一些气味可以为之带来好处的职业,比如调香师、厨师、设计师、艺术家和建筑师等等,也有调配出更具功能性的气味的需要。一些场合会将气味应用在环境中,比如纽约Sloan-Kettering癌症中心会在空气中散布香草油,以降低患者对于磁共振成像(MRI)测试的幽闭恐惧症;芝加哥期货交易也会散布特定的香味以降低交易大厅的噪音分贝。

      还有研究表明,人类大多数与气味有关的记忆都来自婴儿及幼儿时期的最初十年,而语言和视觉所产生的记忆通常在10- 30 岁之间产生。这部分解释了气味可以唤起人遥远的回忆,而且透过气味所引起的回忆,经常比视觉或听觉所引起的回忆,更加情绪倾向。

      所以气味和人类的联系还是非常紧密的,只是我们在很多时候并不容易察觉。

      网友们的猜想也在论文的作者之一、来自Osmo公司的Alex Wiltschko那里得到了验证。他在发布在Osmo官网的一篇文章中写道,

      “气味图谱是我们实现更远大目标的基础。如果可以开发出能够复制我们鼻子或狗的鼻子的功能系统,我们就可以尽早发现疾病;人工智能也将帮助医生找到更有可能在临床上取得成功的药物,更好地帮助合成化学家和调香大师进行工作……我们未来的工作目标是,为改善人类健康和幸福奠定坚实的科学和商业基础。”

      不过他也表示,论文依然存在诸多不足。

      比如,无法体现分子气味的浓淡,只能预测它闻起来是什么样;只对单个分子气味进行了预测,现实生活中更多却是混合气味;而即便是所有的能力都达到了,对气味的复制和还原也将是很大的挑战等等。

      最后,说了这么多,有一个网友的评论倒是很朴实,“我觉得这会让品酒失去乐趣”:

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。