毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战贝壳第三季度营收226亿元 经调净利润17.8 亿元 同比下降17.46%AI营销,让科技巨头尝到了大模型商业化的甜头安恒信息范渊在乌镇峰会谈AI:以工具视之、以工具用之、以工具治理之诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购
  • 首页 > 云计算频道 > 大模型

    当AI学会了闻味儿,人类就可以少工作70年

    2023年09月23日 19:18:01   来源:微信公众号GenAI新世界

      本文来自于微信公众号GenAI新世界(ID:gh_e06235300f0d),作者:李禾子。

      不知道有多少人还记得Google Nose。

      这个谷歌在 2013 年愚人节上线的搞怪项目声称有一个包含 1500 万种味道的气味资料库,用户只需要在谷歌搜索框输入关键词,点击“闻一闻”,就能直接在电脑旁闻到该物体的味道,比如新车的味道,篝火的味道,以及埃及古墓的味道(?)等等。

      就是这个十年前离谱但脑洞大开的玩笑,正在被它的发明者部分变成现实。

      今年 9 月初的《科学》杂志刊登了一篇由初创公司Osmo(从谷歌分拆)和莫奈尔化学感官中心(Monell Chemical Senses Center)等多个研究团队共同发布的论文,其中称,AI模型可以让机器拥有比人类更好的“嗅觉”。

      乍一听这简直太不可思议了,毕竟对大众来说,嗅觉是比视觉和听觉抽象得多的存在。RGB颜色图谱可以描述人眼看到的色彩,人耳听到的声音也可以转化为不同频率的波长,甚至让人感受到震动,但唯独嗅觉,看不见摸不着,更难以用量化的指标描述。

      换句话说,把气味数字化听起来就是件不可能的事。

      而这篇论文的研究人员核心要做的,正是去试图创建一个能够如实反映气味特征的人类嗅觉高维图谱,即POM(Principle Odor Map)。

      那么具体是怎么做的呢?

      我们知道,气味是人类嗅觉系统对散布于空气中的某些特定分子的感应。气味分子进入鼻孔后,会与鼻腔上方的嗅觉细胞产生(受体)反应,产生的生物电波再通过神经传到大脑,继而识别味道。

      而气味的构成实际要比色彩、声音复杂得多,有数以百万计的不同种类,每种气味又都由数百个化学分子组成,其性质各不相同。与之相应地,人类的功能性嗅觉受体有大约 400 个,远远超过了我们用于视觉的 4 个,以及用于味觉的约 40 个。

      所以面对如此复杂的嗅觉机制,研究人员首先做的事情就是创建了一个机器学习模型——消息传递神经网络(MPNN)。

      这是一种特定的图神经网络(GNN),因为图神经网络是一种基于图结构的深度学习方法,将传统的图分析引入,提供了对非规则数据提取特征的方法,因而也非常适合用来学习复杂的气味特征。

      模型搭好之后,接下来就要喂给它学习材料。

      研究人员结合了Good Scents and Leffingwell & Associates(GS-LF)香精香料数据库,建立了一个包含约 5000 个分子的参考数据集作为训练基础素材,每个分子可以有多个气味标签,比如果味、花香、芝士味和薄荷味等等。

      通过将分子的形状结构作为数据输入,模型得以输出最能描述某种气味的对应气味词。

      为了使训练结果更准确,研究者同样用到了各种方法来优化模型参数。比如将GS-LF香精香料数据库按照8: 2 的比例划分为训练集和测试集,训练集被进一步划分为五个交叉验证的子集;以及使用贝叶斯优化算法对数据进行交叉验证,并对GNN模型的超参数进行优化等。

      这张图直观表示了每种气味的感知距离,比如花香(floral)、肉味(meaty)和酒香(ethereal)几个大类彼此间是存在较大感知距离的;但每个大类下包括的更具体的气味,比如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距离则较为接近。

      论文将POM和此前有过研究先例的基于摩根指纹的气味空间图(Morgan fingerprint-based maps)进行了对比,发现后者尚无法体现上述感知距离:

      为了进一步验证模型训练效果,研究者接着找来了 15 位气味专家,来和模型比拼谁识别气味更准确。

      15 位专家每人需要闻 400 种气味,研究者会给出 55 个气味形容词,让他们就每种气味对这 55 个选项用1- 5 分来打分,评定每个气味形容词在多大程度上适合于这个气味。

      结果发现,对于其中53%的测试分子,模型的表现都优于小组成员的平均值。

      研究者还将模型的预测结果按气味描述词进行了分类,发现除麝香外,模型对分子气味的预测结果均在人类组的误差分布中,且在 30 个气味描述词的预测结果中优于人类组中位数:

      后续,研究者还对模型的性能进行了反复验证,获得了较为稳定的分子结构-气味关系。

      下面就进入到了最激动人心的气味图谱大规模绘制环节,并最终得到了下面这张图:

      你可以把上文那个表示气味感知距离的坐标图理解成是这张图的无限放大版。论文提到,这张图中包含了约 50 万种气味分子,当中甚至有许多还没有被发现或合成出来(但确实能计算出来)。

      做个更直观的比较,如果让一名训练有素的人类评价员寻找这些气味,大概需要连续工作 70 年才可以全部收集到。

      看起来,这篇论文着实是完成了一件大事。

      这时就有网友发问了,机器为什么需要闻气味呢?

      其他人也纷纷给出了自己的见解,比如认为可以用于工厂污水处理的质量控制,进行爆炸物、毒品或是尸体的嗅探等等:

      这样一来警犬和搜救犬可能要下班了

      有人希望可以据此研发出一款好的除臭剂,因为人在进行大量有氧运动比如跑步或举重后会散发出不好的气味:

      也有人对这一研究成果在医疗方面的应用很感兴趣,比如可以用来开发嗅觉丧失症的新疗法,或者通过气味检测疾病等等:

      还有香水行业的从业者觉得这帮了自己大忙,“让它告诉我的同事什么时候他们喷了太多古龙水”:

      这些预测事实上都不无道理。首先机器确实可以帮人类解决有时对气味辨别不准确的问题——研究表明,每个人对气味的感知程度都各不相同,会根据感觉和生理信号引发不同反应,其中也受到经验、期望、个性或情境因素的影响。

      而气味某些时候对人来说又十分重要。

      不好的气味就不用说了,某些有害气体还可能会危害健康,这时如果可以有机器代替某些特定职业帮助人类或动物作业就再好不过。

      而对另一些气味可以为之带来好处的职业,比如调香师、厨师、设计师、艺术家和建筑师等等,也有调配出更具功能性的气味的需要。一些场合会将气味应用在环境中,比如纽约Sloan-Kettering癌症中心会在空气中散布香草油,以降低患者对于磁共振成像(MRI)测试的幽闭恐惧症;芝加哥期货交易也会散布特定的香味以降低交易大厅的噪音分贝。

      还有研究表明,人类大多数与气味有关的记忆都来自婴儿及幼儿时期的最初十年,而语言和视觉所产生的记忆通常在10- 30 岁之间产生。这部分解释了气味可以唤起人遥远的回忆,而且透过气味所引起的回忆,经常比视觉或听觉所引起的回忆,更加情绪倾向。

      所以气味和人类的联系还是非常紧密的,只是我们在很多时候并不容易察觉。

      网友们的猜想也在论文的作者之一、来自Osmo公司的Alex Wiltschko那里得到了验证。他在发布在Osmo官网的一篇文章中写道,

      “气味图谱是我们实现更远大目标的基础。如果可以开发出能够复制我们鼻子或狗的鼻子的功能系统,我们就可以尽早发现疾病;人工智能也将帮助医生找到更有可能在临床上取得成功的药物,更好地帮助合成化学家和调香大师进行工作……我们未来的工作目标是,为改善人类健康和幸福奠定坚实的科学和商业基础。”

      不过他也表示,论文依然存在诸多不足。

      比如,无法体现分子气味的浓淡,只能预测它闻起来是什么样;只对单个分子气味进行了预测,现实生活中更多却是混合气味;而即便是所有的能力都达到了,对气味的复制和还原也将是很大的挑战等等。

      最后,说了这么多,有一个网友的评论倒是很朴实,“我觉得这会让品酒失去乐趣”:

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。