AI正在改变人类的科学研究方式。
按照常规的理解,AI4S是AI for Science的缩写,也就是“科学智能”,其利用AI技术解决复杂的科研问题,以推动科学发现和技术创新,被誉为科学研究的“第四范式”。这种范式通过结合机器学习、数据分析、高性能计算等技术,帮助科学家在各个领域进行更深入的探索和发现。
在近日举办的世界互联网大会人工智能专业委员会主办的“人工智能赋能科学研究”研讨会上,虽然与会嘉宾对AI4S的定义、范式等还存在一些不同的看法,但都形成了一个共识:AI正在改变人类科学研究方式。
诺贝尔奖进入AI时代
研讨会过程中,他们不约而同的提到,2024年诺贝尔物理学奖和化学奖均颁给了AI相关领域。其背景是,2024年10月8日,诺贝尔物理学奖表彰获奖者“基于人工神经网络实现机器学习的基础性发现和发明”。2024年诺贝尔化学奖则颁发给“在计算蛋白质设计方面的贡献”。
以后者为例,2024诺贝尔化学奖之所以获奖,在于其开发了AlphaFold人工智能模型,这种模型解决了一个已有50年历史的难题,能够预测大约两亿种已知蛋白质的复杂结构,直接推动生物医药领域的研发进程,并且已经被全球200多万人使用。
这两项获奖名单与AI关联度之高,让AI4S理念受到更大的关注,也在人工智能领域掀起巨大的浪潮。很多观点认为,诺贝尔奖进入AI时代。这个论断恰体现的是,科学家正在对AI提出源源不断的需求,AI正成为科学探索的核心工具。
中科院院士鄂维南曾经指出,科学研究总体上可分成:基于数据驱动的开普勒范式和基于原理驱动的牛顿范式,这两种范式在现代遇到了各自的挑战。但这些挑战也都有一个共同的解决方案: “缺乏有效手段解决高维数学问题,是阻碍科学研究与技术发展取得进一步突破的主因之一。而深度学习,或者说人工智能,可以帮助解决这个问题 ”。
这是因为传统AI模式下,AI4S主要是“算法驱动”,依靠算法创新助力科研创新。大模型时代,AI4S对计算、网络、存储等基础设施要求极高,特别是面向数据密集型的科研领域,AI4S也从“算法驱动”转变为“计算驱动”。
王坚院士在分享中也特别提到这一点。他还表示,在开放科学领域,互联网发挥着重要作用。他认为AI4S将帮助更多人加入创新阵列。开放科学不是简单地把科学开放出来,而是要考虑怎么做科学研究,怎么做交流。
在开放科学领域,互联网发挥着重要作用,也影响着人工智能的发展。如今,数据、计算和人工智能都无法脱离互联网。互联网作为基础设施,将所有问题向前推进。人工智能简单来说是数据、模型和计算的结合,与互联网一样具有规模效应。
此外,王坚就开放和范式的新变化发表自己的看法。谈及DeepSeek对于开源概念的拓展,和开放资源对于科学技术领域的巨大价值。DeepSeek基于MIT许可协议开源,当DeepSeek出来的时候,《自然》杂志在一个星期以内发表了五篇文章讲这件事情。
事实上,人工智能以其惊人的潜力,逐渐成为提升科研创新效率的“标配”。谷歌学术数据表明,近3年使用AI的论文数量增长率超3倍。特别是大模型的出现和突破发展,正加速AI4S成为科研创新和科技进步的核心驱动力,并在芯片设计、生物医药、材料能源、天文气象、自动驾驶等一系列领域,取得重大创新突破。
AI4S正加速应用
就目前大模型发展路线看,DeepSeek的火爆,将开源大模型技术体系再一次成功展示。Meta 首席科学家YannLeCun表示:“DeepSeek提出了新的想法,并在前人的工作基础上加以实现。由于他们的工作成果已发表并开源,因此每个人都可以从中受益,这就是开放研究和开源的力量”。
也就是说,开源大模型“开源开放”特性,决定了其一旦性能优异、文档与指引完善、工具链完备且模型持续迭代,就会以滚雪球的方式吸引开发者进入其生态体系,并由广大开发者二次开发出数量庞大的“衍生模型”家族,量变到质变,大幅提高模型的性能和质量,呈现出与闭源模型分庭抗礼之势。
不可忽视的是,开源模式还把大模型的“价格打下来”,有效解决制约大模型规模化应用的推理成本过高等问题。其中一个关键要素在于,开源大模型“公有云+API”的部署方式,全面加速了从MVP(最小可行产品)验证、客户触达、交付、运营迭代等多个环节的应用创新。
从行业实践看,AI大模型私有化部署的资本和时间投入成本,是“公有云+API”部署方式的10倍。
从构建MVP看,公共云提供的大规模、高弹性、低成本算力,以及成熟完善的工具链,能够大幅降低创新成本和门槛。例如,依托谷歌云的Discord平台,助力Midjourney、Pika等初创企业快速推出新产品。
再从客户触达看:公共云上有庞大的数字化基础好的客户池,能够助力企业快速、低成本地触达客户。Mistral 模型在Azure 云平台上部署后,立刻获得了约1000个优质客户。
这带来的直接行业影响即是,公共云+API将成为企业使用大模型的主流方式。目前,国内已有50多所院校机构使用阿里巴巴的“云和AI服务”开展科研创新,并在生物、农业、天文等领域取得了可喜的成果。
在算力普惠、模型开源和数据共享的合力下,阿里AI4S已经摸索出多种合作模式。比如基础设施服务模式、专业平台模式,搭建智慧育种平台、联合研究模式、模型开源模式等。叶杰平在分享中提到,阿里AI与中山大学合作推进“如何用人工智能挖掘RNA病毒”项目,通过先构建数据集,再打造独特领域大模型LucaProt等举措,发现超51万条病毒基因组等成果,该成果也登上了《Cell》期刊封面;
此外,阿里云在ChatGPT出现之前就启动了模型社区建设——魔搭社区,目前已有超过4万家模型入驻,有超过1000万用户数。截至目前,阿里通义千问开源模型下载量为2亿,基于阿里通义模型衍生模型数量超过9万个。
得益于阿里巴巴坚持开源开放,持续提升“通义千问”大模型能力,全尺寸、全模态开源,并推动阿里云AI算力提升性能、降低成本。近日,全球最大AI开源社区Hugging Face发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型全部是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。
2024年GTC大会(英伟达GPU技术大会)上,英伟达CEO黄仁勋坚定认为,AI4S是AI领域的三个关键方向之一。但AI4S也面临交叉型人才短缺、技术方案难复用、垂类学科数据质量欠佳等问题逐渐暴露出来。
唐辰也注意到,本次研讨会就AI4S提出的三点建议:实现包容普惠的发展;实现融合创新的发展;实现安全有序的发展。而这些,都是AI将科学研究推入一个新的阶段,所必然面临的问题和挑战。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。