毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战贝壳第三季度营收226亿元 经调净利润17.8 亿元 同比下降17.46%AI营销,让科技巨头尝到了大模型商业化的甜头安恒信息范渊在乌镇峰会谈AI:以工具视之、以工具用之、以工具治理之诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购
  • 首页 > 企业IT频道 > 人工智能

    跨越山海的云知声,迎来了自己的GPT时刻

    2023年05月29日 11:34:50   来源:光锥智能

      文|光锥智能,作者|郝鑫,编辑|王一粟

      “世界上最高的山是什么山?”

      云知声创始人兼CEO黄伟仍清楚地记得,十年前他用语音提出的第一个问题。答案播放出来的那一刻,黄伟第一次体会到创业的成就感。

      今年2月底,山海大模型雏形初现,用同样的问题测试,黄伟一瞬间感觉好像穿越回了十年前,那座“最高的山”正在招手呼唤他。

      “去年12月第一次看到ChatGPT,正是我创业十年最灰暗的时刻。而现在站在发布会舞台上,剩下的只有紧张、兴奋和自豪。”黄伟庆幸,自己再次搭上了AI下个十年的快车。

      5月24日,云知声正式发布“山海大模型”,现场实测十大核心能力,具体包括:语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规等7项通用能力,以及插件扩展、领域增强、企业定制等3项行业落地能力。

      值得一提的是,除了通用能力的演示,一向重视“工程化”的云知声也比较明确地提出了落地能力的实现路径。这让大模型的落地更加实际,不是空中楼阁。

      而在更重要的行业应用层面,云知声则仍然坚持此前提出的“U+X战略”,赋能医疗、智慧物联、销售、知识管理、教育等千行百业。

      在云知声最为重要的落地场景之一——医疗领域,黄伟透露,山海大模型在临床执业医师医学考试中拿到了511分,满分600分,考生平均分为365。“在医疗领域,山海大模型已经超越了GPT-4的中文水平。”

      得益于此前在Ttransformer模型方向的发力,以及从2016年对医疗领域的深耕,云知声从去年12月开始组建AGI团队,“闭门修炼”5个月后,就拿出了一个在通用能力方面与国内大公司打平,在行业大模型超越GPT-4中文水平的成绩。

      黄伟并不满足这样的成绩,给云知声定下了年内的目标,“年内通用能力比肩ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT-4。”

      虽然2个月近20个大模型发布中“有李逵也有李鬼”,但一流AI公司的技术水平可以靠时间接近GPT-4成为了行业共识。当技术拉齐后,大模型正在打响一场“行业”争夺战。

      01 把通用能力用起来

      在通用能力上,云知声山海大模型顺利通过了语言理解、推理能力等一系列测试。

      首先,在对中文的理解方面,山海大模型更接近“中国人的体质”,可以精准地理解中文6级水平的绕口令“行的人,干一行行行行,行行都行”中每个“行”的意思,还能给出单独的解释。知道八大山人是画家的名号,孙悟空和齐天大圣是同一个人。可以说,山海大模型对中文的理解达到了百科字典的水平。

      不仅如此,山海大模型还具备逻辑判断和计算推理能力。例如,可以识破“所有猫都爱吃鱼,所以爱吃鱼的动物都是猫”这类伪三段论逻辑,以及“小明爸爸姓王,问小明姓什么”这类基本常识问题。

      而在计算能力中,山海大模型可以立即给出鸡兔同笼这类简单问题的答案和解题过程,也能够根据指令当场编写代码。在涉及开根号等复杂的数学运算上,山海模型也没有拉胯,过程清楚、答案正确。

      总体来看,与国内各家大模型相比,山海大模型虽然没有展现图文生成等多模态的能力,但关键的NLP(自然语言处理)表现仍在头部水平。

      光锥智能盘点了已发布大模型的公司发现,随着技术的不断更新迭代,各家公司在文本生成、知识问答、语言理解、逻辑推理等各项通用能力上的差距正在变得越来越小,甚至有了同质化的趋势。

      所以,攻克大模型的技术难关只是第一步,如何用起来才是接下来的关键。

      ChatGPT惊艳全球后,OpenAI随即抛出的一颗惊雷,就是宣布向所有ChatGPT Plus用户开放联网功能和70多个第三方插件,插件覆盖了衣食住行、社交、工作以及学习等方方面面。

      面对千行百业,没有一家公司能够独立吃下所有场景。民生证券报告称:“OpenAI正沿着类苹果模式的‘终端+平台+生态’,迈向高于操作系统的战略地位。”

      云知声也有同样的思考路径,但不同的是,更希望利用插件,将合作伙伴的能力集成进来。用了计算器插件,山海大模型就实现了复杂计算的能力;用了搜索引擎插件,就能帮用户实时查天气、查球赛结果。与ChatGPT一样,给大模型按上了插件就装上了“外挂”。

      黄伟表示:“大模型的通用能力并不能解决所有问题,还有说胡话的风险。特别是在医疗、汽车、物联一些容错率低的专业场景中,通用能力就显得不那么够用,所以才要引入大量的插件来推动应用落地,做大模型的黄金搭档。”

      云知声也给AI公司做大生态提供了借鉴思路,面对很多垂类的行业场景,AI公司一方面可以自己做一些插件去开放给行业客户,集成到产品里。另一方面,也可以让客户自己做插件开发,共同深入场景。

      02 成为行业专家

      通用能力的提升,在行业场景的实际落地方面,还远远不够。这就要求大模型们,不仅成为AI领域的“本科全才”,更要成为特定领域中的“博士生”甚至“博导”。

      即使通用能力强如ChatGPT,在医疗等特定领域的专业度也远远未达到可用的水平。例如,对一手术过程的描述,ChatGPT给出了一个完全错误的答案。可以说,一旦涉及到核心的诊疗过程,ChatGPT目前只是一个“庸医”。

      “如果把GPT-4比作一个不偏科,每门都能考到80分的学生;我们要做的,则是一个可以在某一两门学科,考到95分甚至更高的学生。”黄伟在采访中说道。

      而这恰恰是众多行业大模型的机会。从实际问题和产业应用出发,沉淀垂直行业经验,AI公司就能建立自己在特定领域的壁垒。

      从这个角度而言,在AI 1.0时代积累下行业能力的AI公司,拥有更大的机会。

      2016年,医疗+AI行业还犹如一片空白地带,彼时,AI企业们还在找寻合适的降落姿势。

      以语音技术起家的云知声,抓住了医生病历记录效率低下这个痛点,以语音电子病历录入打开了医疗赛道的突破口。

      为了能够做到精准识别,云知声为医院做了深度定制服务,根据不同科室、不同病种整理病历资料,运算出关键词句语料,为40多个临床和医技科室提供分场景支持,以适应医院不同科室实际的使用需求。

      经过专业数据优化后,云知声在医疗领域的优势十分明确,其语音识别准确率超95%,个别科室的语音识别率超98%。医生减负效果明显,可以使医生的录入效率提升40%,每天节省1.5-2个小时时间。

      然而,仅从一个单一效率工具切入并不够。

      三年磨一剑,2019年,云知声公布了“医疗+AI”的战略,从电子病历场景出发构建起了医疗产品体系。除“医疗语音交互解决方案”外,针对诊疗过程的诊前、诊中、诊后不同场景,云知声还推出了导医机器人、智能病历生成系统、智能病历质控系统以及智能院后管理解决方案等产品。

      此外,基于对场景的理解,云知声在医疗垂直领域建立起了知识图谱,图谱覆盖了症状、体征、疾病、手术,检查检验,药品等七大类实体,共计132万个,对应医学术语334万;包含十大类实体关系,共计757万实体关系。2017年建立至今,该知识图谱仍在更新迭代中,这成为云知声核心壁垒之一。

      黄伟介绍知识图谱在大模型训练中发挥了重要的作用,“行业大模型训练有三个主要的数据来源,一是云知声多年沉淀下来的优质医疗数据,预训练阶段可以加强大模型的知识和语言能力;二是在医疗行业积累的问题解决数据,这部分可以拿来做微调;三是知识图谱,靠它严谨的知识来校验数据和训练结果。”

      在高质量知识图谱数据之上,实现了数据到场景的全链条打通,云知声旗下的医疗产品从语言电子病历、语音助手这类效率工具,进化为了病历文书质控、医保支付审核一类的决策支持工具。

      在大模型的加持下,云知声也完成了从AI助手到AI专家,再到AI导师的角色升级。对比从前,所能抵达的场景更加厚重,能触及的核心技术更多,行业know-how的经验再次更新沉淀下来。

      如果说,云知声在医疗行业的扎深是一家AI公司如何深入到行业的典型,那么其在物联网领域的拓展,则证明了一家AI公司如何能把技术变成靠标准化的产品,从而打开行业广度的生意经。

      2015年,云知声启动了AI语音芯片项目,并提出“云-端-芯”一体战略。一方面把在垂直行业积累的AI技能放在云端,一方面通过芯片去赋能设备端的边缘计算能力,进而把云端的算法能力向设备端进行输出。

      通过自研芯片的方式将算法集成在芯片模组中,这不仅形成了相对标准化的产品,还让云知声实现了产品成本的降低。“标准化+降本”,才能大规模应用到智慧家居、车联网等场景。

      同时,云知声这些年还搭建了厚重的中台能力。物联中台发挥集中调配、汇总信息的功能,实时管理设备、人员、服务等各项因素,最终通过语音交互输出指令反馈。

      而到了大模型时代,面向智慧物联场景,会有什么样的进阶呢?

      ChatGPT已经让业界看到,人人都能拥有一个AI助手即将成为现实。“未来将全线升级智慧物联核心产品,与山海大模型深度结合,塑造出一个真正的随身管家:从只能进行指令交互升级为类人对话,真正联动IoT生态和服务。”黄伟在发布会上表示。

      “与全场景自然语言交互相比,搜索引擎的市场就非常小了。”一位曾在语音等AI领域深耕20年的创始人曾对光锥智能表示,万物智联的自然交互,才是更广阔的市场。

      “大模型发布后,无论是汽车、智能家居、酒店等各个潜在客户,已经迫不及待地在跟我们要方案了。”黄伟透露。

      十年间,云知声AI实现了三级跳,从第一阶段的AI三驾马车、“云端芯”战略,到第二阶段的以超算中心、知识图谱等构成的规模化AI技术战略,和开放平台+智慧物联/智慧医疗的“U+X”市场战略,每一个阶段都紧跟技术和市场的变化。

      再到如今的AGI时代,云知声也迎来了自己的GPT时刻。在技术上,不仅拥抱基础大模型,也在工程化上利用指令调优+反馈强化,让大模型不断迭代提升;另外,也在多知识/多模态,以及跨语言/模态方面积极布局,为增量需求拓展能力。在市场策略上,依然坚持“U+X”,实现AGI+Industry生态加速。

      在此次发布会上,除智慧医疗、物联场景外,云知声亦在教育、销售场景、知识管理等场景上储备下了能力,准备迎接更多行业的升级需求。

      03 行业争夺战打响,云知声如何比拼?

      自3月以来,国内已有20多个玩家狂奔入局。从文心大模型到山海大模型,国产大模型之战迎来中场战事,从比拼“通用”进阶到了比拼“行业”。

      据不完全统计,在国内发布的大模型中,行业大模型占比超过60%,各家AI公司大模型已经开始向工业、金融、医疗、营销、智慧物联等多个领域渗透。比如,百度在发布文心一言后,在全国各地陆续举办了多场行业大模型的推介会,涉及工业、能源、媒体、金融等领域;而阿里云虽然没有发布单独的行业大模型,但也强调维度更垂类的企业大模型。“未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。”

      相比巨头在技术上拼参数,在市场上拼生态,云知声这样的小巨头,也有自己从本质出发的思考。

      “ChatGPT将人工智能研究的核心带回到语言本身,而语言其实是人类智能的一个核心载体。”云知声董事长梁家恩认为,这是一个从专用AI转向通用AI(AGI)的突破口。”

      但转向通用AI,并不能盲目的扩大训练参数。这是因为,虽然在优质数据规模足够大情况下,模型越大效果越好,但训练成本也越高。

      基于AI 1.0时代在专用AI方面的积累,云知声计划先将模型做到六七百亿参数,做出涌现效果,然后以这个参数规模,提升优质数据规模和大模型效果,再做千亿以上参数来提高大模型性能。

      云知声坚信,通往AGI的路不只有一条。

      “除了用大力出奇迹去做大模型,也可以用更高质量的‘数据+规模’当适当的数据参数,做行业‘中模型’。”黄伟表示,云知声目前正在两条腿一起走路。今年Q3云知声会发布对标GPT-3.5的“山海2.0”,数据参数也将达到千亿级。而在Q3,云知声的“中模型”也即将发布。

      既然要做中模型,在行业争夺战中,又回到了上个阶段中对行业深耕的过程。

      纵观整个中国市场的行业大模型玩家,首先基于1.0阶段积累的行业经验不同,各家深扎的场景也不同。现阶段,想要横跨多个行业不太现实,无论是头部大厂还是中小公司都可以有自己的壁垒。

      其次,即使是进入同一行业,每家公司瞄准的方向也不同,细分领域竞争更具多样化。如同样在医疗领域,云知声将语义识别的优势运用在了门诊病历撰写、手术报告生成上,而商汤则将重点放在了线上问诊、咨询上。

      而在真正的行业应用落地时,还要考虑实际成本。

      在AI 1.0阶段,被调侃“有多少人工就有多少智能”的数据标注情况,将被自动化标注逐步替代。相对于GPT训练中需要的45T数据,以前的AI训练数据量如同九牛一毛。在数据量较小的情况下,还能做到分离标注,而现在数据训练过程完全自动化,根本无法标注。于是,需要通过人类生成反馈的技术,替代传统数据标注。

      另外,则是数据训练成本。云知声认为,大模型训练成功后,以目前的算力成本,可能需要把大模型参数量通过蒸馏技术压缩10倍才能满足实时性和规模化应用要求,这要视具体应用场景而定。云知声在做BERT模型时,就通过模型蒸馏提速近百倍,而实际性能损失很小。“就像打击索马里海盗,不能每次都开着航母过去。”梁家恩称。

      04 技术撬动行业价值

      纵观国产大模型,目前整个行业依然在非常早期,即使如马斯克所言,中美技术的差距有12个月,但放眼到未来20年的长期竞争中,这开头的100米或许并没有那么重要。

      回顾1.0阶段,AI公司花费了6年的时间实现了价值跨越。

      科大讯飞营收从2017年的54.45亿,一跃增长至2022年的188.20亿,对应28.15%的复合增速;商汤的营收从2018年的18.5亿,增长至2022年的38.09亿,收入也实现了翻倍。

      上个阶段,AI技术实现了旧业务的提效、新业务的增长,最终达成AI公司营收、市值的双增。进入2.0时代,这个逻辑依然成立,只不过2.0阶段可能释放的价值会更大,用的时间也会更短。

      黄伟判断,在新时代有两件事目前是已经确定的。首先,AI公司具备了更强的技术能力后,就能更好地满足客户需求,继而也能更容易地推动商业化落地。其次,客户强烈的需求会拉动整个市场空间增长,但高准入门槛又会将一部分公司拒之门外,最后能在市场分蛋糕的是那些实力过硬的玩家。

      回顾云知声11年的创业历程,保持技术的领先性和符合时代的市场战略都同等重要。“勤劳勇敢”的中国AI公司,面对新技术和新市场的热忱,会趟平所有可见的困难。

      正如黄伟所信仰的,“所爱隔山海,山海皆可平”。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。