从好技术到好产品,旷视加速行业落地。
文|石兆、游勇
编|周路平
“如果没有百业的捶打,AI永远是空中楼阁。”2023年的旷视企业业务合作伙伴大会上,旷视企业业务负责人赵康道出了过去AI普遍面临的窘境。
过去在外界眼中,旷视一直是一家以AI算法见长的高科技公司,网罗了大量的AI技术人才,频频在国际大赛中获奖。如今,旷视正在以软硬结合的方式,加速与行业合作伙伴的场景结合。
赵康透露,过去一年里,旷视与全国伙伴共创了80多个场景方案,包括山东的加油站卸油区检测方案、浙江的智慧工地,江西的机场行李回框、广东的电力系统智能化等。AI正在千行百业发挥价值。
“我们还有更多场景要落,要把一个个场景丰富起来,不断地完善我们这一套以AI、以感知分析、以生物识别为核心的产品体系。”旷视联合创始人、企业业务产研负责人、AI产品官杨沐说。
01
旷视加快行业化步伐
与很多科技企业将自己做成了行业公司不同,旷视在行业化和垂直场景的探索更多依赖合作伙伴。
“旷视还是会把自身最核心的技术能力长期保持领先,同时跟合作伙伴一起,在真正重要行业领域深耕开发,这是旷视长期坚定的理念。”旷视联合创始人、CEO印奇说,在接下来4-5年的时间,旷视能在5-10个行业做扎实就很厉害了。目前,旷视在楼宇通行、生产办公、教育等行业已经有了不少布局和标杆案例。
“合作伙伴去做算法,对他们也是巨大的负担,我们也很难比我们行业中的合作伙伴们更懂行业。”赵康说,旷视最核心的地方在于算法量产和软硬结合上。目前,旷视企业业务已经积累了220余位生态合伙伴,包括行业ISV、区域ISV和产品方案商等。
而旷视牵引合作伙伴的关键在于两点:降低门槛和场景创新。
“我们也意识到,这个事情是需要我们去快速加强的。”杨沐告诉数智前线。2023年的合作伙伴大会上,旷视发布了多款新品,延续算法定义硬件的产品理念,强调为中小型项目提供极致性价比的产品,覆盖更多渠道,同时满足不同价位段的客户需求。
除了提高产品性价比,降低门槛的另一个核心是产品和方案简单易用。合盛智联创始人杨勇告诉数智前线,他们使用了大量的旷视硬件产品,覆盖了四川上千个小区。而前端的设备如果出现问题,每次要派人上门巡检,费用太高也不高效,现在通过旷视与他们共建的设备管控系统,合作伙伴在后台就能做出初步判断,如果判定是软件问题,远程就能恢复故障;如果是硬件问题,合作伙伴也只需要一次上门就能解决,以前需要上门两三次,现在大幅降低了维护成本。
杨沐也透露,旷视将把开放的接口进行打通,让面板机、盒子产品和IPC一样使用标准化的接口,同时推出Linux和安卓的SDK,满足合作伙伴在开发灵活性上的需求。
杨勇向数智前线提到一个细节,在某小区的智慧化改造项目中,由于对接的系统太复杂,同时要做好数据隐私保护, 旷视成立了专门的团队,两个月把这套系统开发完,四月内完成了对接,使得合盛智联在27家招投标当中,技术评分大幅领先第二名。 “旷视极大减少了我们在算法、算力、硬件研发所有的精力,最艰巨最擅长的东西交给了旷视的后端研发。”
场景创新则更需要合作伙伴的反馈。以前的机器视觉,大家更多想到的是人脸识别,门禁等通行场景一直是做机器视觉的厂商落地最多的门类。但随着越来越多的产品进入各个领域,旷视发现了解场景和客户的合作伙伴对AI还有很多期待。
2021年底,一位旷视的合作伙伴就提出一个需求:希望让AI用于体育教育训练。在此之前,旷视的产品在校园中的使用更多是提供单品面板机,在门口刷个脸。后来接入了边缘计算的盒子,能做一些人员分析。
但合作伙伴的需求已经深入到教学场景里。以前很多学校体育训练方式非常传统,体育的教学和测评都是靠体育老师统计,先掐表计数,再将统计表录入电脑,效率低且错误率很高。后来开始有穿戴式和基于红外技术的设备用于体育教学考试测评,但这些设备也存在各种问题,比如穿戴麻烦、存在替跑可能。
当时合作伙伴提出,能不能用AI视觉方式辅助体育训练和成绩检测。2022年2月,旷视做出了第一代AI体育助教““旷视运动猿的产品原型。它能通过人脸识别进行身份锁定,也能对体育训练全过程进行追溯。另外一个关键能力在于,机器视觉能识别人体关键的骨骼点,来判断学生的动作是否标准,比如引体向上需要手臂弯曲到90度。这些都很难单纯靠人来主观评判。甚至考虑到体育安全,旷视也在安全性上做了设置,包括防静电、防磕碰的设计。
来自合作伙伴的场景打磨,让旷视不断学习到行业knowhow。比如在加油站卸油区存在检测静电线的需求,但电线非常细,很难通过摄像头来捕捉,最后是合作伙伴提出了一个非常巧妙的做法,在电线上挂一个黄色的小彩旗,摄像头通过识别彩旗来确定电线的位置,实现算法的可交互性,再利用盒子的性能进行优化,实现了低成本的部署。
2022年,旷视提出“算法定义硬件”,把硬件做成通用的平台,降低AI的成本,“而今年则更多在于让软件平台和配置变得更加简单,同时我们更关注交付完了以后,客户反馈的问题。”杨沐说。比如,旷视发现,很多场景如果只提供一个边缘计算的盒子,合作伙伴很难将算法落地到具体场景里,“我们最后交付给客户的都是一套套打磨好的方案。”
02
旷视的产品化路径
旷视如何将人工智能技术产品化,并落地到诸多行业场景中,也经历了持续的探索。
“创业之初,我们看到论文榜有哪些难题,就把这个难题作为目标解决掉,在榜单上就排到了第一。“杨沐回忆,但这件事目标比较明确。“而当你真的走到行业里,你首先要找到问题,而且场景那么多,没有一个通用问题,你解决了就是万能的。”他们意识到,只能在一个个场景中,围绕自己核心的AI能力,一步步去做产品化方案。
当时,他们开始卖SDK(软件开发包)和 SaaS服务类产品,将注意力放在算法打磨上。但他们很快就发现一些问题。比如,市面上有二三十种芯片,规格、要求各不相同,每个应用场景,都对应一套硬件和一套算法,是一个巨大的工作量。但如果只提供一些标准SDK,旷视可以落地,客户却未必用得起来,背后还涉及摄像头选型、ISP调教等问题,是一个综合设计。
于是,旷视走入了第二阶段,经过五六年的探索之后,他们知道如何做硬件,提出了算法定义硬件。它的方法是“标准硬件+海量算法”的产品组合,来解决上述庞杂的落地问题。而本质上,它解决的是算法自己不会成为一个真正的商业闭环,它要与硬件和应用结合,针对场景匹配最优,才能规模落地。
这就像电脑,千行百业用的都是标准化的产品,上面装上Windows,再根据需要跑各种应用程序。与之类似,旷视开发了几大类通用硬件载体,比如模组、边缘计算盒子、面板机、AI IPC等。然后,在这些通用硬件载体之上,针对不同场景,开发不同算法。这些算法的开发也遵循一定范式,也有自动生产平台,开发效率要足够高。
不过,伴随进入越来越多的行业和场景,算法定义硬件的路径,依然面临AI落地繁杂的问题。比如场景碎片化,用户需求也碎片化,如何去覆盖这些需求?为此,今年旷视提出了“简单”这个词,将“算法定义硬件”更进一步延续。团队也定义了简单产品要具备易决策、轻交付和好口碑三个特性,目标是把AI能力落地到更多场景中。
什么是易决策?比如,在园区改造场景下,原先用户要采购AI服务器,一台服务器配一张英伟达GPU卡,几十万元就出去了,用户改造不起。现在,旷视推出了边缘计算设备,像智能IPC系列产品,它不需要GPU卡,又具备通用性,再搭载园区改造中需要的各种算法,就落地到了不少园区改造项目中。
而在轻交付上,可以创新的地方也不少。以在园区安装摄像头为例,原先需要一个专业工程师在现场做配置。现在,可以使用旷视软件自动化配置。再用一些验证手段进行验证,就完成验收。这就降低了交付实施的困难。现在旷视的魔方、盘古、鸿图等软件系统都在做升级,大方向就是“一键部署”、“一键配置”,让产品的安装实施,能像使用家用路由器一样简单。
而好口碑的范围较广,其中一个关键是持续运营,这在行业中已渐渐达成共识。当产品部署落地后,比如在加油站场景中,过了几个月,春天变夏天了,摄像头会经常遭遇雨水,日照强度也不同。这些问题反馈会让产品持续升级打磨,最终算法能适配四季,才能赢得好口碑。杨沐称,只有这三点都完成了,一个简单的产品才算完成。
“好产品和好技术还是不太一样的,我认为,在To B领域,好产品是必须要让别人能用得起来,能够好用,要简单。”杨沐说,“相比较而言,To C则更多看重产品的创造力和娱乐性,比如短视频特效,要带来愉悦等的感官刺激。而在To B这个方向,简单一定是一个最有效、最终极的事情。”
AI的技术一定要与场景和行业深度结合,同时要找到合适的载体,这样才能构成一个闭环的客户价值和闭环的业务。传统的安防和视频监控只是一个非常小的、垂直的赛道和应用。AI也不等同于安防,由于安防市场是AIoT领域落地最早且相对成熟的一个赛道,但AI在更多的空间还有广阔需求。
印奇认为,未来十年人工智能会有两大发展方向:一个是AI in Digital,一个是AI In Physical。前者如目前ChatGPT这样的大模型,后者是人工智能与物理世界结合,它就像一个人,有眼睛、耳朵感知外部世界,大脑进行决策,控制身体去做执行,然后会有相应的反馈。
其实,AI in Digital更容易出现现象级产品;而AI In Physical链条更长,需要多环节的把控力。
虽然两种都能变现落地,但显然目前AI In Physical的变现在行业市场更广阔,毕竟大多数行业需要交互,你既需要感知到发生了什么事情,也需要在做完判断后去执行。就如物流机器人,需要知道将货物搬到哪里之后,还得安排机器去真的搬运。
旷视选择了后者。在这条路上在持续摸索。现在场景越来越多,“我们要更高效。”杨沐称,先转起来,就能马上有输出,就能在短期项目中看出有没有产出和转化,可以根据实际情况去动态投入。
03
AI将迎来大规模落地
3月14日,GPT4的发布再度吸引了全球关注,作为一个多模态大模型,GPT4在之前的语言大模型基础上又有了一大进步。ChatGPT走红之后,大模型的“暴力美学”展现出的强大能力,也在加速往行业场景中落地。
数智前线获悉,微软已带着ChatGPT开始拜访国内行业企业。而百度创始人李彦宏不久前也带队拜访了几家央企客户,讨论大模型与其核心场景的结合及应用。
很多企业开始尝试通过AI来提升工作或生产效率。比如在家装行业,家装平台正在尝试将人工智能大模型的模块内置到设计师的设计工具里,以前需要设计师两三天完成的效果图,现在和客户面对面就能完成。在金融行业,保险公司希望大模型能够按照数据分析师的思路和方式,实现大部分数据分析和处理的工作,提高业务的效率。在生物科技领域,人工智能被用于蛋白质的研究,比如大分子药、酶的改造,甚至通过生成式AI技术,生成自然界中不存在的蛋白质。
ChatGPT激发了全民对AI应用的热情。而旷视所在的视觉感知领域,AI算法其实已在不同行业落地,且竞争越来越激烈。尤其是在智能通行场景里,除了旷视这类以算法见长的公司,也有像海康威视、大华等传统的安防龙头企业,也有像华为这类的科技巨头。
“智能化已经是大势所趋,所有的行业之后都会上AI这套系统,或早或晚,这个东西它越来越像个刚需。”杨沐说,旷视在做明厨亮灶场景初期,也不知道什么时间点会爆发式普及,但“现在实际看到这个推广的速度还是比较快的”。
另外,像工业质检、矿山检测、智慧社区等场景也在普遍接入AI的能力,“只要效果好的话,很多人就马上来参观,参观完以后,马上就更大范围地推广。”杨沐说。
根据IDC的预测,从2023年到2026年,全球在AI(包括以AI为中心的系统的软件、硬件和服务)方面的支出将增加一倍以上。今年这一数字将达到1540亿美元,意味着到2026年将超过3000亿美元。
IDC中国企业研究部高级市场分析师张学庆说,“AI技术将继续为用户和行业部门带来赋能效应。在预训练的大模型、多模态等技术的支持下,AI能力将大规模应用在生产的全过程,推动该技术从概念到大规模应用落地。未来,无论是政府层面的城市问题,还是与人们密切相关的生活问题,都将享受到AI技术带来的红利,最终会迎来全民共享的AI。”
不久前,一位互联网大厂智能业务负责人告诉数智前线,整个AI在落地上走入了深水区,以前更多是单点应用和垂类应用里,包括智能客服、语音助手以及数智人的单个场景下。现在已经不是为了用AI而用AI,而是要解决真实的场景问题,“应用已经是将AI融入进去了”。
“在我看到的未来趋势,大的场景可能会更多用AI。”上述人士说,ChatGPT是迈向通用人工智能的一个起步,它代表新的应用时代来临。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。