撰文 | 田小梦
编辑 | 李信马
“去年12月份,我第一次看到ChatGPT的时候,是我创业十年中最灰暗、最沮丧的时候。ChatGPT所表现出的几乎百分之百准确的理解能力,以及前所未见的‘生存’能力,这让我们这些理工男能够安身立命的技能,好像瞬间没有了价值。”黄伟惆怅道。
面对ChatGPT的横空出世,发布仅5天注册用户就超100万的冲击,黄伟有差不多一周的时间里处于焦虑的状态。但这种焦虑,也让他有了解和钻研ChatGPT的冲动。通过网上的文章、论文等,以及与技术负责人交流后,在他看来,ChatGPT好像也没什么,它就像是一个做的更大的Transformer。
从挫折、沮丧,再到发现——“好像我们也可以”。正是抱着这样的期待,云知声在去年12月中下旬快速组建了团队,投身于大模型的研发过程中。今年2月底就研发出第一版“山海”大模型。黄伟感慨称:“看到一版的时候,我整个的感觉和我在十年前创业的第一刻是一样的。”
但伴随互联网巨头的加入,虽然为科技公司指出了发展的新路径、新机遇,但对于创业公司来说,这条路并不轻松。
在黄伟看来,人工智能正从1.0进入到2.0时代,但目前只是在2.0的起点位置。1.0时代,人工智能更多的是一种鉴别能力,即利用已有的数据来训练模型,让模型做出Yes or No的判断,但无法告知原因。而2.0时代,在大模型引领的AI 2.0时代,为人工智能带来了新的能力,可以打造更多新的产品,满足客户更多的需求,例如医疗、营销、沟通等,能够创造更多的商业机会。
同时,从数据来看,今天的数据还没充分发挥它应有的价值,而通过大模型的深度学习可以充分利用和使用数据价值。黄伟认为,大模型会成为人工智能2.0时代的“发电厂”。“谁拥有发电厂,谁就具有最大的商业价值。”
在业界都将目光锁定在大模型身上,并认为大模型是未来十年20年最大的机会之一时,云知声自然也不会放弃。再者,云知声在过去十年里,积累了大量算法、数据、工程落地经验,仿佛都是为“山海”而生。
天时地利加人和,这不正是云知声在去年12月份毅然决然投身大模型的底气。
如今,“山海”大模型完成多轮优化升级,拥有超过十项技术能力。在通用能力上,包含语言生成、语言理解、知识问答、推理能力、数学能力、代码能力,以及与人类对齐的安全合规能力;在落地能力上,提供插件扩展、领域增强,以及企业定制能力。
01.
年内通用能力比肩ChatGPT
“目标年内通用能力比肩ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT4。”黄伟在发布会线上扬言称。这也透露出,云知声不是简单的将目光锁定在通用能力上,更看侧重TO B的落地场景中。
当然这步棋子的布局,离不开黄伟的经验。他从学术界到工业界,再到创业,完整的做过产品,深知人工智能只是一种能力,不能仅做酷炫的外表,而是要做完整的闭环。
其实,从云知声的发展也可以窥见一二。
2012年成立时,云知声就开始做自然语言理解,投入在整个对话AI的全栈能力研究中,形成数据、算力和算法完整的能力链条。2016年,当DeepMind AIphaGo 4:1 击败李世石时,云知声敏锐的意识到,人工智能的本质是认知智能,自然语言理解才是人工智能皇冠上的明珠,并在2016年年初开始布局超算——Atlas,并躬身入局物联网、医疗等领域,收获了真实的行业场景和数据。基于此,2022年云知声紧抓机遇,开启“山海”大模型研发,实现云知声的AI三级跳。
在这新一轮的人工智能比拼中,为了提高大模型在具体场景的应用落地水平,云知声沿袭了一以贯之的U+X战略,即以 U(AI技术和产品能力),深度结合 X(行业应用场景),解决行业深层问题。
黄伟介绍称,山海大模型技术架构就是通用大模型,并针对知识密度高的领域,通过数据训练、训练数据、微调等方式,做一些专业的加强,这样模型既具备了通用应用水平,也针对特殊场景与领域进行了能力的加强。
如在医疗领域,以前医疗行业利用AI的方式去录入病例,但是医生依然需要逐字录入信息,如今借助山海大模型,只需要随着医患问答的过程中,就能够提取关键信息生成病例,提高了医疗的效率,同时,云知声在为医疗服务中积累的千万级的标准的医疗数据,并背靠国内最大的医疗知识数据图谱,使得山海大模型在MedQA评测能力中可超越GPT-4。
云知声科技董事长兼CTO梁家恩表示,就目前而言,大模型仍然是有限的东西,对于没有见过的东西,大模型会生成“似是而非”的回答,随着AI生成能力的不断增强,校验会更加困难,这也让AI行业需要不断去探索新的解决方法。
随着AGI时代的到来,云知声也迎来了自己的GPT时刻。“如果把通用大模型看作每科都能考到80分的学生,我们要做就是在某一两门学科上,考到95分甚至更高。”黄伟如是说。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。