毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战贝壳第三季度营收226亿元 经调净利润17.8 亿元 同比下降17.46%AI营销,让科技巨头尝到了大模型商业化的甜头安恒信息范渊在乌镇峰会谈AI:以工具视之、以工具用之、以工具治理之诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购
  • 首页 > 产经新闻频道 > 互联网+

    旷视研究院院长孙剑讲述:中国技术何以打败Facebook、Google拿下世界第一

    2017年11月20日 10:59:22   来源:极客网

    image.png

      CV (计算机视觉)在 AI 中大概的位置我用这一张图来表现,其实我标不同的方块的颜色代表这个领域商业化的成熟度,这里语音和视觉是更接近商业化落地的,NLP和通用人工智能还有很长的路要走。

    image.png

      CV今天非常火热是因为它有非常多的应用,从互联网、安防、无人车、机器人到AR、VR等等,也允许大公司和创业公司在整个市场上并存。

    image.png

      做CV的话需要什么呢?既需要理论也需要创新,这里分享一下:上周日旷视科技成立了学术委员会,非常有幸请到了图灵奖唯一一位华人得主姚期智先生担任学术委员会首席顾问,帮我们在理论方面把关。

      今天我会分享一下算法上面的工作。

      计算方式的变革(或复兴):神经网络计算突破冯·诺依曼结构的体系瓶颈

    image.png

      在讲计算机视觉之前,我想先讲一下对算法尤其是计算的理解。我们今天用的计算机还是冯·诺依曼结构的计算机,它的计算机体系结构设计的思想是要把数据和程序同时放在内存里,好处是程序遇到不同的数据时可以改变程序,可以自适应地处理数据,这非常了不起,因为在这之前,如果不这样的话,每一次不管是插线还是打孔,都很难去重新编程。后来图灵也问了个问题:既然机器可以根据自动处理数据,那是不是机器就可以拥有智能。

    image.png

      但是今天我们用了很长时间的冯·诺依曼结构,很大一个局限是它有一个瓶颈:学术界叫做冯·诺依曼瓶颈,其实是说CPU和内存之间的带宽是不够的。虽然 CPU 可以加速,但是数据越来越大,就会堵在中间。怎么去突破这一个瓶颈,目前的传统计算机结构是不能突破这一瓶颈的。

    image.png

      而我们大脑其实不是这样的结构,大脑里面所有的计算和表示都是在一个并行的网络里面运行的。

    image.png

    image.png

      这跟我们今天做的神经网络也非常类似,这是神经网络的一个神经元或者多个神经元在做的一些处理,右边是人脑神经元的一些类别,基本上一个神经元会接受相连接的几百个、上千个神经元来的输入,然后做一个决策:神经元到底是激活还是不激活。

    image.png

    image.png

      所以如果我们看今天神经网络的计算是在做什么呢?其实是在通过一个函数把一个高维激活向量变成另外一个高维激活向量。我们目前的神经网络就是不停做这样的变换,做一次、两次,做很多次,以至于形成一个非常复杂的嵌套变换,这就是我们今天的神经网络。

    image.png

    image.png

      我们可以把它拆成三个因素,一个是表示这样的激活向量,还有里面的标量非线性,还有权重矩阵,这是里面的三要素。激活向量其实是知识的表示,非线性是来表示这个神经元是激活还是不激活,这权重矩阵是通过监督学习到的知识。

    image.png

      这一个方式有很多好的特性,比如说它是高度并行,内存带宽可以非常大,还有一个优点就是计算非常简单,基本上就是矩阵乘,没有有分枝判断,没有冯·诺依曼结构下的复杂计算,所以这一种计算在一定意义上可以突破冯·诺依曼结构的体系瓶颈,比如说右侧是今天神经网络的主要模式,左边是以前的模式,可以看到计算可以提高带宽10倍甚至上百倍。

    image.png

      这样的计算,现在还有NVIDIA、AMD的GPU这样的并行处理单元来加速,大家可以看到这个数字,120个TFLOP/S,这是今天 NVIDIA最好的显卡能做到的计算力。大家可以比较一下去年GPU的显卡还是Pascal 系列,是10个TFLOP/S,今年不管是 NVIDIA还是谷歌第二代的TPU,计算量提高了10倍、甚至20倍,这远远打破了摩尔定律,这是在训练端或者服务器端。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。