桦川| 白朗| 相城| 华蓥| 清河门| 高邮| 沁水| 万年| 宾川| 花垣| 漯河| 闽清| 浦江| 头屯河| 昔阳| 松江| 三水| 墨竹工卡| 西昌| 宣汉| 绵阳| 怀远| 夏邑| 隆林| 堆龙德庆| 喀什| 象州| 夹江| 新都| 垫江| 沿河| 措美| 吕梁| 郓城| 达孜| 昌邑| 佛冈| 和政| 砀山| 大竹| 鲅鱼圈| 华蓥| 濠江| 巴马| 西安| 平阳| 本溪市| 铜鼓| 广河| 五峰| 巨鹿| 宿州| 中宁| 奇台| 白碱滩| 南海镇| 察哈尔右翼前旗| 广德| 墨玉| 科尔沁左翼中旗| 恩施| 灌阳| 防城港| 冷水江| 仁寿| 黔江| 开化| 察雅| 平川| 赣榆| 新源| 泾川| 荥阳| 霍林郭勒| 昌吉| 凌海| 铁山| 大理| 海沧| 台州| 八宿| 德格| 金溪| 隆化| 景洪| 宽甸| 康保| 淮北| 东丽| 安远| 湘乡| 普安| 汉阴| 元坝| 内蒙古| 罗城| 博乐| 门源| 博湖| 门头沟| 海安| 松原| 太湖| 土默特右旗| 马关| 西平| 文安| 遵义市| 平利| 宁陵| 辽中| 合作| 郏县| 宜秀| 桐城| 苏尼特左旗| 威远| 柳林| 永年| 宁阳| 依兰| 洪湖| 延津| 广水| 荣昌| 永善| 侯马| 南澳| 台州| 舒兰| 塔城| 北流| 原阳| 宣城| 武鸣| 邛崃| 鸡泽| 岳阳市| 禹州| 石楼| 井陉| 察雅| 郯城| 岱山| 蒙城| 息县| 长泰| 喀喇沁左翼| 固阳| 前郭尔罗斯| 凤冈| 临洮| 万年| 虞城| 永仁| 宣威| 阳朔| 西固| 神木| 积石山| 桦川| 正蓝旗| 亚东| 南投| 多伦| 疏附| 金坛| 新巴尔虎左旗| 乌什| 海盐| 新郑| 福鼎| 苗栗| 武山| 新巴尔虎左旗| 冕宁| 黔西| 上虞| 台北市| 万安| 宁波| 临清| 乐东| 华容| 阿瓦提| 武隆| 湟源| 洋县| 青州| 阜宁| 苏尼特左旗| 太仆寺旗| 建宁| 铜川| 乐昌| 夏津| 大同区| 文登| 彰化| 光泽| 哈密| 石屏| 台江| 乳源| 龙泉| 吉林| 定安| 正镶白旗| 禹州| 宁安| 吉首| 巴马| 琼结| 抚宁| 渠县| 常德| 茂港| 汝城| 丰都| 建平| 南投| 泰宁| 易门| 永德| 北安| 岳西| 织金| 阿克苏| 东阳| 定边| 宜宾市| 榆社| 饶平| 呼兰| 伊川| 天山天池| 泗洪| 抚松| 维西| 阜新蒙古族自治县| 惠州| 沛县| 图木舒克| 开远| 曲水| 武宁| 夏县| 安国| 左权| 琼中| 牡丹江| 寿宁| 琼山| 新龙| 宿豫| 青白江| 融水| 黔江| 小河| 循化| 礼泉| 鹰潭| 黟县|

《任天堂明星大乱斗》登场人物资料大全

2019-08-25 10:38 来源:赤峰广播电视网

  《任天堂明星大乱斗》登场人物资料大全

  王小东说,当前,随着中央“一带一路”战略的实施,特别是中央赋予了广西发展的新定位、新使命,南宁的发展面临着重大的机遇。从政策上优先支持主动创新、主动开展产学研合作的各类企业,确保到2015年全社会创新研发年投入超过300亿元。

“表演一开始,众人跳起猴鼓舞开门迎客,迎来文莱的朋友,大家在欢乐的场景中翩翩起舞。当天上午9时,何涛准时来到位于悦荟广场的青年志愿者服务站开展排队礼让的文明引导活动,引导市民、机动车自觉礼让斑马线和交通文明行车,并对不文明的现象及时进行阻止,确保交通畅通有序。

  力度之大、措施之实,让扬尘治理立竿见影,截至今年7月31日,南宁市区空气达标天数比例为%,空气质量为“优”的天数是115天,比去年同期多28天。另外,硬路肩没有了,事故救援通道没有了,一旦遇到交通事故,很容易发生拥堵。

  为不断降低企业制度性交易成本,近年来市质监部门对工业产品生产许可审批制度进行了探索改革。要聚力抓好农村公路等基础设施建设,实施好幸福公路建设,真正把农村公路打造成产业路、旅游路、致富路、幸福路。

立足于“突出特色、迅速做大做强、向300亿级园区迈进”的目标,刘官庄镇不断完善园区配套设施建设。

  9月6日,自治区党委常委、市委书记王小东,市长周红波到城市主要路段、重点领域和展会场馆再次现场检查服务“两会”各项工作,强调全市上下要深入学习贯彻习近平总书记视察广西重要讲话精神,认真落实自治区党委、政府关于办好今年“两会”的部署要求,以高度的政治责任感和使命感,坚决克服松懈麻痹思想,牢固树立“一盘棋”意识,切实把各项工作做实做细做出成效,高水平、高质量完成各项服务任务,全力以赴确保今年“两会”取得圆满成功。

  目前,该公司在中东航线共有13艘船运行。“该系列卡具有卡到即钱到、随用随取、超低费率、按日计收、有效期内任意还本等特点,最高额度可达20万元,支持100%提现。

  来源:地方供稿(责编:高丽、吴昊)

  德国红点奖针对不同类型参赛作品分为三大部分。南宁市公安局以此次大比武,吹响了“两会”安保决战冲锋号,通过演练拼比,进一步提高广大民警熟练掌握武装巡逻车的技能和实战水平,引导大民警最大限度地发挥武装巡逻车效能,把配发的装备转化为实实在在的战斗力,为打击各类违法犯罪,维护首府社会治安稳定,服务好党的十九大、2017年“两会”等各项安保工作。

  今后,南宁市还将坚持问题导向,强化整治措施,巩固扬尘治理成效,全面提升我市城市品质和形象,以优异的成绩迎接党的十九大的召开。

  “这两个由企业自己引进的项目投产后,新增年产值亿元,新增税收3000多万元。

  与此同时,一种“机器人劳动者”正日益引发社会关注。行风监督员发现,泥头车这类大中型货车超速、闯红灯等违规行为往往带来严重后果。

  

  《任天堂明星大乱斗》登场人物资料大全

 
责编:
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网 读懂智能&未来
人工智能 正文
发私信给程弢
发送

0

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

本文作者:程弢 2019-08-25 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
(姜小莉马浩剑陈暐)来源:常州日报更多报道详见苏ICP备08009317号-4新闻信息服务单位备案(苏新网备):2007028号信息网络传播视听节目许可证号:1008248常州市互联网新闻中心版权所有

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网(公众号:雷锋网)了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?
分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
龙冈镇 中家桥 黄家口镇 饶阳 兴莲乡
程家山乡 集宁市 尼雅乡 驼山乡 张老营村