摩尔定律支配了计算领域 44 年的时間今年终于宣告终结。在这之后计算领域会发生什么事得益于半导体和芯片技术而高度繁荣的手机、PC 产业,会受到怎样的影响
我们從未来的四大类别、十大方向进行剖析,分别是:1.从根本上改变芯片的设计;2.寻找硅材料的替代品;3.从现有晶体管寻找出路;4.计算框架的變革摩尔定律最早由英特尔联合创始人 Gordon Moore 提出,内容是:当价格不变时集成电路上可容纳的元器件数量约每隔 18-24 个月就会增加一倍,性能吔将提升一倍后面 Moore 修正了模型,变为:单位面积芯片上的晶体管数量每两年能实现翻番
谁也想不到,这个 1971 年提出的定律竟能支配计算领域长达 44 年的时间。直到今天英特尔官方宣布,放弃过去十年坚持的 Tick-Tock 处理器发展模式通过延长制造工艺的生命周期,将之前的处理器研发周期从“两步”变成“三步”:
这意味着对于英特尔而言摩尔定律已经失效。
摩尔定律的失效并不出乎人们的意料。微软研究院的副总裁 Peter Lee 曾经开玩笑说:“预测摩尔定律将会失效的人数每 2 年都会翻上一番。”而在英特尔官方宣布放弃追求摩尔定律曲线的时候這一天也就到来了。
摩尔定律对整个计算产业有着举足轻重的影响我们最为关心的是,在摩尔定律之后计算领域会发生什么改变?***就在以下十大方向包括:
(1)从根本上改变芯片的设计:包括 3D 维度的芯片设计、周围栅极、量子隧穿效应等。
(2)寻找硅材料的替代品:包括硅 - 锗(SiGe)、合金隧道、III-V 材料设计、石墨烯、自旋晶体管等
(3)从现有晶体管寻找出路:多核芯片、特制芯片、新品种芯片。
(4)计算框架的变革:量子计算框架、光通信、量子阱晶体管、神经形态计算、近似计算
摩尔定律的黄昏将带来机遇、混乱和大量的摧毁性创意。一个原本依赖于大量设备稳步升级的行业将被撕碎那么计算的未来,究竟会怎样发展
摩尔定律并不昰一套“物理定律”,而是大公司定义的经济规则在以英特尔为首的芯片公司定义了一套游戏规则,要在两年的时间里把晶体管数量增加一倍同时成本减少一半。
过去这套经济规则并没有违反物理定律研究人员发现,当晶体管在体积变小时性能也会变得更好:
体积較小的晶体管在开启关闭时需要的能量更少、速度也更快。这意味着你可以使用更多更快的晶体管而无需付出更多能量或产生更多废热,因此芯片可以在越做越大的同时、性能也越来越好
能做到这一点的公司获得了成功,而做不到的则逐渐被历史淘汰但当晶体管尺度變小到小型化的极限“原子尺寸”的时候,事情变得和人们期待的有所不同
在这种原子尺寸下,现代晶体管的源极和漏极非常接近大約是 20 纳米的量级。这会引起隧道泄露剩余电流能够在装置关闭的时候通过,浪费了电量和产生不必要的热量
从这个来源产生的热量会導致严重的问题。许多现代芯片都必须低于最高的速度运行或者周期性的关闭部分开关以避免过热,这限制了它们的性能表现
现在的芯片晶体管间距已经在 10 纳米左右的量级了。减小间距会带来非线性的成本增加根据国际商务战略公司 CEO Handel Jones 的估计,当业界能够生产晶体管间距 5 纳米的芯片时(根据过去的增长率来看可能出现在2020年代早期)晶圆厂的成本可能飙升到超过 160 亿美元,这是英特尔目前年营收的三分之┅
2015 年英特尔的年营收是 554 亿美元,只比 2011 年增长了2%这种营收的缓慢增长与成本的大幅上涨,带来了显而易见的结论:从经济的角度来看摩尔定律已经过时了。
很显然传统的芯片设计方案已经到达了瓶颈。要找到下一代芯片会需要两个广泛的变化。
(1)晶体管的设计必須从根本改变;
(2)行业必须找到硅的替代品因为它的电学属性已经被推到了极限。
针对这个问题一个解决方案是重新设计隧道和栅極。按照惯例晶体管一直是平面的,但自从 2012 年之后英特尔给产品增加了第三个维度。要启用它来生产出只有 22 纳米距离的芯片它切换箌了被称为“finFETch”的晶体管。这个产品让一个通道在芯片表面竖起来栅极围绕着该通道三个裸露的方向(第二张图),这使得它能够更好嘚处理发生在隧道内部的任务这些新的晶体管做起来比较棘手,但相比过去相同尺寸的版本要快 37%,而且仅仅消耗一半的电量
下一个邏辑步骤,Argonne 国家实验室的 Snir 先生说是周围栅极(Gate-All-Around)的晶体管,它的通道被四面的栅极环绕这能提供最大的控制,但它给制造过程增加了額外的步骤因为栅极必须在多个部分分别构建。大的芯片制造公司例如三星曾经表示,它可能会使用周围栅极的晶体管来制造 5 纳米分離的芯片三星以及其他的制造商,希望能做 2020 年代前期达到这个阶段除此之外需要更多外部的解决方案。一种想法是利用量子隧穿效应这对于传统的晶体管来说是很大的烦恼,而当晶体管缩小的时候事情也总会变得糟糕。这是有可能的通过施加电场,以控制隧道效應发生的速率低泄漏率对应状态 0,高泄漏率对应 1第一个实验隧道晶体管由 IBM 的团队在 2004 年展示。从那之后研究人员一直致力于商业化。
2015 姩美国加州大学一个由 Kaustav Banerjee 领导的研究小组,在 Nature 上发表了一篇文章他们已经建立了一个隧道晶体管,工作电压只有 0.1要远远小于比目前正茬使用的 0.7V,这意味着更少的热量但是在隧道晶体管变得可用之前,还有更多的工作需要完成ARM 的微芯片设计师 Greg Yeric 说道:“目前它们在打开囷关闭开关的速度还不够快,不足以让它们在快速的芯片中使用Jim Greer 和他在爱尔兰 Tyndall 研究院的同事提出了另一个思路,它们的设备被称为无连接纳米线晶体管(JNT)旨在帮助解决小尺度制作的问题:让掺杂做的足够好。“这些天你正在谈论半导体掺小量的硅杂质然后会很快来箌这个点,即便是一个或两个杂质原子的错误位置都会激烈的影响晶体管的表现。”Greer 博士说道
相反他和他的同事提出建立自己的 JNTs,距離一种一致掺杂的硅只有 3 纳米的跨越。通常来说这会导致一条电线,而不是一个开关:一个有着均匀导电能力的设备而且不会被关閉。但是在这种微小的尺度下栅极的电子影响能够刚好穿透电线,所以单独的栅极能够防止在晶体管关闭的时候进行电流流动。
传统晶体管的工作原理是在原本彼此隔离的源极和漏极之间搭建电桥。Greer 博士的设备以其他的方式工作:更像一个软管栅极充当着避免电流鋶动。“这是真正的纳米技术”他说:“我们的设备只能在这个尺度上工作,而最大的好处是你不需要担心制造这些繁琐的结点。”
芯片制造商也在用超越硅的材料进行试验去年,一个包括了三星、Gobal Foundries、IBM 和纽约州立大学的研究联盟公布了一个 7 纳米的微芯片,这个技术被在 2018 年以前并不被期待来到消费者的手中。它使用了和上一代发布的 FinFET 相同的设计做了轻微的修改,但尽管大多数的设备都是从通常的矽制作完成的其晶体管大约一半都是由硅 - 锗(SiGe)合金制成的隧道。
选择了这种设计是因为在某些方面,这是比硅更好的导体再一次,这意味着更低的功率使用并且允许晶体管更快的打开和关闭,提升芯片的速度但这不是万能药,IBM 物理科学部门的负责人 Heike Riel 说现代芯爿从两种晶体管构建,一个被设计为传导电子带着负电荷。其他种类被设计来导入“洞”里这会放置在可能、但意外没有包含电子的半导体中。这些的出现表现的就像它们带有正电荷的电子。并且虽然硅锗擅长输送“洞穴”,但相比硅来说它不是很擅长移动电子。
沿着这些线路到更高性能的表现未来的路径可能需要同时把硅锗和其他混合物,让电子能比硅制材料中更好的移动拥有最好电学性能的材料是一些合金,例如铟镓和砷化,在元素周期表中统称为 III-V 材料
麻烦的是,这些材料很难和硅进行融合它们晶格中原子之间的間隔距离,和硅原子之间有很大的不同所以将它们的一层增加到硅基片中,从中所有芯片的制作都会导致压力这会带来芯片断裂的压仂。
最著名的替代方法是石墨烯它是单原子厚的碳形式(二维)。石墨烯在操作电子和空穴的时候表现的非常好但难点在于如何使它停止下来。研究人员一直试图通过掺杂、压碎、挤压石墨烯或者使用电场来改变电学的性能。现在已经有了一些进展:曼彻斯特大学 2008 年報告了一个正在工作的石墨烯晶体管;加州大学 Guanxiong Liu 带领的研究小组2013 年使用了一种有“负电阻”特性的材料以制作设备。但对石墨烯真正的影响Yeric 博士说道,是刺激对其他二维材料的兴趣“石墨烯是一个打开的盒子,”他说道:“我们现在正在寻找像二硫化钼的物质或黑銫磷、磷硼的混合物。”重要的是所有的这些都像硅一样,可以很容易打开和关闭
如果一切都按照计划进行,Yeric 博士说新型的晶体管設计和新材料,可能让事情在 5 年或 6 年里还滴答作响到了那个时候可能会有 5 纳米的晶体管。但除此之外“我们已经用尽了一切方法,避開真正根本性的需求”
对于这方面来说,他最倾向的候选对象是所谓的“自旋电子学”电子系使用一个电子的电荷来代表信息,自旋電子学使用“旋转”这是电子的另一个固有属性,并且和物体拥有的转动能量相关联它很有用,旋转有两个变化:向上和向下它可鉯用来表示 1 和 0。计算机行业对自旋电子学已经有了一些经验:例如它是硬盘里的应用
对自旋晶体管的研究已经超过了 15 年,但是迄今为止還没有投入生产难做的是,驱动它所需的电压是非常微小的:10-20 毫伏相比常规的晶体管要少数百倍,这可以解决热量的问题但是这也帶来了设计的问题, Yeric 说道有着这种分钟电压,在电子噪音中区分 1 和 0变得非常棘手。
“在实验室里建造一个新奇的晶体管是相对而言仳较容易的事情,”分析师 Linley Gwennap 说道。“但是要取代我们今天正在做的事情你需要在一个芯片上投入数十亿美元,需要有合理的成本以忣非常高的可靠性,而且几乎要没有任何缺陷我不会说着无法做到,但这是非常困难的”这也让寻找其他的办法制作更好的计算机,變得十分重要
严格的说,摩尔定律是关于越来越多数目的组件可以被整合进一个给定的设备中。更一般的說计算机总是变得越来越好。随着晶体管变得越来越难以缩小计算公司开始考虑更好的利用已有的晶体管设备。“过去管理者们不希朢在密集设计上投入过多”ARM 的 Greg Yeric 说道:“我认为这将会开始发生变化。”
一种方法是:让现有的芯片工作强度更大电脑芯片有一个主时鍾,每次它滴答的时候里面的晶体管就会进行开、关动作。更快的时钟意味着更快的执行指令。提高时钟速率已经使得芯片在过去的 40 姩里变得更快的主要途径但是,在过去的 10 年里时钟速率几乎没有变化。
芯片制造商通过使用额外的晶体管压缩以复制芯片已有的线蕗作为回应。这种“多核心”芯片把一些比较慢的处理器捆绑起来,要比单纯依靠单一的快速处理器表现的要更好大多数现代的台式計算机是 4 到 8 核,有的甚至有 16 个核
但是,正如业内人士发现的多核芯片的速度达到了限制。“大家一致认为如果我们继续这样做,如果我们的芯片有 1000 个核那么一切都会好起来的。”微软芯片设计专家 Doug Burger 说道但是,要获得最佳的芯片程序员们不得不把任务人***成小塊,让它们可以同时工作“事实证明,这真的很难”Burger 博士说。实际上对于一些数学任务而言,这是不可能的事
另一种方法是专攻。使用最广泛的芯片例如 Intel’s Core 产品线,或者那些基于 ARM’s Cortex 设计的芯片(在地球上几乎所有的手机都能找到)都是多面手它们具有很强的灵活性。不过这是有代价的:它们可以做一切事情但没有一件事情能做的完美。调整硬件让它更好的适用于特别的数学任务,可以让你茬解决一般性的任务时有着 100 到 1000
专门特制的芯片已经在计算行业的一些领域中得到使用。最著名的例子是用来提高视频游戏视觉效果的显鉲由Nvidia和AMD之类的公司所设计,在1990年代中期崭露头角英特尔后来的奔腾芯片也有为一些任务(比如视频解码)设计内置的特制逻辑。但这囸也有缺点
设计新的芯片需要数年的时间,研发成本可能高达数千万甚至数亿美元特制芯片也比通用用途的芯片更难编程。并且由於天性使然,它们只能提升某些任务上的性能表现
特制逻辑更好的目标对象——至少在一开始的时候——可能是数据中心,这些需要庞夶计算力的仓库为运行互联网的服务器提供着动力
由于数据中心处理着海量的数据,它们可能永远都需要一块只能做一件事、但做得非瑺好的芯片
基于这个原因,微软——全球最大的软件公司和云计算服务供应商之一——正在投资芯片设计业务2014年,微软公布了一台名為Catapult的新设备它使用了一种叫做现场可编程逻辑门阵列(FPGA)的特殊芯片,这种芯片的设置可以随心所欲地进行调整FPGA提供了一种介于特制囷灵活之间的折中,非常实用带领Catapult研发团队的Burger说道:“这是想要在可编程的软件以外也有可编程的硬件”。当一个任务结束以后FPGA可以茬不到1秒内被重新调整到符合另一个任务的设置。
这种芯片已经被微软的搜索引擎Bing所使用微软表示,FPGA使服务器在给定时间里能处理的请求数量翻了一倍除此之外,也有许多其他的潜在应用Peter Lee这样说道,他是Burger在微软的顶头上司当某种特定的算法需要被反复应用在数据流仩时,FPGA脱颖而出一种可能性是用Catapult来加密计算机之间的数据流以确保它们的安全性。另一种可能性是将它用在云端互联手机的语音识别和圖像识别任务上
这种技术不是全新的,但是直到现在才找到使用它的理由全新的是“云端正在以让人瞠目的速度增长,”Burger说道“现茬摩尔定律正在不断放缓,这使得越来越难以增加足够的计算力来与云端相匹配所以这类后摩尔时代的项目开始变得有经济意义。”
撇開鳍形晶体管(finned transistors)不谈现代芯片都是非常扁平的。但是也有一些公司包括IBM,正在研究将芯片互相叠加——就像一层一层叠高楼房一样——来让设计师们能够在给定区域里安置更多晶体管三星已经在销售用垂直堆叠的闪存制作的存储系统了。去年英特尔和Micron(一家大型內存制造商)宣布研发出了一种名为3D Xpoint的新型内存技术,能够利用堆叠的内存
IBM的研究人员们则致力于研究某种稍有不同的东西:将内存层(slices of memory)叠在处理逻辑层(slices of processing logic)之间,像三明治一样的芯片这将能让工程师们把大量的计算封装到非常小体积的芯片上,同时带来很大的性能提升传统计算机的主存储器(main memory)位于距离处理器几厘米远的地方。从硅晶的传递速度(silicon speeds)来说一厘米已经是非常长的距离了。在这样嘚距离上传递信号也很浪费能量将内存移至芯片中以后,就把这些距离从厘米级降到了微米级使数据传输更快速。
但是3D芯片面对着2个夶问题第一个就是热量。扁平的芯片在这方面已经够糟糕了在传统数据中心里有数以千计的风扇为服务器散热,轰鸣声不绝于耳增加叠加层数以后,芯片内部——也就是热量产生的地方——热量增加速度会超过散热速度
第二个问题是如何接入电力。芯片通过其背面數以百计的金属“针(pins)”与外界相连现代芯片对电力的需求高到多达80%的金属针都被设置为用来传输电力,只剩下非常少的数量用来处悝数据输入和输出在3D形态下,这种局限被放得更大因为同样数量的金属针必须要满足比原先复杂得多的芯片。
IBM希望能通过在3D芯片中置叺微型内部管道来一箭双雕地解决这2个问题微流控通道(microfluidic channels)可以将冷却液运往芯片的核心部分,一下子将内部空间中的热量都带走这镓公司已经在传统的扁平芯片上测试了这种液体冷却技术。微流控系统可以最终从1立方厘米的空间里带走大约1千瓦的热量——差不多和电加热器上一片加热器的输出差不多这个团队的负责人Bruno Michel说道。
而液体能做的不只是冷却芯片它也能传递能量。受到自己生物学背景的启發Michel将这种液体命名为“电子血液”。如果他能顺利完成的话这种液体之于计算机芯片就会像生物血液之于生物体:在提供能量的同时保持体温恒定。Michel的想法是液流电池(flow battery)的一种变体:在液流电池中两种液体在膜的两侧相遇并产生电流。
液流电池非常简单易懂电力荇业一直在研究液流电池,想将它作为储存来自可再生能源的能量的一种方式Michel的系统距离商业应用来说还有许多年要走,但是原理已经確立:当Ruch打开液流开关管道连接到的芯片就会“苏醒”——而你在视线范围内根本看不到插头或是电线。
量子技术可以实现速度上的大飛跃但是只是在特定的应用上。
THE D-Wave 2X 是一个黑色的盒子看起来有点像电影《2001:太空漫游》中神秘的黑石板的缩小版。它不是一般的机器咜是世界上第一台在商业上可用的量子计算机。目前已经和惠普、微软、IBM 和谷歌建立了合作
量子计算是一种完全不同的处理信息的方法。在一些普通机器难以处理的问题上它拥有巨大的速度优势。即使摩尔定律得以无限地延伸下去这些问题也会持续的困扰普通机器。
洏量子计算常常是被误解有时是过分吹嘘的。其中部分原因是该领域本身还很新所以其理论基础依然还在搭建中。在一些任务的完成仩量子机器毫无疑问要比最好的非量子机器要快。但是在其它的大部分任务上这一优势就没那么明显了。“在许多情况下我们不能確定某个量子计算机会比大家熟知的经典计算机快”,麻省理工学院的计算机科学家 Scott Araronson 说可用的量子计算机将会是一个福利,但是没人能確定这个福利会有多大
一个例子是,找到一个很大的数字中的质数因子:这个问题中随着目标数字变大,难度会呈指数式的递增换呴话说,摩尔定律中每一次芯片工艺的升级,都只能再影响到稍微大一点的数字确定质数因子组成了大多数密码的数学支柱,这能在數据游走在互联网上时起到保护作用恰好是因为这很困难。
两个非常规的量子现象量子比特,或者说是量子位在运行是完全不一样嘚。第一是“叠加”态指一种持续不确定性的状态,能让原子同时能在不同的状态存在比如,一个量子粒子是没有具体的位置的只囿说是有出现在某个地方的可能性。在计算层面这意味着,一个量子位不是特定的1或特定的0,而是以二者混合的方式存在第二个量孓现象是“牵连”态,不同粒子的发展绑被在一起所以其中某一个粒子受到影响的话,会立刻在其它粒子上有所反映 这能让量子计算機在同一时间处理所有的量子位。
结果便是一台机器能够一次性地呈现并处理海量的数据。例如一个300量子位的机器,能够同时描绘2300个鈈同的1和0串这一数字几乎等同于可见宇宙中所有的原子数量。并且由于量子位是牵连的,所以要同时处理所有的这些数字也是可能的
光通信:使用光来代替电,在电脑甚至芯片间进行沟通。这将能降低能源消耗促进发展。惠普、麻省理工学院
更好的存储技术:建造新的快速、密集和便宜的内存,解决在计算机性能上遇到的瓶颈英特网,美光(Micron)
量子阱晶体管:使用量子现象来改变晶体管中嘚电池的表现,提升性能使得摩尔定律能够再反复,提升速度降低能源消耗。
开发新的芯片和软件:在从专门化的芯片串建立的机器仩实现代码编写的自动化已经证明,这在Soft Machines上尤为困难
近似计算:让计算机的内部表征数字更加精确,以减少每次计算时的比特数量進而节省能源;允许计算机在计算中发生随机的小失误,能够释放配对的其它比特这也能节约能源。华盛顿大学微软。
神经形态计算:以动物大脑中处理信息的缠结和紧密联结的神经束为模型开发设备这可能会降低能源消耗,想识别模式和其它的AI相关的任务也被证明昰有用的IBM,高通
碳纳米管晶体管:这些卷起的石墨片材保证了低的能力消耗和高的速度,正如石墨烯那样和石墨烯不同,它们也能夠轻松的关闭但是很难进行量化生产。IBM斯坦福大学
摩尔定律的终结将会让计算机行业变得更加的复杂。在摩尔定律处于巅峰时期时荇业是很简单的。计算机的以可预测的方式和速度升级随着节拍被打乱,计算机行业将成为一个更加复杂的地方类似智能设计和狡猾嘚编程是有用的,奔腾的芯片设计师Bob Colwell说:“但是许多一次性的创意的集合不能弥补潜在指数上的不足”
跟此前相比,发展将变得更不可預测受到的局限会增多,速度会减慢“随着摩尔定律消退,我们被迫在三个方面即力量、表现和成本上作出艰难的选择”,ARM的芯片設计师Greg Yeric说“一个特定的***不能完美地服务于所有的终端使用。”
摩尔定律的黄昏将带来机遇、混乱和大量的摧毁性创意一个原本依賴于大量设备稳步升级的行业将被撕碎。
软件公司将开始进入硬件生产;硬件制造商需要改进自己的产品更贴近用户越来越多样化的需求。但是正如Colwell所说,要记得消费者并不会在乎摩尔定律:“大多数买计算机的人甚至根本胡知道晶体管有什么用”。他们仅仅是想要這个产品他们购买,是想要更好、更有用过去,这意味着大多数都是在速度上获得指数式的增长这条道路已经走到尽头。但是依然囿很多别的方法来制造更好的计算机
来源:新智元微信公众号
有时候如果你在某个商业领域堅持上足够长的时间,市场就会自己来找你
数十年来,Xilinx(赛灵思)一直是现场可编程门阵列(FPGA)的领导者至今仍然占有 60% 的市场份额。渶特尔在大约三年前以 167 亿美元的价格收购了 FPGA 领域的竞争对手 Altera占据了大部分市场份额。
尽管 Xilinx 在过去几年中取得了稳定的增长它在 2018 财年的收入比前一年增长了 8%,达到创纪录的 25.4 亿美元但 FPGA 仍然刚刚开始在数据中心站稳自己作为计算机引擎的地位的脚跟。
而英特尔、AMD 和 IBM 的 CPU 仍然是計算的主要驱动力在 Nvidia 和 AMD 的 GPU 加速器的帮助下,一些前景光明的 Arm 阵营的公司希望希望能够在 Cavium 的领导下参与到这场变革中来
于是,越来越多潒 FPGA 以及定制化 ASIC——这些 CPU 之外的加速器被人们所使用但是目前大部分的数据中心中占据主导地位的处理器仍然是 CPU。
尽管如此Victor Peng 这位在 Xilinx 工作叻 10 年的老员工(自从今年 1 月份起担任该公司 CEO),也看到了这种转变想着有朝一日可编程硅芯片会成为大型数据中心用户、云平台建设者使用的高性能计算中心,以及常规企业的数据中心中的计算驱动力
计算机领域正经历着重要的变革,这导致人们对异构计算的需求与日俱增从而在不用改变任何底层架构的情况下能够适应手头的工作量。特别是目前越来越多从核心到网络边缘再接入云端的终端正在被连接起来并通过传感器、摄像头和其他设备被赋予了智能,它们创造了大量的非结构化数据
这些数据推动了对更强的计算能力和更大的存储空间、使用人工智能 (AI) 和机器学习等技术的需求,从而使人们对这些数据有更好的感知和决策的能力
正如我们在「The Next Platform」中谈到的,FPGA 引起叻人们对机器学习和深度学习领域的兴趣Xilinx 今年夏天则收购了以神经网络和 FPGA 为业务核心的初创公司 DeePhi。
Victor Peng 在硅谷举行的 Hot Chips 2018 上发表的主旨演讲中提箌:“这种形式的智能化中的各个组成部分是完全相互联系在一起的这种情况切切实实地发生了,而且尚处于早期起步阶段”
尤其是從今天的角度来看,智能化意味着在某种程度上我们不仅仅拥有某种智能处理器(例如系统级芯片,SOC)还要求所有的应用都拥有某种形式的人工智能,这通常会融入某种形式的机器学习技术
这种情况之所以让人如此兴奋,是因为它不仅已经对人们的日常生活产生了影響而且由于其刚刚兴起,并且这个领域的变革正在以指数级的速度发生着它对人们日常生活的影响会越来越深远。
Peng 指出有人预测在鈈久的将来每年的数据量将超过 10ZB,而且“从中获得某种价值通常意味着对数据进行处理并以某种形式从原始数据中提取这些信息,这大夶推动了大型数据中心中服务器数量的增长数据中心的规模扩展地比我们以前所见到的要大得多,计算、存储空间和内存都在不断增加‘’
你可以看到,目前机器性能的增长也已经跟上了数据处理和总的存储空间那种指数级的增长速率
有趣的事,人们认为这一切都是通过各种各样的大型数据中心用户的广告收入以及从云平台构建者的基础设施服务获利的
然而,在这种情况下仍然存在一个很大的问題,那就是摩尔定律Peng 将其称为‘’一个巨大的挑战‘’。
摩尔定律告诉我们晶体管的尺寸会缩小并且我们可以将更多的晶体管集成在┅个特定的区域中,从而具备更强的处理能力以及更低的成本50 年来,摩尔定律在这个行业中一直都十分有效但如今这条定律已经很难洅维持下去了。
他说:‘’我们每个人都根深蒂固地认为即使是对于科技产品来说,日常消费者也希望能够获得处理速度更快、更便宜嘚产品‘’
‘’实际上,我们每年都希望电子产品都能遵循这样的物理定律:人们可以以同样的价格得到能力更强的更好的产品因此,当我们说摩尔定律不再适用于我们今天的产业发展时这种影响是十分深远的。‘’
多年来芯片制造商已经使用了各种手段来跟上摩爾定律的步伐,包括增加更多的核心驱动芯片内部的线程,以及利用各种加速器
然而,Peng 认为更快更好的系统不仅需要通过处理器技术實现还需要通过架构来实现。系统架构本身也面临着诸多挑战特别是功率和密度,这也限制了性能
‘’过去的 40 年中,计算主要集中茬 CPU 和微处理器上‘’Peng 说。
‘’在本世纪的头十年这种状况渐渐走到了尽头。从 2010 年起计算环境开始向异构系统发展,这时我们的计算機所使用的处理器可以被分为通用处理器以及那些你可以广泛称之为固有硬件加速器的处理器这样的处理器可能是一个 CPU 或一个 MPU,当然茬机器学习领域 ASIC 也渐渐复兴起来。‘’
机器学习和其他现代计算工作以及激增的连接起来的智能设备(数百亿),正推动新一轮的对硅技术的投资和对可配置和适应性强的硬件平台的需求异构结构设计将是推动性能提升的关键。
通过机器学习和所有这些相连的设备和系統‘’你不能把它们固定下来,因为你无法预测当你部署这些设备时全部的需求将会是什么而且你不会想要通过改变物理设备来为这些基础设施赋予相应的能力‘’。
‘’这种观念不仅能够在软件层面上改变在硬件层面上,远程的大型智能设备正变得越来越强大而苴为了满足未来的计算需求,这种变革是绝对有必要的‘’
在 Hot Chips 上,Peng 和其他 Xilinx 的官员在演讲中谈到了该公司接下来的战略包括即将推出的洎适应计算加速平台 (ACAP) 和 7 纳米工艺的「Everest」系统级芯片。
Xilinx 在三月份第一次谈到 ACAP虽然那时他们并没有就此平台深入介绍,但是 Peng 的确在这个项目仩倾注了经历在十月份 Xilinx 的开发者论坛上,他们很可能对这个平台进行深度展示
Xilinx 表示,ACAP 将在机器学习推理方面为该公司现有的 16 纳米 FPGA 提供 20 倍的性能提升并且在 5G 网络方面提供 4 北的性能提升。今年晚些时候「Everest」将在台湾半导体制造公司的 7 纳米工艺平台上被生产出来。
ACAP 是针对適应性和可编程性进行设计的该平台的可编程引擎将从源头解决机器学习推理和 5G 网络工作的问题。
体系结构的核心是一系列 Tile 单元每个 Tile 單元都会表示一个互联资源结构以及可以针对特定应用的可扩展本地内存的特征。Xilinx 将提供一系列针对广泛市场的 SKU(库存量单位)
可编程邏辑器件包含 DSP、LUT、URAM 以及 BRAM。按照 Peng 的设想这个架构将允许用户为该架构编写程序,以最好地满足应用需求这使得他们能够为不同的工作部署相同的硅芯片。
Peng 说:‘’这将使交换内核和 DSA 的输入输出能够更快地进行同时减少设计的限制。‘’
‘’这是一个多元化的市场目前囿许多关于数据中心和云计算的讨论,但是由于 AXAP 的灵活性和处理深度它将服务于所有的市场。这个架构师可扩展的所以他可以在汽车Φ、在云应用程序、通信间的设备上、基础设施上被应用。这种架构从一开始就是软件可编程的但归根到底它还是可编程硬件。‘’
这吔会让我们得到更高的吞吐量、更低的延迟和更低的功耗当我们谈论现在的计算工作时,这些参数都和频率一样重要
Peng 说:‘’这些天來,特别是由于我们着眼于机器学习领域我们正热衷于提高 TOPS(评价指标)。‘’
‘’这让我想起了 1990 年代的 Megahertz Wars然而,真正重要的并不是这種指标重要的是应用程序的速度提升。我们通常以几百兆赫或者大约千兆赫的频率运行这些程序而不是几千兆赫。
这很大程度上是因為由于我们的架构需要有普适性,我们使用了很多分布时板载内存及其互联结构甚至还有一些端口的配置都是可以自定义的。你不仅鈳以优化数据通路和数据流还可以优化内存的层次结构和带宽,而板载内存的带宽是很大的‘’
加速器已经无处不在:世界上的仳特币是由旨在加速这种加密货币的关键算法的芯片采矿得来几乎每一种能发出声音的数字产品都使用硬连线音频解码器,数十家初创公司正在追逐能让深度学习AI无处不在的快速硅这种专用化,使得各类原本运行在通用CPU之上的软件及其内部常见算法得以在定制化硬件上帶来更快的处理速度被认为是摩尔定律失效之后,我们能够在接下来一到两代芯片当中继续驱动计算能力保持增长的一种方法
Architecture )上发表的研究结论。他们计算出芯片专用化不能产生摩尔定律所能产生的那种收益。换句话说加速器的发展会像晶体管的缩小那样碰壁,洏且这会比预期的更快发生
为了证明他们的观点,Fuchs和Wentzlaff必须弄清楚最近的性能提升有多少来自芯片专用化调整有多少来自摩尔定律本身。这意味着要检查1000多份芯片数据表弄清楚一代又一代芯片的改进有多少部分要归功于更好的算法和更巧妙电路的巧妙实现方法。换句话說他们试图量化人类的聪明才智。
为此他们做了工程师们擅长的事:他们将它转换为一个无量纲的量。他们将其称为芯片专用化回报希望借此回答这样一个问题:“在晶体管的固定物理预算下,芯片的计算能力提高了多少”
使用该指标,他们评估了特定应用集成电蕗(简称ASIC)上的视频解码、GPU上的游戏帧速率、FPGA上的卷积神经网络以及ASIC上的比特币采矿结果并不令人振奋:专用芯片的增益很大程度上取決于每平方毫米硅上可用晶体管数量的增加。换句话说离开了摩尔定律,芯片专用化本身的力量是有限的
因此,如果专用化无法给出悝想的***那么未来的出路在哪里?Wentzlaff建议半导体业界学习使用那些能够在逻辑停止时仍可实现扩展的东西进行计算例如,每平方厘米鈳用闪存的比特数在不受摩尔定律影响的情况下持续增长因为业界已经转向使用能够制造出256层甚至更高单元层数的3-D技术。Fuchs和Wentzlaff已经开始研究这个问题他们开发了一种计算机架构,通过让处理器查找存储在内存中的先前计算而不是重新计算它们来加速计算
声明:本文由入駐电子说专栏的作者撰写或者网上转载,观点仅代表作者本人不代表电子发烧友网立场。如有侵权或者其他问题请联系举报。