300485买股票下载什么链接:股票中的PB是什么意思?

  • 时间:
  • 浏览:10
  • 来源:外汇开户流程,正规的股票配资开户平台

股票中的PB是什么意思?

平均市净率 股价 / 账面价值,其中,账面价值的含义是:

特斯拉自动驾驶FSD芯片NPU详解

特斯拉的FSD芯片是在年度IEEE Hot Chips大会上众多出色的演讲之一。特斯拉在今年4月首次公300485开了其全自驾(FSD)芯片。特斯拉对芯片的一些关键组件提供了更多的解析。特斯拉工程师为FSD芯片和平台制定了许多主要目标。他们希望在功率范围内尽可能多地封装TOPS。芯片的主要设计要点是批量使用一个芯片时,更好的提高芯片的利用率。FSD芯片随附了一组用于通用处理的CPU和一个用于后处理的轻量级GPU,NPU尽管芯片上的大多数逻辑都使用经过行业验证的IP块来降低风险并加快开发周期,但Tesla FSD芯片上的神经网络加速器(NPU)是由Tesla硬件团队完全定制设计的。它们也是FSD芯片上最大的组件,特斯拉谈论的一个有趣的花絮是仿真。特斯拉希望通过运行自己的内部神经网络来验证其NPU性能。所以需要借助于使用开源的Verilator验证模拟器,其运行速度比商业模拟器快50倍。我们广泛使用Verilator来证明我们的设计非常出色“特斯拉自动驾驶硬件高级总监Venkataramanan说,每个FSD芯片内部有两个相同的NPU –在物理上彼此相邻集成”当被问及拥有两个NPU实例而不是一个更大的单300485元的原因时。每个NPU的大小都是物理设计(时序,300485指令集(ISA)NPU是具有乱序内存子系统的有序计算机,Scale,NPU只是运行这些命令,可以更改指令的属性(例如。卷积运算的不同变体),用于数据依赖性处理。还有另一个扩展slots,该slots 存储了整个微程序命令序列。这些序列就会发送到SIMD单元,指令从32字节一直到非常长的256字节不等。稍后将更详细地讨论SIMD单元,初始操作NPU的程序最初驻留在内存中。并存储在命令队列中。NPU本身是一个非常花哨的状态机,旨在显着减少控制开销。来自命令队列的命令连同需要从中获取数据的一组地址一起mgc为原始操作-包括权重和数据,如果传感器是新拍摄的图像传感器照片。则输入缓冲区地址将指向该位置,一切都存储在NPU内部的超大缓存中,不需要与DRAM交换数据。有一个完善的bank仲裁程序。用于减少bank冲突,最多可以将256个字节的数据读取到数据缓冲区中。并且最多可以将128个字节的权重读取到权重缓冲区中,NPU可能在操作开始之前将多条线路带入数据缓冲区。以实现更好的数据重用,每个NPU的组合读取带宽为384B/周期,其本地缓存的峰值读取带宽为786GB/s。这使他们能够非常接近维持其MAC所需的理论峰值带宽。MAC阵列CNN的主要操作当300485然是卷积,占特斯拉软件在NPU上执行的所有操作的98.1%。在优化MAC上花费了大量的精力。在整个数组中广播输入数据的最底行和权重的最右列,单元继续独立执行其操作。这也是SIMD单元的吞吐量。NPU本身实际上可以在2 GHz以上的频率上运行,尽管特斯拉根据2 GHz时钟引用了所有数字,每个NPU可获得36.86 teraOPS(Int8)的最高计算性能。NPU的总功300485耗为7.5 W,这使它们的性能功率效率约为4.9 TOPs / W,这是我们迄今为止在出货芯片中看到的最高功率效率之一–与英特尔最近宣布的NNP-I(Spring Hill)推理加速器配合使用。它们消耗的总功率预算略超过40%。SIMD单元从MAC阵列,将一行压入SIMD单元。SIMD单元是可编程执行单元,SIMD单元为诸如sigmoid,tanh,这些指令由从机指令定序器执行。从指令定序器从前面描述的指令的扩展槽中获取操作。它支持在普通CPU中可以找到的大多数典型指令。SIMD单元还配备了可执行归一化,缩放和饱和的点状量化单元。将结果从SIMD单元转发到合并单元,或直接转发到写组合,在其中以128B /周期的速度将其有机会写回到SRAM。在conv单元中进行更高阶的处理。

买特斯拉一定要选装FSD吗?