3.1 龙芯3A1000
龙芯3A1000于2008年底交付流片,采用意法半导体的65nm工艺流片. 2009年5月20日龙芯3A1000晶圆生产下线,9月28日样片回来,成功启动操作系统,主频800MHz-1GHz
龙芯3A1000进行了第一次改版并于2010年5月中旬流片,10月底第一次改版流片成功。3A1000的第二次改版于2012年2月下旬流片,2012年8月中旬流片成功。
龙芯3A1000集成了4个四发射乱序执行的GS464核,9级流水线,有64KB一级数据cache和64KB一级指令cache,4MB共享二级cache,最高主频1GHz,功耗15w(支持动态降频),芯片面积174mm2,晶体管数目4.25亿。每个CPU核包含两个浮点乘加部件,双精度浮点性能峰值为16GFlops。在龙芯3A1000处理器中,实现了x86二进制翻译加速指令。
3A100集成了HT1.0*2,PCI控制器、LPC、SPI、UART、GPIO。集成72位DDR2/3控制器,引脚1121个,封装方式40mmx40mm FCBGA。
龙芯龙芯3A1000 01版本▲
龙芯龙芯3A1000 02版本▲
龙芯3A芯片版图▲
图片来源:中科院计算所2009年成果年报
3.2 龙芯3B1000
龙芯3B1000于2010年6月20日左右流片,2010年11月底回来第一批芯片
3B1000的第一次改版2011年2月初流片,7月初回来。龙芯3B1000进行了第二次改版,于2011年12月初流片,2012年4月底回来。
龙芯3B由核高基项目课题“高性能多核CPU研发与应用”支持,采用意法半导体65纳米工艺设计,主频1GHz,功耗25W,片内集成8个64位四发射乱序执行龙芯向量处理器核GS464V,4MB的二级cache,每个核包含两个256位向量部件,峰值浮点性能达到128GFLOPS。。
龙芯3B的最大特色是龙芯向量处理器核的设计,该处理器核将GS464核的的浮点部件和浮点寄存器堆替换为2个256位的向量处理部件和1个128x256位的向量寄存器堆,使龙芯3B在1GHz下的峰值双精度浮点计算能力达到128GFlops。在龙芯3B处理器中,实现了300多条专用的向量处理指令。
龙芯3B芯片面积300mm2,晶体管数目接近6亿。
龙芯3B1000▲
龙芯3B1000芯片布局和向量核结构框图▲
龙芯3B芯片布局▲
3.3 龙芯3B1500
龙芯3B1500在2012年1月中旬完成设计并交付流片。2012年8月底拿到样片。后来,工艺从32nm迁移到28nm,于2013年4月底流片,10月底收到样片,但流片并不成功,后来又恢复到32nm工艺流片,并以某种方式补偿此次流片费用,于是又再次改版,于2015年1月底流片,2015年6月下旬收到样片。
龙芯原本计划推出一款16核的龙芯3C处理器,后来由于战略调整,取消了原龙芯3C的研发,缩水成8核的龙芯3B1500。龙芯3B1500集成了8个四发射乱序执行的64位GS464V处理器核,9级流水线,每个处理器核有64KB的私有一级指令cache和64KB的私有一级数据cache,128KB私有二级cache,有8MB三级共享cache,采用中芯国际32纳米工艺生产,芯片面积180mm2,晶体管数11亿,主频1.5GHz,采用倒装焊球栅阵列(Flip-Chip BGA)封装,芯片引脚数1121,封装大小40mm×40mm。单芯片双精度浮点计算能力达到192GFlops。功耗30w(典型)/60w(向量)。
在接口上,有HT2.0*2,PCI、LPC、SPI、UART、GPIO,72位DDR2/3控制器。
龙芯3B1500▲
龙芯3B1500版图▲
3.4 龙芯3A2000/3B2000
龙芯3A2000于2014年11月初交付流片;2015年4月10日,拿到盲封样片。2015年8月18日,龙芯召开发布会,正式发布新产品。2015年9月和2016年3月分别进行了第一次改版设计和第二次的改版设计。
龙芯3A2000处理器集成了4个四发射乱序执行64位GS464E处理器核,也是首款采用GS464E微结构的处理器。采用中芯国际40纳米CMOS工艺生产,主频800~1000MHz,在1GHz下SPEC CPU2006分数为6.9分。封装方式FCBGA,1121引脚,封装大小40mm×40mm。
GS464E处理器核是GS464的改进版,集成了64KB一级指令cache,64KB一级数据cache,256KB二级cache和4MB三级cache。特别需要指出的是,GS464E处理器核的stream性能有了大幅提升,单核STREAM性能达到6.3GB/s,是龙芯3A1000的20倍。流水线从GS464的9级提高到了12级。峰值浮点性能16GFlops。
在接口上,龙芯3A200集成了两个HT3.0接口,PCI控制器、LPC、SPI、UART、GPIO,72位DDR2/3-1333×2控制器。
龙芯3A200A▲
龙芯3A2000B▲
GS464E微结构图▲