账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
应用FPGA实现高速WiMAX MAC层技术
 

【作者: 林威志、鄭凱方】2008年12月04日 星期四

浏览人次:【5080】

前言

现行国际无线标准大致以欧规和美规为主,依据不同的传输距离标准分为PAN(Personal Area Network)、LAN(Local Area Network)、MAN(Metropolitan Area Network)及WAN(Wide Area Network)。新推出标准已不约而同朝向高宽带和高速传输趋势发展,例如IUT所颁定的4G无线技术,数据传输速率在静止时必须达到1Gbps,高速移动下也要有100Mbps的表现。


高速数据传输速率应用日益普及,连带促使通讯协议第二层中的媒体撷取层(MAC)在单位时间必须处理的数据位数将大幅增加。此外,无线技术快速接取Internet,包括语音、数据和多媒体服务蓬勃发展,当混合各种需求的服务在一个高速无线通信产品时,MAC也需要在特性时变的无线实体信道下,兼顾不同服务质量要求的同时,也能提供上层更多的服务流容量。


因此,在成本效益、上市时程及市场竞争力的考虑下,建立系统性的无线宽带MAC实现方法和早期效能评估工作的技能,在迈向高速无线宽带阶段益显重要。


FPGA之WiMAX参考设计

因应标准变化提升硬件设计灵活度

行动宽带接取服务因市场需求发展而备受瞩目,特别是在于IEEE 802.16、亦即WiMAX的系列标准,其中802.16e-2005(亦即行动WiMAX标准)可视为台湾网通产业极佳的跳板与契机,可藉此让台湾从外围设备的制造产业位置,逐渐迈入核心设备(Infrastructure Equipment)的制造行列。


与此同时,下一波的WiMAX技术IEEE 802.16j及IEEE 802.16m标准也正如火如荼地制订中。为避免因标准变化所带来的项目失败风险,在开发WiMAX产品时,兼容的硬件灵活性和重组硬件结构的能力,就显得非常重要。


WiMAX FPGA参考设计要点

@内文;设计无线宽带系统时,其最严峻的挑战是厘清哪些任务应当由处理器上的软件执行、以及哪些任务该由特定硬件功能来完成。因此,采用处理器搭配FPGA的架构,则成为产品极佳的解决方案。目前FPGA厂商为抢占WiMAX无线宽带接取服务市场,也陆续推出FPGA架构的WiMAX参考设计方案。


Xilinx设计方案大要

Virtex-4系列设计平台

Xilinx针对WiMAX应用领域的FPGA架构,分别推出Virtex-4以及Spartan3E系列。其中Virtex-4系列就有包括3个设计平台:Virtex-4 LX支持逻辑处理;Virtex-4 SX支持讯号处理;Virtex-4 FX加入了支持嵌入型处理与高速序列链接的架构。


Xilinx平台提供各种共通的FPGA功能与不同的核心功能组合,例如逻辑、内存、平行、序列I/O等。


除共通功能外,Virtex-4 FPGA具有不同种类的嵌入式处理器、DSP功能、改良型频率管理、Hard IP Core、混合讯号以及其它功能区块等核心功能组合,以支持不同种类应用的特定需求。Xilinx主要把Virtex-4系列的内部功能加以运用在无线通信系统上,如图一所示,用以实现诸如DUC、CFR、DPD、RACH、Searcher、OFDM PHY、TCC及MIMO等不同的功能。


另外Virtex-4 FX内建的嵌入型处理器,就已经内含有一组短延迟时间协处理器接口埠(APU),用户可以利用这个接口埠,将自己定义的指令整合到软件程序代码中,再透过运行这些自有指令改变整个逻辑结构,不但可紧密配合软硬件,也简化架构划分过程。



《图一 Virtex-4应用在无线通信上的硬件区块示意图》
《图一 Virtex-4应用在无线通信上的硬件区块示意图》

Spartan-3E解决方案

除了高阶的Virtex-4系列外,Spartan-3E解决方案则针对低成本的市场需求,并与宽带无线芯片半导体开发商Wavesat共同推出16d Fixed WiMAX mini-PCI接口设计,如图二所示。在此Spartan-3E FPGA被运用于实现主要系统性功能,包括Lower Layer MAC部份以及PCI接口。


《图二 Xilinx与Wavesat共同推出之16d Fixed WiMAX mini-PCI接口参考设计》
《图二 Xilinx与Wavesat共同推出之16d Fixed WiMAX mini-PCI接口参考设计》

WiMAX FEC IP Pack

如图三所示,对于WiMAX系统中基频部份所必须要使用的前向纠错(FEC),Xilinx也推出Virtex-4和Spartan-3 FPGA系列均可支持的IP Pack,利用Virtex-4和Spartan-3E内部的数字信号处理(DSP)区块功能来实现这些FEC功能。



《图三 WiMAX系统架构示意图》
《图三 WiMAX系统架构示意图》

WiMAX FEC IP Pack包括有下列几项:


  • ●Convolution Turbo Code Encoder/Decoder(CTC);


  • ●Convolution(Viterbi)Codec Encoder/Decoder


  • ●Reed-Solomon Encoder/Decoder


  • ●Turbo Product Code(TPC)Encoder/Decoder



FPGA能否处理整个MAC?

对于WiMAX系统设计,WiMAX采用处理器搭配FPGA已是现有趋势,但是在FPGA里,目前技术上也只处理到Lower Layer MAC阶段,到底该实现WiMAX MAC中的那一部份,是否能把MAC中其它的部份挪出,进一步能够分散处理器负担的此项关键技术,将会大大地影响之后WiMAX的系统设计趋势。


WiMAX MAC解决方案

Processor与硬件加速器界线日益模糊

对无线宽带MAC层而言,传统上会由处理器搭配特定的硬件电路来完成实现,此特定硬件电路俗称为Lower Layer MAC。一般而言,对于Time-critical、或是计算固定但需要大量数据处理的部分,会交由硬件来加速完成。另一方面,Time-insensitive或需要复杂计算的处理,才会交由Processor来完成。然而对越来越讲求高速的MAC而言,此一界线将变得越来越模糊,因为需要复杂计算处理的部分,也有很高机率会受到Time-critical的限制。此外,Processor与硬件加速器之间的I/O和内存带宽,也会产生重大的影响。


提升硬件执行效能

以资策会开发IEEE 802.16e WiMAX基地台MAC软件的经验为例,在CPU为IXP-465@667 MHz的硬件环境下,当系统中有两个MSs时,会需要约250 MIPS的计算量,同时增加第三个MS将会再需要50MIPS。过去的研究显示,随着MS数量的增加,对系统资源的消耗将会呈指数性的成长,因此预估在这样的平台上,能同时支持的Active用户容量将低于10。


用FPGA减少处理器运算量

若使用FPGA来实现部分Time-critical或复杂运算的工作时,将可有效减少处理器所需的运算量。因此在相同的用户数量下,系统可以使用较低阶的处理器而降低成本;或者在使用相同处理器的情况下,允许系统容忍更多的用户。下表为在纯软件实现下,VoIP应用的用户容量预估,其中预估参数为5ms WiMAX frame;Per user有4条WiMAX MAC connections;20ms VoIP frame。


(表一) VoIP用户容量预估表

 

Concurrent active users per frame

Concurrent active VOIP users (20% headroom)

Concurrent active data connections

Number of users

< 10

< 32 (= 10*4*80%)

< 32*4 = 128


对WiMAX MAC进行软硬件切割

以过去的开发经验为基础,针对WiMAX MAC进行软硬件切割,以期优化执行效率并得以增加用户容量,就是一个在增加最低的成本下所能够得到的较佳结果。依据资策会所实现的IEEE 802.16e Mobile WiMAX MAC软件雏形,除了Checksum、CID filter、Encrypt/decrypt等习知Lower Layer MAC之外,对于有关「MAC数据排程与决策」及「MAP实时处理」等技术议题,也进行硬件加速之技术。


MAC数据排程与决策

@小标高速数据排程算法课题


当考虑无线信道特性时,如何实现高速数据传送排程算法的设计,非常关键。理论上来说,可藉由过去的无线信道量测结果及预测技术,先针对接下来要传送的数据,做最佳的Channel Rate Assignment后,再对所要传送的数据进行不同准则的排程计算。然而随着Data Burst的长度缩短以及支持服务流数目增加,上述程序如何在相当短的时间内完成便显得困难。


另外,一个完整的排程器需考虑诸多系统参数:


  • ●每一WiMAX Frame的DL/UL 比例;


  • ●每一联机服务质量QoS参数;


  • ●封装(Encapsulation)所产生如表头、子表头与检查码之Overheads;


  • ●系统广播(如UL/DL MAP、DCD/UCD)之Overheads;


  • ●每一用户对各子载波信道特性进行带宽配置(Channel conditions);


  • ●目前用户与联机上行与下行Non-HARQ与 HARQ带宽需求;


  • ●用户所需上行回馈信道(如HARQ ACK channel、CQICH与Feedback channels);


  • ●重送HARQ与ARQ带宽需求;


  • ●每一联机与进入睡眠模式的用户省电参数(如Listen/Active周期与时间);


  • ●呼叫(Paging)进入待机模式的用户所需带宽;


  • ●每一进入换手模式的用户所需带宽;


  • ●周期性调距与带宽需求之带宽;


  • ●多点跳跃带宽配置与路由选择。



考虑上述复杂参数与参数交互影响之关联性(如MAPs与Normal data burst 个数),可预见排程器对宽带无线网络带宽配置之复杂性与重要性, 特别是如何处理大量的联机数目与对抗高速移动所造成无线信道快速变化。


革新MAC数据基因排程算法

在MAC数据排程算法上可使用基因算法来做排程。一般软件的基因法排程是选染色体,交配后突变经筛选后成为子代,然后子代再做交配、突变筛选变为孙代,这样代代筛选,寻找适应环境的后代,不过这需要花费许久时间,无法满足实时处理需求。


这时若使用硬件同时并进及Pipeline的原理,可变化基因算法,亦即不是以下一代配同代,而是跨世代交配以子代回头与父代交配产生好的染色体,如此便可迅速选择到适应环境的下一代,此方法便需要使用硬件支持。尔后再将排程好的基因排程,使用Merge算法改变调变方式,并利用可靠低速的调变,减少重传,加上排程压缩将减少讯框数量,大幅度提升整体效率。


MAP的实时处理

从WiMAX Frame Structure来看,在一个Frame中带有DL-MAP与UL-MAP等WiMAX MAC管理讯息。DL-MAP带有为描述这个Frame中整个下传区间的资源分配信息;UL-MAP则描述着这个Frame或下一个Frame的上传区间的资源分配。解读这些MAP都需要实时处理,尤其是DL-MAP,必须在收到的同一个5ms Frame完成解读,并对下层PHY进行相关设定。


MAP的格式因为所带IE(Information Element)在数量上和种类的不同,变得不容易完全由硬件解释。因此设计上可采部份IE由硬件负责其功能,部份由软件判断后操作。以DL-MAP而言,接取模式的IE就可以硬件判断直接控制PHY的接取,将所需读取的数据以适当的接收模式接收。而其它延伸IE,可由硬件作初步处理后,交由软件进行后续处理并执行相对应的程序。以UL-MAP而言,透过硬件加速器辅助,可减少过多的讯息传递给处理器,因此有助于提升整体传输排程的处理时间。


使用FPGA实现WiMAX MAC

FPGA处理MAC的好处

通常使用软件方式完成所有MAC高速数据传输功能,包含格式排程与封装处理、Policy决策处理等,是一个极高的技术挑战。由于FPGA具有可编程重组电路功能结构的特性,能够同时并行执行不同的功能的结构,因此透过硬件FPGA来加速部分具时效性之MAC功能,预期可获得优化之处理速度,这将会是既符合经济效益且具有一定技术弹性之可行方法。



《图四 WiMAX MAC Data Plane硬件架构示意图》
《图四 WiMAX MAC Data Plane硬件架构示意图》

优化处理无线宽带MAC

在无线宽带MAC中有许多优化议题,软件能处理的部分有其局限瓶颈,因此对于Time-critical与大量数据处理部份,如果单纯利用软件来执行,系


统可能无法实时反应而造成整体效能低落。


Data Plane适合由FPGA执行

MAC大致上来说分为Control Plane及Data Plane,Control Plane负责同步、入网、联机建立及维护等功能,这些功能涉及很多Peer Message交换,需要较高的智能以及弹性,较不适合由FPGA来执行。相对地,Data Plane较为规律,适合由FPGA执行。


以图四来说,Data Plane可分成Classification、Scheduling以及PDU Construction三个模块。Classification将Ethernet封包做分类,并将其存在Queue里;Scheduler配合着一些输入参数,经过计算后决定每个Frame该送出多少数据出去,再将这些数据组装成MAC PDU送往PHY层。以FPGA的特性,相当适合Data Plane的任务,处理这些封包分类、排程及PDU组装等功能。若能进一步将Data Plane硬件化,将可有效提升MAC效能并分摊CPU计算资源。



《图五 高速WiMAX MAC系统架构示意图》
《图五 高速WiMAX MAC系统架构示意图》

用FPGA检查分类PDU

高速WiMAX MAC系统架构图如图五所示。当PHY把MAC PDU解出来同时,利用FPGA对PDU做Checksum检查、分类等动作,并将带有MAP信息的PDU给独立出来,进行无线资源分配的信息解析。如此不必再经由CPU,可直接将MAP信息回授给PHY控制,也可直接丢给Scheduler计算,来决定下个Frame的数据传输。CPU资源可释放出来处理其他部分,不必负责整个MAC的运作过程。


FPGA开发提升竞争力

在越来越高速的无线通信产品开发上,藉由FPGA平台实现高速WiMAX MAC技术,可以RTL code或 Soft IP的型式展现,这便能移植在任何厂牌的FPGA工具中。在一定的成本效益考虑下,藉由硬件协助达到整体的优化效能及降低成本,将是一个非常重要的技术竞争力考虑。


资策会开发高速WiMAX MAC成果

资策会在实现高速WiMAX MAC开发时,进程规划主要分为四个阶段进行,包括:WiMAX MAC软硬件系统分析、软硬件共同设计和除错平台建置、WiMAX MAC模块硬件化、以及WiMAX MAC软硬件系统整合等。


《图六 FPGA软硬件协同开发进程示意图》
《图六 FPGA软硬件协同开发进程示意图》

进行软硬件协同设计的解决方法可分为软硬件分割评估、硬件模块建立、及系统整合测试等三步骤来进行。


软硬件分割评估

针对WiMAX MAC Data Plane、MAC数据排程与决策以及MAP实时处理的部分,细分规划其功能与任务,独立出功能方块,分析与评估这些独立的功能方块,利用初期分析的报告或是系统级描述语言的辅助,进行系统级的仿真与验证,建立起一套效能评估的方法与准则,制订基础系统的雏形。


硬件模块建立

在完成软硬件分割的评估之后,利用硬件描述语言Verilog或VHDL来实现要达成硬件加速的部分,并建立设计Test Bench环境,透过Test Bench来验证及分析效能。


系统整合测试

完成硬件模块建立并经过电路合成后,便实际下载至FPGA上进行验证,接着将透过外部CPU或是内建Soft CPU发送数据,监测硬件模块处理数据的情形、以及整个系统软硬件分工的状况,验证硬件加速模块的功能。


分割评估软硬件以及建立硬件模块可并行处理,因为当建立硬件模块建立的同时,也会产生一些软硬件分割评估的参考数据,例如硬件实现功能方块模块所需的时间、以及其所占的资源等等;而在分割评估软硬件的同时,也将决定硬件模块的接口与功能。


结语

分割评估软硬件以及建立硬件模块可并行处理,因为当建立硬件模块建立的同时,也会产生一些软硬件分割评估的参考数据,例如硬件实现功能方块模块所需的时间、以及其所占的资源等等;而在分割评估软硬件的同时,也将决定硬件模块的接口与功能。


开发高速传输速率的无线通信产品,在一定的成本效益考虑下,藉由硬件协助达到整体的优化效能及降低成本,将是非常重要的技术竞争力。由于FPGA具有可编程重组电路功能结构,且具有可同时并行执行特定功能结构的特点,可根据市场需求变化轻易更新系统。FPGA所开发的系统及其更新,可确保产品的兼容性及稳固其他通讯协议的支持;在进行故障修复和改进时,也可容易更新。


此外,FPGA可支持4G阶段这种在早期设备实施阶段还不确定的标准和应用,达到早期效能评估需求,避免产品早期开发的风险。


(作者林威志为资策会WiMAX技术中心/经理,E-mail:wjlin@iii.org.tw


相关文章
借助自行调适加速平台 机器人快速适应环境变化
借助自行调适系统模组 加速边缘创新
借助Zynq RFSoC DFE因应5G大规模部署挑战
半导体创新成果转化 AI运算世界加速来临
CXL、CCIX和SmartNIC助力 PCIe 5加速飞奔
comments powered by Disqus
相关讨论
  相关新闻
» 格斯科技携手生态系夥伴产学合作 推出油电转纯电示范车
» 资策会与远传电信叁与3GPP国际资安标准 共创下世代通讯应用与打造资安韧性
» Arm:因应AI永无止尽的能源需求 推动AI资料中心工作负载
» 英特尔晶圆代工完成商用高数值孔径极紫外光微影设备组装
» 联发科技签署绿电合约 大步迈向净零里程碑


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84NDYY14OSTACUKX
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw