TMS320TCI6618中FFTC协处理器在LTE中的应用

2017-03-31 01:23
单片机与嵌入式系统应用 2017年3期
关键词:基带寄存器队列

鲁 豪

(重庆邮电大学 通信与信息工程学院,重庆 400065)

TMS320TCI6618中FFTC协处理器在LTE中的应用

鲁 豪

(重庆邮电大学 通信与信息工程学院,重庆 400065)

采用DSP进行数字基带处理的基站以及软件无线电面临着严峻的考验,鉴于此,德州仪器公司(TI)推出了TMS320TCI6618 DSP,其中快速傅里叶变换协处理器(FFTC)将大幅度提升基带处理的性能。FFTC是一个可编程的加速器,专门针对LTE系统中的FFT与IFFT变换,本文详细介绍了其在LTE系统中的应用和DSP多核并行化处理,最后根据实测数据对FFTC协处理器的性能进行了评估。

TMS320TCI6618;FFTC;DSP;LET;并行化

引 言

随着通信标准的不断演进,LTE/LTE-A[1]标准已经成功商用,LTE/LTE-A通信系统在大幅度提升基带传输速率的同时,也给底层硬件的处理性能带来了挑战,对于一些采用DSP进行基带处理的软基站、小型基站和软件无线电[2],DSP的处理性能将成为制约系统的一个重要因素,鉴于此,著名的DSP制造厂商德州仪器公司(TI)推出了一款TMS320TCI6618多核DSP[3]。该DSP共有4个核心,支撑浮点和定点的运算,最高主频为1.2 GHz。此外TI公司根据不同的通信系统设计了满足各个通信设备需求的相关协处理器,如A bit rate coprocessor(BCP)、The Turbo-Decoder Coprocessor 3(TCP3d)、The Turbo-Encoder Coprocessor 3(TCP3e)、The fast Fourier transform coprocessor(FFTC)等。本文设计的就是FFTC在LTE系统中的应用。

快速傅里叶变换协处理器(FFTC)[4]用以辅助DSP完成LTE系统中OFDM与SC-FDMA符号的处理,从而提升了基带处理数据的效率,减轻了DSP的负担,支持任何系统的FFT与IFFT算法。本文主要研究FFTC在LTE上行发送端的SC-FDMA符号多核并行化处理[5]。由于DSP自身的实现原理,传统上利用汇编或者C语言进行编程以实现物理层信道的处理将耗费大量的指令周期,随着数据量的增加,处理的时延会随之上升。特别是LTE物理层中FFT与IFFT变换复杂度很高,尽管对一些算法进行了优化,也很难通过软件的方式达到LTE时延的要求。通过硬件处理的方式,FFTC很好地解决了性能方面的问题。FFTC处理器可以处理LTE系统中SC-FDMA符号和OFDM符号处理,其中包括去(添加)CP、频偏、FFT和IFFT变换[6]。本文对上行和下行处理进行了阐述,介绍了FFTC处理器结构,详细说明了FFTC在基站上行和下行中的物理层信道处理流程,分析了FFTC对基带数据处理的性能提升。

1 FFTC处理器的架构与配置

1.1 FFTC处理器硬件架构

图1显示了FFTC的内部结构以及与外部的接口构成。FFTC处理器内部由各个功能模块、FFTC数据交换机,以及与外部进行数据交换的Packet DMA模块构成。

图1 FFTC模块结构图

ConfigurationRegisters、FFT Engine、Packet DMA、FFTC Streaming Interface、FFTC Scheduler构成FFTC模块。FFTC处理器通过FFTC Streaming Interface与Packet DMA相连,来传输数据到FFT Engine中进行FFT与IFFT变换,其中FFTC Engine配置包含了循环前缀的添加与去除、输入输出比例因子等寄存器。FFTC Engine通过频分与混合基快速算法实现FFT与IFFT的快速变换。FFTC的配置在后面会作详细介绍。FFTC可以与内核、AIF、多核导航相连,可以接收来自它们传输过来的数据包,根据解析出的描述符得到FFTC的数据。

1.2 FFTC 配置

FFTC的配置主要分为FFTC Register的配置和Packet DMA的TX与RX流的配置。其中FFTC Register的配置主要是对FFTC Engine的配置,Packet DMA的配置主要是对其中TX与RX队列的配置,决定了数据在FFTC中的传输。FFTC的配置流程如图2所示。

图2 FFTC的配置流程

FFTC Engine的主要配置包括数据scaling寄存器的配置,比例因子可以采用两种方式,一种是动态配置(1)和静态配置(0),如果采用动态配置,FFTC加速器会自动在做FFT变换时检测是否溢出,会每级右移防止数据溢出,最后需要手动调整输出数据的比例因子来进行放大。静态配置需要手动设计每级(总共7级,根据点数和级数的对照表来配置)比例因子来对数据进行放大和缩小,保证数据的可靠性和准确性。队列循环前缀寄存器配置主要是循环前缀的添加与删除。队列控制寄存器主要包括用来进行数据补零后的FFT计算。LTE频移寄存器用来针对频域与时域将FFT的DC分量移到频谱中心。在配置Packet DMA时,可以利用TI公司提供的一些API函数,对于TX队列与RX队列,需要根据FFTC寄存器的参数来配置。FFTC主要寄存器配置参数功能说明如表1所列。

表1 FFTC主要寄存器配置参数功能说明

2 FFTC在 LTE系统基带处理中的应用

FFTC可以处理LTE系统中基站的下行发送信道与上行接收信道,主要用来处理FFT与IFFT,下面以OFDM与SC-FDMA符号为例,来介绍FFTC在LTE基带中的应用。

图3 下行OFDM的处理流程

下行OFDM的处理流程如图3所示,接收端的SC-FDMA处理流程如图4所示。

图5 OFDM主从核并行设计处理

图4 接收端的SC-FDMA处理流程

FFTC在OFDM符号与SC-FDMA符号中的运用主要是FFT与IFFT变换的应用,下面以2 048点FFT与IFFT为例来讲解FFTC在LTE系统基带处理中的应用。OFDM与SC-FDMA符号中的CP的添加都可以在配置FFTC时进行处理,考虑到TMS320TCI6618有3个FFTC加速器,所以在DSP中能够同时处理多核符号的FFT与IFFT,其中多核并行采用IPC消息队列方案实现DSP内核间通信是基于内存共享的传输方式,每个DSP内核查询自己的MessageQ,从而获取通知消息达到多核并行,本工程案例均使用IPC进行多核并行。多核并行中采用主从核方式进行符号级并行计算,以14符号为例,其中核0为调度核,核1与核2为主要计算核,考虑到负载均衡和资源的分配,将14符号分为核0做4个符号计算,核1与核2每个核做5个符号计算。OFDM主从核并行设计处理如图5所示。

3 FFTC在LTE系统信道处理中的性能评估

为校验FFTC的性能,本工程都是与传统的C代码和汇编代码进行性能比对,对于数据的可靠性均采用MATLAB计算NMSE在-70 db以上。下面以2 048点FFT与1200点IDFT为例,对FFTC工程进行可靠性与运算速度的评估。2 048点FFT与MATLAB数据校验图如图6所示,1200点IDFT与MATLAB数据校验图如图7所示。

图6 2048点FFT与MATLAB数据校验图

图7 1200点IDFT与MATLAB数据校验图

本文对FFTC 128、256、512、1 024、2 048点FFT与1200、900点IDFT数据进行了MATLAB仿真结果分析,并将加速器的处理时间与TI提供的库函数与手写线性汇编(1200与900点IDFT)性能在CCS仿真平台作对比,发现提高明显,性能如表2所列。

表2 FFT与IFFT的现行汇编与FFTC性能对比表(效率:um)

由上表可知,当点数较小时,才有汇编的效率比FFTC加速器效率要高,当进行2 048大点数FFT与下行1200与900点IDFT时,FFTC加速器有明显优势,其性能明显高于汇编代码。考虑到DSP实现LTE基带处理的性能要求,FFTC在没有消耗CPU的情况下,明显提高了FFT与IFFT效率(其中2 048点FFT主要是下行20M带宽发送链路,1200点IDFT主要是上行20M带宽接收链路)。

结 语

[1] 林辉,焦慧颖.LTE-Advanced关键技术详解[M].北京:人民邮电出版社,2012.

[2] 贾欣,许希斌.软件无线电原理与技术[M].北京:人民邮电出版社,2010.

[3] Texas Instruments.TMS320C6618 Multicore Fixed and Floating-Point System-on-Chip,2012.

[4] Texas Instruments.TMS320C6618 KeyStone Architecture Fast Fourier Transform Coprocessor (FFTC) User Guide,2012.

[5] 周佩.基于多核DSP并行调度机制的实现[D].北京:中国科学院光电技术研究所,2012.

[6] 王萌,习勇.基于多核DSP的宽带OFDM波形的并行设计与实现[J].信息化研究,2015,41(3):32-34.

FFTC from TMS320TCI6618 Application on LTE

Lu Hao

(School of Information and Communication Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

Base stations and SDR with DSP processing baseband data are facing serious challenges.Texas Instrument has then brought up a product TMS320TCI6618 DSP.The fast Fourier transform coprocessor (FFTC) in this DSP can enhance enormously the performance of base station in baseband data processing.FFTC is a programmable peripheral,which supports FDD/TDD-LTE.The architecture and configuration of FFTC are introduced,and further,the application of FFTC in LTE system is introduced also.At the end of this article,a performance analysis is provided according to the tested data real-timely.

TMS320TCI6618;FFTC;DSP;LTE;parallelization

TN914.3

A

�士然

2016-11-08)

猜你喜欢
基带寄存器队列
Ag元素对Ni-7at.%W合金基带织构形成的影响
Lite寄存器模型的设计与实现
队列里的小秘密
基于多队列切换的SDN拥塞控制*
在队列里
丰田加速驶入自动驾驶队列
2014年LTE基带收益占蜂窝基带收益50%以上
数字基带系统的System View仿真设计
基于FPGA的WSN数字基带成形滤波器设计
高速数模转换器AD9779/AD9788的应用