首頁
業界資訊
技術文庫
視頻課程
資源下載
講座及會議
RFbuy射頻商城
射頻問問
在線工具
周刊
行業大全

技術

熱門搜索：有源天線 ADS 射頻電路功率放大器 ansoft HFSS 藍牙技術波導

雷達數字信號處理解決方案

2018-07-10 來源：微波射頻網作者：杭州加速云字號：大中小

1、背景

數字信號處理是現代通信、雷達和電子對抗設備的重要組成部分。在實際應用中，利用數字信號處理技術對接收數據進行處理，不僅可以實現高精準的目標定位和目標跟蹤，還能夠將目標識別、目標成像、精確制導、電子對抗等功能進行拓展，實現多種業務的一體化集成。

在現代雷達系統中，隨著有源相控陣和數字波束形成（DBF）技術的廣泛應用，接收前端存在大量的數據需要并行處理，并需要保證高性能和低延遲的特點。雷達日益復雜的應用環境，讓雷達系統具備自適應于探測目標和環境的能力，數字信號處理部分也需要使用多種更加復雜的算法，并且可以做到算法模塊化，以及通過軟件配置功能模塊的參數，實現軟件定義的功能。更大的數據處理帶寬能夠使雷達獲得更高的分辨率，更高的工作頻率使得雷達可以小型化，能夠在更小的平臺上安裝，這樣對于硬件平臺實現也有低功耗的要求。

在電子對抗設備中，可以在最短的時間內對多個威脅目標進行快速分析和響應，同樣需要數字信號處理的相關算法具備高實時，高動態范圍和自適應的特點。如何在寬頻噪聲的環境中尋找到目標的特征數據，如何在寬帶范圍內制造虛假目標實現全覆蓋，數字信號的處理性能是至關重要的設計因素。

加速云的SC-OPS和SC-VPX產品，針對5G通信和雷達的數字信號處理的要求，結合Intel最新14nm工藝的Stratix10 FPGA系列，提供了一套完整的硬件和軟件相結合的解決方案。SC-OPS產品作為單獨的硬件加速卡，通過PCIe插卡的方式實現與主機的通信功能，還可以通過多卡級聯的方式實現數字信號的分布式處理方案。SC-VPX產品是由FPGA業務單板、主控板和機箱組成的VPX系統。借助于FPGA可編程的特性，加速云提供了高性能數學加速庫FBLAS和FFT的RTL級IP，具有高性能和算法參數可配置的特點實現了多重信號分類（MUSIC）和自適應數字波束形成（ADBF）的核心算法，提高了5G通信和雷達在對抗干擾方面的性能。為了方便客戶使用高層語言開發，加速云提供基于FPGA完整的OpenCL異構開發環境，快速實現用戶自定義的信號處理加速方案。

圖1、加速云SC-OPS和SC-VPX產品

2、方案組成

2.1 基于SC-OPS產品的系統架構圖

圖2、SC-OPS產品系統框圖

基于SC-OPS產品的系統分別由硬件資源層，算法實現層和應用層三部分組成。

SC-OPS加速卡作為主要的硬件平臺，采用IntelStratix10 GX2800 FPGA器件，集成2753KLE資源和9.2TFLOPS單精度浮點計算能力。單板支持2個40/100G光口或電口，支持板間通信以及設備間級聯。板卡支持8個DDR4-2400MHz 72bits位寬的內存通道（ES支持2133MHz），以及PCIeGen3 16Lane的主處理器通信接口。

通過在主機內插入一張或多張SC-OPS加速卡的形式，可以實現不同性能的硬件集成。以一機八卡服務器為例，整機具備73.6TFLOPS的單精度浮點計算能力，并具有納秒級低延時特性，可應用于高性能的數字信號處理的解決方案。加速云在算法實現層提供了基于FPGA邏輯實現的高性能數學加速庫FBLAS，FFT，MUSIC和ADBF核心算法，以上功能模塊都是以IP形式提供，并提供相應的API接口函數，通過PCIe接口實現在應用層的調用,從而可以搭建軟件定義雷達系統，實現超高性能高靈活的雷達仿真平臺。對于更加關注于自定義算法實現的用戶來說，加速云還可以支持面向OpenCL的FPGA異構平臺開發環境，提供了SC-OPS板卡對應的BSP，用戶只需要自行編寫OpenCL Kernel和Host程序，即可以快速的實現相關算法的二次開發。

2.2 基于SC-VPX產品的系統架構圖

圖3、SC-VPX產品系統框圖

基于SC-VPX產品的系統，與SC-OPS相比，區別在于硬件平臺實現。SC-VPX系統由5塊FPGA業務單板，1塊X86主控板和6U標準VPX機箱組成。其中FPGA業務單板采用板載XEON-DX86主控和1~2片Stratix10 GX2800 FPGA器件的方案，集成2753K*2 LE資源和9.2 *2 TFLOPS單精度浮點計算能力。每片FPGA支持4個DDR4-2400MHz 72bits位寬的內存通道。前面板支持8個17.5Gbps光口，背板提供32個10.3125Gbps的高速接口，支持業務單板之間的全mesh高速互聯網絡，X86主控板與業務單板之間采用PCIe和GE的雙控通信方案。

用戶可以選擇加速云提供的主控板和多塊FPGA業務單板，整機最高可以支持92TFLOPS單精度浮點處理能力，配合相關算法IP，實現多種數字信號處理的算法或者分布式實現大容量數據處理的算法。由于SC-VPX整套系統都是符合OpenVPX的標準，用戶可以添加其他各種功能板卡，包括AD/DA板、RapidIO交換板、存儲板等，結合加速云的主控板和FPGA業務單板，組建成一套完整的信號接收處理雷達系統，無論是應用于相關產品還是科研，都可以幫助用戶實現系統級的解決方案。

3、系統優勢

3.1優異的能效比

能效比是評估數字信號處理時一個關鍵的指標，即GFLOPS per Watt。表1中羅列了各類設備平臺的數字信號處理能力的能效比，加速云采用IntelStratix10 FPGA的方案具備最優的能效比。

類型	系列	單精度浮點運算能力	功耗	能效比
FPGA	IntelStratix10	9.2TFLOPS	120W	76.6 GFLOPS/W
FPGA	IntelArria10	1.5TFLOPS	30W	50 GFLOPS/W
DSP	TITMS320C6678	160GFLOPS	15W	10.6 GFLOPS/W
GPU	NVIDIA Tesla P40	12T FLOPS	250W	48 GFLOPS/W
CPU	至強12核（IntelXEONE5-2697）	219GFLOPS	130W	1.68 GFLOPS/W

表1、各平臺數字信號處理能力效能比的對比

3.2 FPGA IO靈活可編程

FPGA最大的特點在于IO可編程，可以提供各種高速和低速IO的協議標準，匹配用戶實現多樣系統互聯的要求。比如SC-OPS板卡的2個高速互聯接口，分別可以配置為40GE，100GE或SRIO的標準。SC-VPX FPGA業務單板的背板提供32個10.3125Gbps的高速接口支持與背板間的全mesh網絡接口，分別可以配置為10GE，40GE或SRIO的標準。

3.3高性能的算法IP

加速云基于FPGA平臺上提供了數字信號處理相關算法的IP，IP的性能決定了數字信號處理系統的性能，包括動態范圍，信號損耗，信噪比，延時等因素。

以信號處理中常用的FFT傅里葉變換為例，相比最新的DSP平臺，加速云提供的RTL級IP，使用FPGA符合IEEE 754標準的單精度浮點數字信號處理（DSP）單元，可以實現更低的計算時間。

FFTSize	PerformanceofComputingFFT (time, ms) using TMS320C6678
FFTSize	1 core	2 cores	4 cores	8 cores
16K	0.473	0.261	0.159	0.131
FFT Size	Performance of Computing FFT (time, ms) using FPGA
FFT Size	1 PE	2 PEs	4 PEs	8 PEs
16K	0.16	0.04	0.01	0.003

表2、DSP和FPGA平臺實現FFT算法的計算時間對比

以下是加速云提供的基于FPGA實現高性能數學加速庫FBLAS的相關性能。可以看出，借助FPGA天然的并行處理的優勢，加速云提供的算法IP，可以幫助用戶實現數字信號處理系統的快速優化，極大縮短了用戶產品Time-to-Market的時間。

算法名稱	參數	數據格式	處理性能
矩陣求逆	144*144維復數	FP32	120us
矩陣求逆	72*72維復數	FP32	53.6us
矩陣求逆	24*24維復數	FP32	10.32us
矩陣求逆	12*12維復數	FP32	3.76us
矩陣QR分解	64*64維復數	FP32	46.41us
矩陣QR分解	16*16維復數	FP32	4.99us
矩陣QR分解	8*8維復數	FP32	2.5us
特征值分解（基于QR分解，16次迭代）	64*64維復數	FP32	5200us
特征值分解（基于QR分解，16次迭代）	16*16維復數	FP32	150us
特征值分解（基于QR分解，16次迭代）	8*8維復數	FP32	65us
協方差矩陣（快拍數K=256,通道數N=8）	8維復向量	FP32	30us
協方差矩陣（快拍數K=256,通道數N=16）	16維復向量	FP32	60us
協方差矩陣（快拍數K=256,通道數N=64）	64維復向量	FP32	128us
線性方程求解	200維	FP64	420us

表3、FPGA實現高性能數學加速庫FBLAS性能示例

3.4完整的OpenCL異構開發環境

加速云SC-OPS和SC-VPX產品都可以支持面向OpenCL的FPGA異構平臺開發環境，提供全面的數學庫支持，解決了傳統FPGA遇到的時序收斂、DDR存儲器管理以及PCIe主處理器接口等難題。另外加速云也支持將高性能算法IP作為定制化組件，與OpenCLKernel集成在一起，提供靈活的算法配置解決方案。

4、應用案例

4.1多重信號分類（MUSIC）

MUSIC算法是經典的空間譜估計算法，實現波達方向估計（DOA）的相關應用。在電子偵察和電子對抗等對實時性要求嚴格的領域中，如何選用合適的平臺實現并滿足系統的響應處理速度，成為了設計者頗為頭疼的問題。整個MUSIC算法計算復雜度和靈活度都很大，而且電子對抗系統都有浮點處理的要求，所以大多用戶會采用DSP處理器的方案，處理時間停留在ms量級。加速云采用Intel集成全新浮點計算單元的FPGA，全硬件實現了基于MUSIC算法的空間譜估計DOA全部算法（MUSIC算法是基于加速云高性能數學加速庫FBLAS搭建的，所有組成IP都可以單獨調用）。相比DSP處理器，極大提升了MUSIC算法的實時性，超過10倍以上的性能改進。

圖4、FPGA實現MUSIC算法的處理流程

MUSIC算法實現的相關性能如下：

· 特征值和特征向量的數值相對Matlab中EIG函數計算結果的偏差均小于10-5
· 算法實現以單精度浮點為主，結合部分雙精度浮點
· 全部處理時間<120us（TI6678的處理時間是ms級）

4.2自適應數字波束形成（ADBF）

隨著有源相控陣雷達的廣泛應用，如何有效增強期望信號和抑制無用信號，也是設計者需要考慮的問題。ADBF技術利用天線陣元的采樣數據，自適應更新信號的權值，使陣列天線形成特定的期望形狀。由于天線陣元通道數量大，需要實現海量數據的計算，相關平臺實現必須具有高集成度、高數據吞吐率和高數據并行計算的特點。

圖5、DBF原理示意圖

加速云借助高性能數學加速庫FBLAS，通過高維數的矩陣求逆的算法，完全在FPGA內實現了ADBF的算法。

ADBF算法實現的相關性能如下：

方位維天線方向圖俯仰維天線方向圖

算法名稱	數據格式	性能指標（單拍）	性能指標（連續）	功耗
方位維運算	FP32	455us	245us	30W
俯仰維運算	FP32	335us	148us	30W

5、結論

通過參與了國內眾多實際雷達數字信號處理相關產品或是科研的研發和技術合作，加速云累計了大量的經驗，在此基礎上推出的SC-OPS和SC-VPX產品及高性能數學加速庫FBLAS、多重信號分類（MUSIC）、自適應數字波束形成（ADBF）等IP庫，可以幫助用戶實現系統級的解決方案。通過持續推出高密度高性能硬件平臺，高性能RTL級加速IP，配合高性能分布式軟件搭建高性能、低延時靈活配置的軟件定義平臺，推動了雷達和電子對抗設備向更先進設備的演變。

主題閱讀：雷達

繼續閱讀：

RFTOP推出全系列波導同軸轉換器及高效選型工具

國內首個！中國電科高分辨多頻段全極化探蟲雷達守護國家糧食安全

羅德與施瓦茨JCAS參考測試裝置獲得GTI移動技術創新突破獎

貿澤電子開售Texas Instruments AWR1843AOP汽車雷達傳感器

使用低功耗60GHz毫米波雷達傳感器滿足Euro NCAP兒童存在檢測要求

毛片视频免费观看-毛片视频在线免费观看-毛片手机在线视频免费观看-毛片特级-中文亚洲字幕-中文一级片

技術

雷達數字信號處理解決方案