采用此控制策略消除因片外的數據存取瓶頸而引起的DSP內核等待。DSP實時仿真表明,經這種流程優化,運動搜索部分運算時間下降了近1/3.另外,為進一步加快運動搜索的速度,對原搜索算法中的運動矢量預測進行改進。原搜索算法5個候選矢量的選擇僅利用物體運動的空間連續性。
在改進的運動矢量預測中,利用運動時間連續性增加1個候選矢量。根據運動慣性,前一幀中與當前幀當前塊位置相同的對應塊周圍有8個塊,沿著各自的運動矢量運動后與當前塊重合的可能性大。因此,選擇8個塊中運動后與當前塊重合最多的塊的運動矢量作為當前塊運動矢量的第6個候選矢量。經改進后,對foreman圖像序列測試統計,85%以上的塊搜索次數小于6次,即絕大多數塊會在6個候選矢量中找到最佳匹配,而不用進行菱形搜索,運算量大大減少。
匯編代碼優化Blackfin處理器具有強大的并行處理能力,一條32位長的乘加指令可以和2條16位長的算術指令或LOAD/STORE指令同時執行。這就可以在CPU對當前數據進行操作的同時,從存儲器中取出下次運算所需的操作數,以減少處理器內核的等待時間,提高內核資源的使用率。