èŠ‚ç‚¹æ–‡çŒ®

ç³»ç»ŸèŠ¯ç‰‡ä¸åª’ä½“å¢žå¼ºæ•°å—ä¿¡å·å¤„ç†å™¨æ ¸è®¾è®¡ç ”ç©¶

Research on Media Enhanced Digital Signal Processor Core Design for System-On-Chip

åˆ†é¡µä¸‹è½½
åˆ†ç« ä¸‹è½½
æ•´æœ¬ä¸‹è½½
åœ¨çº¿é˜…è¯»
ä¸æ”¯æŒè¿…é›·ç‰ä¸‹è½½å·¥å…·ï¼Œè¯·å–æ¶ˆåŠ é€Ÿå·¥å…·åŽä¸‹è½½ã€‚

ã€ä½œè€…ã€‘ æŽä¸œæ™“ï¼›

ã€ä½œè€…åŸºæœ¬ä¿¡æ¯ã€‘ æµ™æ±Ÿå¤§å¦ ï¼Œ é€šä¿¡ä¸Žä¿¡æ¯ç³»ç»Ÿï¼Œ 2004ï¼Œ åšå£«

ã€æ‘˜è¦ã€‘ åª’ä½“ç³»ç»ŸèŠ¯ç‰‡è®¾è®¡å¼€å‘ä¸çš„å…³é”®é—®é¢˜ï¼Œå°±æ˜¯å¦‚ä½•æœ€æœ‰æ•ˆåœ°åˆ©ç”¨ç¡…ç‰‡ä¸Šå¯ç”¨çš„ç¡¬ä»¶èµ„æºï¼Œæä¾›æ”¯æŒç›®æ ‡å¤šåª’ä½“åº”ç”¨çš„å•èŠ¯ç‰‡é«˜æ€§åŠ æ¯”è§£å†³æ–¹æ¡ˆã€‚åŸºäºŽæ€»çº¿äº’è¿žçš„ç”±ä¸€ä¸ªæˆ–å¤šä¸ªæŒ‡ä»¤é›†å¤„ç†å™¨æ ¸ã€ä¸€ä¸ªæˆ–å¤šä¸ªä¸“ç”¨ç¡¬ä»¶IPæ ¸ã€ä¸€ç‰‡æˆ–å¤šç‰‡ç‰‡ä¸Šå˜å‚¨å™¨æž„æˆçš„å¼‚è´¨ä½“ç³»ç»“æž„æˆä¸ºåª’ä½“ç³»ç»ŸèŠ¯ç‰‡çš„åˆç†é€‰æ‹©ã€‚åœ¨å›½å®¶863è®¡åˆ’çš„æ”¯æŒä¸‹ï¼Œæˆ‘ä»¬å¼€å±•äº†ç³»ç»ŸèŠ¯ç‰‡ä¸åª’ä½“å¢žå¼ºçš„æ•°å—ä¿¡å·å¤„ç†å™¨æ ¸çš„è®¾è®¡ç ”ç©¶ï¼Œæœ¬æ–‡ä½œä¸ºéƒ¨åˆ†æˆæžœï¼Œç€é‡æŽ¢è®¨äº†å¤„ç†å™¨æ ¸æŒ‡ä»¤é›†ç»“æž„çš„åª’ä½“å¤„ç†å¢žå¼ºã€å¤„ç†å™¨æ ¸å¾®ç»“æž„çš„è®¾è®¡å’Œä¼˜åŒ–ä»¥åŠç³»ç»Ÿæ€»çº¿è®¾è®¡å’Œåª’ä½“æ•°æ®æµè°ƒåº¦çš„é—®é¢˜ã€‚ åœ¨ç³»ç»ŸèŠ¯ç‰‡ä¸åª’ä½“æ•°å—ä¿¡å·å¤„ç†å™¨æ ¸çš„è®¾è®¡ä¸ï¼Œåœ¨åˆ†æžåª’ä½“å¤„ç†åº”ç”¨ç®—æ³•ç‰¹ç‚¹çš„åŸºç¡€ä¸Šï¼Œæœ¬æ–‡æå‡ºå¯¹MIPS-â… æŒ‡ä»¤ä½“ç³»ç›¸å…¼å®¹çš„åŸºæœ¬æŒ‡ä»¤é›†ç»“æž„è¿›è¡Œåª’ä½“å¢žå¼ºæ‰©å±•ï¼Œé€šè¿‡æ”¯æŒSIMDäºšå—å¹¶è¡Œæ“ä½œã€åª’ä½“ä¸“ç”¨æŒ‡ä»¤å’Œè¿ç®—ç»“æžœç‰¹æ®Šå¤„ç†ç‰å¢žå¼ºå•å‘å°„ç»“æž„å¤„ç†å™¨çš„åª’ä½“å¤„ç†æ€§èƒ½ï¼Œå€Ÿé‰´Intel MMXï¼SSEï¼SSE2åª’ä½“æ‰©å±•æŒ‡ä»¤é›†çš„æ€æƒ³ç”Ÿæˆåˆå§‹æŒ‡ä»¤åŠŸèƒ½é›†åˆï¼Œé€šè¿‡ä¸Žå¸¸ç”¨åª’ä½“å¤„ç†æ ¸å¿ƒç®—æ³•çš„äº’åŠ¨è¿›ä¸€æ¥ä¼˜åŒ–åª’ä½“æŒ‡ä»¤é›†ç»“æž„ï¼Œåˆ›æ–°æ€§åœ°å¯¹ä¸ŽMIPS-â… ç›¸å…¼å®¹çš„åŸºæœ¬æŒ‡ä»¤ä½“ç³»å®žçŽ°äº†åŽå‘å…¼å®¹åª’ä½“å¢žå¼ºæ‰©å±•ï¼Œåœ¨ç¡¬ä»¶ä¸Šé€šè¿‡æž„é€ å¯æ‹†åˆ†çš„æ•°æ®é€šé“ç‰å®žçŽ°äº†å¯¹åª’ä½“å¢žå¼ºæŒ‡ä»¤é›†çš„æ”¯æŒï¼Œä»¥æžå°çš„ç¡¬ä»¶é™„åŠ å¼€é”€èŽ·å¾—äº†åª’ä½“å¤„ç†æ€§èƒ½çš„æ˜¾è‘—æé«˜ã€‚ åœ¨ç³»ç»ŸèŠ¯ç‰‡ä¸åª’ä½“æ•°å—ä¿¡å·å¤„ç†å™¨æ ¸çš„è®¾è®¡ä¸ï¼Œåœ¨å…·ä½“åˆ†æžCPUæµæ°´çº¿ç«žäº‰å’Œå¤„ç†å™¨å¼‚å¸¸çš„åŸºç¡€ä¸Šï¼Œæœ¬æ–‡æå‡ºå¹¶å®žçŽ°äº†ä¸€ç§åŸºäºŽæœ‰é™çŠ¶æ€æœºçš„æµæ°´çº¿è¿è¡ŒæŽ§åˆ¶æ–¹æ¡ˆï¼Œå¹¶ä»Žæé«˜é’Ÿé¢‘å’Œé™ä½ŽCPIå€¼ä¸¤ä¸ªæ–¹é¢ä¼˜åŒ–å¤„ç†å™¨æ€§èƒ½ã€‚ä¸ºé¿å…æµæ°´æ—¶é’Ÿé¢‘çŽ‡å—åˆ¶äºŽæŸäº›å¤æ‚è¿ç®—æŒ‡ä»¤è¾ƒé•¿çš„è¿ç®—æ—¶é—´ï¼Œåˆè¦è¾¾åˆ°å•å‘¨æœŸå®Œæˆä¸€æ¡è¿ç®—æŒ‡ä»¤çš„åžåé‡æŒ‡æ ‡ï¼Œæœ¬æ–‡æå‡ºå¯¹EXçº§è¿›è¡Œå¯ä¼¸ç¼©è¶…æµæ°´æ‰©å±•çš„æ€æƒ³ï¼Œæå‡ºå¹¶å®žçŽ°äº†ä¸€ç§é«˜æ€§åŠ æ¯”çš„åˆ‡æ¢æŽ§åˆ¶æ–¹æ¡ˆã€‚å¯¹äºŽå•å‘å°„ç»“æž„çš„å¤„ç†å™¨ï¼Œé™ä½ŽCPIå€¼çš„æ ¹æœ¬é€”å¾„åœ¨äºŽé€šè¿‡å„ç§è½¯ç¡¬ä»¶æŠ€æœ¯å‡å°‘æµæ°´çº¿çš„åœé¡¿ï¼Œæœ¬æ–‡æž„é€ äº†ä¸€ä¸ªRAWç›¸å…³çŽ¯è·¯æ¨¡åž‹ç”¨äºŽåˆ†æžæµæ°´çº¿ä¸å¯„å˜å™¨æ“ä½œæ•°çš„RAWç«žäº‰çŽ°è±¡ï¼Œå¹¶æå‡ºäº†ä¸€ç§â€œåŠ¨æ€â€æ•°æ®æ—è·¯ä¼˜åŒ–ç–ç•¥ï¼Œå¯ä»¥æœ€å¤§ç¨‹åº¦åœ°å‡å°‘å¤æ‚æµæ°´çº¿ä¸å› æ•°æ®çš„RAWç«žäº‰è€Œå¯¼è‡´çš„äº’é”åœé¡¿ï¼Œç†è®ºåˆ†æžå’Œå®žæµ‹ç»“æžœå……åˆ†è¡¨æ˜Žâ€œåŠ¨æ€â€æ•°æ®æ—è·¯æœºæž„å¯ä»¥æœ‰æ•ˆåœ°é™ä½Žæµæ°´çº¿å› RAWäº’é”å¯¼è‡´çš„å¹³å‡CPIå¢žé‡ã€‚ æ€»çº¿è®¾è®¡å’Œåª’ä½“æ•°æ®æµçš„è°ƒåº¦æ˜¯å®žæ—¶åª’ä½“ç³»ç»ŸèŠ¯ç‰‡è®¾è®¡ä¸æžå…¶å…³é”®çš„é—®é¢˜ï¼Œæœ¬æ–‡ä»¥VCDã€HDTVè§£ç ç³»ç»ŸèŠ¯ç‰‡çš„è®¾è®¡ä¸ºå…·ä½“ä¸ªä¾‹ï¼ŒæŽ¢è®¨äº†MPEG-1ï¼2è§†é¢‘è§£ç è½¯ç¡¬ä»¶å®žçŽ°ä¸çš„æ•°æ®æµè°ƒåº¦ç–ç•¥ã€‚åœ¨åˆ†æžè§†é¢‘ç æµè¾“å…¥ã€è§£ç å¤„ç†å’Œè§†é¢‘æ˜¾ç¤ºçš„æ—¶é—´å‚æ•°åŽï¼Œæå‡ºä»¥3å¸§ç»„åˆä¸ºè½¯ä»¶è§£ç çš„è°ƒåº¦ç²’åº¦ï¼Œä»¥åŠåŸºäºŽå¯åŠ¨æœŸé™å’Œå®ŒæˆæœŸé™çš„ä¸¤ç§è§£ç è°ƒåº¦ç–ç•¥ï¼Œè¾ƒå¥½åœ°å‡è¡¡äº†å¤„ç†å™¨æ€§èƒ½éœ€æ±‚å’Œæ•°æ®ç¼“å˜éœ€æ±‚ã€‚æå‡ºäº†ä¸€ç§åŸºäºŽé™æ€åˆ†æ—¶å¤ç”¨è°ƒåº¦ï¼åŠ¨æ€å›ºå®šä¼˜å…ˆçº§ä»²è£çš„æ··åˆäºŒçº§æ€»çº¿ä»²è£ç–ç•¥ï¼Œé€šè¿‡åˆ†å‰²æ€»çº¿æ—¶é—´ç‰‡é™æ€è°ƒåº¦åª’ä½“æ•°æ®æµDMAä¼ è¾“ï¼Œä½¿ä¹‹ä¸Žè§£ç æµç¨‹åŒæ¥é…åˆï¼Œæœ‰æ•ˆåœ°åˆ†é…å’Œä½¿ç”¨æ€»çº¿å¸¦å®½ï¼Œé™ä½Žäº†ç‰‡ä¸Šæ•°æ®ç¼“å˜ç‰ç¡¬ä»¶å¼€é”€ã€‚æ›´å¤š è¿˜åŽŸ

ã€Abstractã€‘ How to utilize the available hardware resources on the silicon chip effectively is a key issue in high performance/cost media system-on-chip (SoC) development. A bus shared heterogeneous architecture consisting of one or more instruction set processor cores, one or more dedicated hardware IP cores and one or more on-chip memories usually provides a good solution. The research work introduced in this paper mainly concerns the processor core design for media SoC.Media enhancement backward extension to MIPS-I compatible ISA is presented in this paper. Based on the analysis of inherent characteristics of media application algorithms, the basic MIPS-I compatible ISA is extended to support sub-word parallel SIMD operation, special result handling, and dedicated media instructions. The media enhancement extension to MIPS-I compatible ISA is physically realized in the processor core, and improves media processing performance effectively (2-4x) with negligible additional hardware cost (2.7%).A Finite State Machine (FSM) based centralized control scheme is presented in this paper to supervise the CPU pipeline activity. And some effective techniques are discussed to lower the clock period and CPI (Cycles Per Instruction) of the pipeline. To eliminate the clock frequency limitation by some complex instructionsâ€™ long executing time and achieve single-cycle throughput, a scalable super-pipelining extension technique together with a high performance/cost pipeline shift mechanism is presented in this paper. For single-issue processor architecture, the radical solution to CPI reduction is to decease pipeline stalls exploiting available software or hardware techniques. A RAW (Read After Write) dependency loop model is developed in this paper to analyze the RAW hazards of register operands in complex pipeline. Based on this model, a "dynamic" data forwarding policy is suggested to reduce the pipeline stalls caused by data RAW hazards. Theoretical analysis and practical experiments both show that the average CPI increment caused by data RAW hazards can be reduced effectively by the dynamic data forwarding strategy.Bus design and media data stream scheduling are key issues in real-time media SoC development. Data scheduling policies for MPEG-1/2 video decoding is discussed in this paper according to software or hardware implementation case. Two 3-frames-grained scheduling policies are suggested to make good trade-off between processing demands and on-chip buffer demands in software decoding implementation. A static time division multiplexed scheduling / dynamic fixed priority arbitration based 2-level hybrid arbitration scheme, incorporated with synchronization control, is introduced in this paper to utilize the bus bandwidth effectively and lower on-chip buffer demands in media SoC.æ›´å¤š è¿˜åŽŸ

ã€å…³é”®è¯ã€‘ åª’ä½“æ•°å—ä¿¡å·å¤„ç†å™¨æ ¸ï¼› äºšå—å¹¶è¡Œï¼› è¶…æµæ°´ï¼› æ•°æ®æ—è·¯ï¼› æ€»çº¿ä»²è£ï¼›
ã€Key wordsã€‘ Media Processor Coreï¼› Sub-word Parallelismï¼› Super-pipeliningï¼› Data Bypassingï¼› Bus Arbitrationï¼›

ã€ç½‘ç»œå‡ºç‰ˆæŠ•ç¨¿äººã€‘ æµ™æ±Ÿå¤§å¦

ã€åˆ†ç±»å·ã€‘TP332
ã€è¢«å¼•é¢‘æ¬¡ã€‘18
ã€ä¸‹è½½é¢‘æ¬¡ã€‘414
æ”»è¯»æœŸæˆæžœ

çŸ¥ç½‘èŠ‚ä¸‹è½½

èŠ‚ç‚¹æ–‡çŒ®ä¸ï¼š

æœ¬æ–‡é“¾æŽ¥çš„æ–‡çŒ®ç½‘ç»œå›¾ç¤º:

æœ¬æ–‡çš„å¼•æ–‡ç½‘ç»œ

èŠ‚ç‚¹æ–‡çŒ®

èŠ‚ç‚¹æ–‡çŒ®

ç³»ç»ŸèŠ¯ç‰‡ä¸­åª’ä½“å¢žå¼ºæ•°å­—ä¿¡å·å¤„ç†å™¨æ ¸è®¾è®¡ç ”ç©¶

Research on Media Enhanced Digital Signal Processor Core Design for System-On-Chip

æœ¬æ–‡é“¾æŽ¥çš„æ–‡çŒ®ç½‘ç»œå›¾ç¤º:

ç³»ç»ŸèŠ¯ç‰‡ä¸åª’ä½“å¢žå¼ºæ•°å—ä¿¡å·å¤„ç†å™¨æ ¸è®¾è®¡ç ”ç©¶