èŠ‚ç‚¹æ–‡çŒ®

é¢å‘ç©ºä¸äº¤é€šç®¡åˆ¶çš„æ—¶é¢‘åŸŸè¯éŸ³å¢žå¼ºæŠ€æœ¯ç ”ç©¶

Research on Time-Frequency Domain Speech Enhancement Techniques for Air Traffic Control

æŽ¨è CAJä¸‹è½½
PDFä¸‹è½½
ä¸æ”¯æŒè¿…é›·ç‰ä¸‹è½½å·¥å…·ï¼Œè¯·å–æ¶ˆåŠ é€Ÿå·¥å…·åŽä¸‹è½½ã€‚

ã€ä½œè€…ã€‘ æŽç…œç¨ï¼› å”å»ºå›½ï¼› è’‹åŸ¹å…ƒï¼› æ¢æµ·å†›ï¼›

ã€Authorã€‘ LI Yu-kun;KONG Jian-guo;JIANG Pei-yuan;LIANG Hai-jun;Civil Aviation Flight University of China;

ã€æœºæž„ã€‘ ä¸å›½æ°‘ç”¨èˆªç©ºé£žè¡Œå¦é™¢ï¼›

ã€æ‘˜è¦ã€‘ æœ¬ç ”ç©¶æ—¨åœ¨é€šè¿‡è¯éŸ³å¢žå¼ºæŠ€æœ¯è§£å†³ç©ºä¸äº¤é€šç®¡åˆ¶é€šè¯ä¸çš„è¯éŸ³å¹²æ‰°é—®é¢˜ã€‚é€šè¿‡ç»“åˆé¢‘åŸŸé™å™ªå’Œæ—¶åŸŸå¢žå¼ºæ–¹æ³•ï¼Œæå‡ºäº†æ”¹è¿›çš„U-Netæ¨¡åž‹å®žçŽ°äº†å¯¹ç®¡åˆ¶è¯éŸ³çš„æœ‰æ•ˆé™å™ªå¤„ç†ã€‚é‡‡ç”¨SNR(Signal-to-Noise Ration)ã€MOS(Mean Opinion Score)æ¥ç›´æŽ¥è¯„ä¼°é™å™ªæ•ˆæžœã€‚å®žéªŒç»“æžœæ˜¾ç¤ºï¼Œä¸ŽåŸºçº¿U-Netæ¨¡åž‹ç›¸æ¯”ï¼Œæ”¹è¿›æ¨¡åž‹çš„SNRå€¼æå‡äº†4.566 3,è¾¾åˆ°äº†7.386 1ã€‚é‰´äºŽåœ¨å®žé™…ATCå·¥ä½œçŽ¯å¢ƒä¸éš¾ä»¥å‡†ç¡®è®¡ç®—SNR,é‡‡ç”¨äº†é—´æŽ¥è¯„ä¼°æ–¹æ³•ï¼Œé€šè¿‡è¯éŸ³è¯†åˆ«ç³»ç»Ÿçš„è¯†åˆ«ç»“æžœæ¥é—´æŽ¥è¡¡é‡æ¨¡åž‹åœ¨çœŸå®žATCçŽ¯å¢ƒä¸‹éŸ³é¢‘çš„é™å™ªæ•ˆæžœã€‚å®žéªŒç»“æžœè¡¨æ˜Žï¼Œç»è¿‡è¯éŸ³å¢žå¼ºå¤„ç†åŽçš„æµ‹è¯•éŸ³é¢‘åœ¨è¯éŸ³è¯†åˆ«ç³»ç»Ÿä¸å¹³å‡å—é”™çŽ‡é™ä½Žäº†1.79%,å¥é”™çŽ‡é™ä½Žäº†3%,æ”¹è¿›åŽçš„æ¨¡åž‹èƒ½æœ‰æ•ˆæ”¹å–„è¯éŸ³è´¨é‡æå‡è¯éŸ³è¯†åˆ«ç³»ç»Ÿçš„è¯†åˆ«å‡†ç¡®çŽ‡ã€‚æ›´å¤š è¿˜åŽŸ

ã€Abstractã€‘ This study aims to solve the problem of voice interference in air traffic control communications using voice enhancement technology.By combining frequency domain noise reduction with time domain enhancement methods, this paper proposes an improved U-Net model for effective noise reduction in control voice communications.The noise reduction effectiveness is directly evaluated using SNR(Signal-to-Noise Ratio) and MOS(Mean Opinion Score).Experimental results show that the SNR value of the improved model increased by 4.566 3 over the baseline U-Net model, reaching 7.386 1.Given the difficulty of accurately calculating SNR in real ATC environments, this paper employs an indirect evaluation method, using the results of a speech recognition system to measure the modelâ€²s noise reduction effectiveness in actual ATC scenarios.The experimental results indicate that the test audio, after undergoing voice enhancement processing, show a reduction in the average word error rate by 1.79% and in the sentence error rate by 3% within the speech recognition system.The improved model effectively enhances voice quality and increases the accuracy of the speech recognition system.æ›´å¤š è¿˜åŽŸ

ã€å…³é”®è¯ã€‘ è¯éŸ³å¢žå¼ºï¼› æ·±åº¦å¦ä¹ ï¼› U-Netï¼› ATCï¼› ASRï¼›
ã€Key wordsã€‘ speech enhancementï¼› deep learningï¼› U-netï¼› ATCï¼› ASRï¼›

ã€åŸºé‡‘ã€‘ å›½å®¶é‡ç‚¹ç ”å‘è®¡åˆ’é¡¹ç›®èµ„åŠ©(2021YFF0603904);ä¸å¤®é«˜æ ¡åŸºæœ¬ç§‘ç ”ä¸šåŠ¡è´¹é¡¹ç›®èµ„åŠ©(PHD2023-035;ZHMH2022-009);å››å·çœç§‘æŠ€è®¡åˆ’é¡¹ç›®èµ„åŠ©(2022YFG0210)

ã€æ–‡çŒ®å‡ºå¤„ã€‘ èˆªç©ºè®¡ç®—æŠ€æœ¯ ,Aeronautical Computing Technique , ç¼–è¾‘éƒ¨é‚®ç®± ,2024å¹´03æœŸ

ã€åˆ†ç±»å·ã€‘V355.1;TN912.35
ã€ä¸‹è½½é¢‘æ¬¡ã€‘24

çŸ¥ç½‘èŠ‚ä¸‹è½½

èŠ‚ç‚¹æ–‡çŒ®ä¸ï¼š

æœ¬æ–‡é“¾æŽ¥çš„æ–‡çŒ®ç½‘ç»œå›¾ç¤º:

æœ¬æ–‡çš„å¼•æ–‡ç½‘ç»œ

èŠ‚ç‚¹æ–‡çŒ®

èŠ‚ç‚¹æ–‡çŒ®

é¢å‘ç©ºä¸­äº¤é€šç®¡åˆ¶çš„æ—¶é¢‘åŸŸè¯­éŸ³å¢žå¼ºæŠ€æœ¯ç ”ç©¶

Research on Time-Frequency Domain Speech Enhancement Techniques for Air Traffic Control

æœ¬æ–‡é“¾æŽ¥çš„æ–‡çŒ®ç½‘ç»œå›¾ç¤º:

é¢å‘ç©ºä¸äº¤é€šç®¡åˆ¶çš„æ—¶é¢‘åŸŸè¯éŸ³å¢žå¼ºæŠ€æœ¯ç ”ç©¶