èŠ‚ç‚¹æ–‡çŒ®

ä½“è‚²é¢†åŸŸä¿¡æ¯æŠ½å–ç³»ç»Ÿçš„ç ”ç©¶

Research on the Information Extraction System in Sports Domain

åˆ†é¡µä¸‹è½½
åˆ†ç« ä¸‹è½½
æ•´æœ¬ä¸‹è½½
åœ¨çº¿é˜…è¯»
ä¸æ”¯æŒè¿…é›·ç‰ä¸‹è½½å·¥å…·ï¼Œè¯·å–æ¶ˆåŠ é€Ÿå·¥å…·åŽä¸‹è½½ã€‚

ã€ä½œè€…ã€‘ é«˜å›½æ´‹ï¼›

ã€ä½œè€…åŸºæœ¬ä¿¡æ¯ã€‘ åŽåŒ—ç”µåŠ›å¤§å¦ï¼ˆæ²³åŒ—ï¼‰ ï¼Œ é€šä¿¡ä¸Žä¿¡æ¯ç³»ç»Ÿï¼Œ 2010ï¼Œ ç¡•å£«

ã€æ‘˜è¦ã€‘ ä¿¡æ¯æŠ½å–ä½œä¸ºä¸€ç§è‡ªåŠ¨åŒ–ä¿¡æ¯å¤„ç†æŠ€æœ¯,å·²æˆä¸ºè‡ªç„¶è¯è¨€å¤„ç†é¢†åŸŸçš„ç ”ç©¶çƒç‚¹ã€‚æœ¬æ–‡é¦–å…ˆé’ˆå¯¹ä¿¡æ¯æŠ½å–ä¸çš„ä¸¤å¤§å…³é”®æŠ€æœ¯å‘½åå®žä½“è¯†åˆ«å’Œå®žä½“å…³ç³»è‡ªåŠ¨æŠ½å–è¿›è¡Œäº†ç ”ç©¶,æå‡ºäº†èžåˆå¤šçŸ¥è¯†çš„åŸºäºŽæ¡ä»¶éšæœºåœºçš„ä¸æ–‡å‘½åå®žä½“è¯†åˆ«æ–¹æ³•å’Œé’ˆå¯¹ä½“è‚²é¢†åŸŸçš„å®žä½“å…³ç³»è‡ªåŠ¨æŠ½å–æ–¹æ³•;å…¶æ¬¡,åœ¨æ¤åŸºç¡€ä¸Š,åŸºäºŽç»Ÿè®¡ä¸Žè§„åˆ™ç›¸ç»“åˆçš„åŽŸåˆ™,é’ˆå¯¹ä½“è‚²é¢†åŸŸæå‡ºå¹¶å®žçŽ°äº†èµ›äº‹ä¿¡æ¯æŠ½å–ç³»ç»Ÿ,å®žéªŒè¯æ–™æ¥è‡ªæ–°æµªå’Œæœç‹,å®žéªŒè¯æ˜Žæœ¬æ–‡æå‡ºçš„æ–¹æ³•å“æœ‰æˆæ•ˆ,ç³»ç»Ÿçš„å‡†ç¡®çŽ‡ã€å¬å›žçŽ‡ã€å’ŒF-å€¼åˆ†åˆ«è¾¾åˆ°äº†95.70%ã€93.00%å’Œ94.33%ã€‚æ›´å¤š è¿˜åŽŸ

ã€Abstractã€‘ Information extraction as an automated information processing technology interests many researchers in natural language processing. Firstly, Named entity recognition and relation extraction as the key technology of information extraction have been studied in this paper, a new approach is proposed to recognize entity based on conditional random fields, which fuses multiple knowledges, and a new approach is proposed to extract the entity relation in sports news based on conditional random fields. Secondly, the information extraction system in sports game news is designed and realized, which is mainly based on statistics and rules to extract sports game news. The experiments corpus comes from the www.sina.com and www.sohu.com. The experiments results show that the precision of system is 95.70%, the recall of system is 93.00% and the F-measure of system is 94.33%, which prove the validity of our approach.æ›´å¤š è¿˜åŽŸ

ã€å…³é”®è¯ã€‘ ä¿¡æ¯æŠ½å–ï¼› å‘½åå®žä½“è¯†åˆ«ï¼› å®žä½“å…³ç³»æŠ½å–ï¼› æ¡ä»¶éšæœºåœºï¼›
ã€Key wordsã€‘ information extractionï¼› named entity recognitionï¼› entity relation extractionï¼› condition random fieldsï¼›

ã€ç½‘ç»œå‡ºç‰ˆæŠ•ç¨¿äººã€‘ åŽåŒ—ç”µåŠ›å¤§å¦ï¼ˆæ²³åŒ—ï¼‰

ã€åˆ†ç±»å·ã€‘TP391.1
ã€ä¸‹è½½é¢‘æ¬¡ã€‘65
æ”»è¯»æœŸæˆæžœ

çŸ¥ç½‘èŠ‚ä¸‹è½½

èŠ‚ç‚¹æ–‡çŒ®ä¸ï¼š

æœ¬æ–‡é“¾æŽ¥çš„æ–‡çŒ®ç½‘ç»œå›¾ç¤º:

æœ¬æ–‡çš„å¼•æ–‡ç½‘ç»œ

èŠ‚ç‚¹æ–‡çŒ®

èŠ‚ç‚¹æ–‡çŒ®

ä½“è‚²é¢†åŸŸä¿¡æ¯æŠ½å–ç³»ç»Ÿçš„ç ”ç©¶

Research on the Information Extraction System in Sports Domain

æœ¬æ–‡é“¾æŽ¥çš„æ–‡çŒ®ç½‘ç»œå›¾ç¤º:

ä½“è‚²é¢†åŸŸä¿¡æ¯æŠ½å–ç³»ç»Ÿçš„ç ”ç©¶