ĪÄÕĀ

�¶Īäŗŗ¹¤³Ģ´óŃ§Ń§±Ø�· 2020Äź02ĘŚ 207-212 ³ö°ęČÕĘŚ£ŗ2021-01-26 ISSN:1674-2869 CN:42-1779/TQ

»łÓŚCNNµÄĶ»·¢ŹĀ¼žŌ¤¾ÆĻµĶ³µÄÉč¼ĘÓėŹµĻÖ

°éĖę×Åµ±½ń»�ĮŖĶųµÄ·ÉĖŁ·¢Õ¹£¬Ćę¶Ō»�ĮŖĶųĒžµĄ´ųĄ´µÄ´óĮæŹµŹ±Źż¾Ż£¬´ÓÖŠ»ńµĆŹż¾Ż²¢½ųŠŠ·ÖĪö¼ą²āŅŃ¾³ÉĪŖĮĖÖŲŅŖĶ¾¾¶£Ū1-2£Ż£¬ŌŚ³ĒŹŠÓ¦¼±¹ÜĄķĢåĻµÖŠ£¬½ØĮ¢ÄÜ¹»ČĖ»ś»�¶Æ�¢ĖęŠčÓ¦±ä�¢øßŠ§×¼Č·µÄĶ»·¢ŹĀ¼žŌ¤¾ÆĻµĶ³ŹĒĢįÉżÕžø®Ó¦¼±¹ÜĄķĖ®Ę½µÄÖŲŅŖŹÖ¶Ī£Ū3£Ż�£¶Ō³ĒŹŠæÖ²ĄĶžŠ²Ķ»·¢ŹĀ¼ž£¬Ęä´ęŌŚµÄĒ±ŌŚĶžŠ²ŗĶĻą¹Ų²æĆÅµÄŹĀŗóÓ¦¼±¾ČŌ®�¢´¦Ąķ·½Ź½¶¼»į³ÉĪŖ¹Ų×¢½¹µć£¬ŌŚŹĀ¼ž´«²�ŠÅĻ¢²»×¼Č·µÄĒéæöĻĀ£¬¾ĶæÉÄÜŅż·¢¼«´óµÄøŗĆę×÷ÓĆ£¬ÉõÖĮÓ°Ļģµ½Éē»įĪČ¶ØŗĶÕžø®¹«ŠÅĮ¦�£Ņņ´Ė£¬ŌŚµ±½ń»�ĮŖĶųŹ±´śĻĀ£¬ĘČĒŠŠčŅŖ¶ŌĶųĀē´«²�µÄæÖ²ĄĶžŠ²ŹĀ¼ž½ųŠŠ¼°Ź±×�Č��¢´¦Ąķ�¢·ÖĪöŗĶŃŠÅŠ£¬ŅŌ±ć¼°Ź±ÓŠŠ§µŲÕĘĪÕŹĀ¼žµÄÓ°Ļģ³Ģ¶ČŗĶŃŻ»Æ¹ęĀÉ�£Ļą±ČÓŚ´«Ķ³µÄ½ØÄ£·½Ź½£¬²ÉÓĆŹż¾Ż»ńČ��¢·ÖĪö�¢Õ¹Ź¾Ņ»ĢåµÄÖĒÄÜ»Æ·½Ź½øü¼ÓŹŹÓ¦µ±½ńµÄ»�ĮŖĶų»·¾³�£ŌŚŹż¾Ż·ÖĪö²æ·Ö£¬øł¾ŻŹż¾ŻŌ´ĄąŠĶ£¬æÉŅŌ¹é»®³ÉĪŖ¶ĢĪÄ±¾·ÖĄąµÄĪŹĢā£¬´«Ķ³·ÖĄą·½·ØÖ÷ŅŖ°üŗ¬ĢŲÕ÷¹¤³Ģ�¢ĢŲÕ÷Ń�ŌńŗĶ»śĘ÷Ń§Ļ°Ėć·Ø3øö·½Ćę£Ū4£Ż£»Ėę×ÅÉī¶ČŃ§Ļ°·¢Õ¹£¬Ō½Ą´Ō½¶ąµÄŃ§ÕßæŖŹ¼Ź¹ÓĆÉī¶ČŃ§Ļ°£Ū5-7£ŻĄ´½ā¾ö·ÖĄąĪŹĢā£¬ÕāÖÖ·½·Ø»łÓŚÉī¶ČÉń¾ĶųĀēµÄÄ£ŠĶŌŚĪŽŠč´óĮæČĖ¹¤ĢŲÕ÷µÄĒéæöĻĀČ�µĆĮĖ±Č´«Ķ³·ÖĄąĘ÷øüŗĆµÄŠ§¹ū£Ū8£Ż�£¶ųĖę×ÅŗóŠųŃ§ÕßµÄÉīČėŃŠ¾æ£¬Ćę¶ŌÉĻŹöĶųĀēÄ£ŠĶµÄĢŲÕ÷±ķ´ļÓļŅåČõ�¢ĪÄ±¾±ķŹ¾Ī¬¶ČøßµČĪŹĢā£¬Ģį³öĮĖĻą¹ŲøÄ½ųĖć·Ø£¬Š»½š±¦µČ£Ū9£ŻĢį³ö»łÓŚÓļŅåĄķ½āµÄ×¢ŅāĮ¦Éń¾ĶųĀē�¢³¤¶ĢĘŚ¼ĒŅäĶųĀēÓė¾ķ»żÉń¾ĶųĀē£Øconvolution neural network£¬CNN£©µÄ¶ąŌŖČŚŗĻµÄĪÄ±¾·ÖĄąÄ£ŠĶ£¬½į¹ū±ķĆ÷Ļą½ĻÓŚ´«Ķ³µÄ½į¹¹Ä£ŠĶ£¬øĆÄ£ŠĶµÄĪÄ±¾Ź¶±šÄÜĮ¦ĢįÉż½ĻĪŖĆ÷ĻŌ�£¶Ō´«Ķ³CNN½įŗĻĶ³¼ĘµÄ·½·ØĖäČ»æÉŅŌĶØ¹ż¹¹½Ø´ŹĻņĮæŗĶČØÖŲ±£Įō´ŹÓļÉĻĻĀĪÄ¹ŲĻµ£¬µ«´«Ķ³CNN±ķ´ļÄÜĮ¦Č´Ć»ÓŠĢįøß�£±¾ĪÄĢį³öĶØ¹ż²ÉÓĆ½įŗĻøÄ½ųŠĶ´ŹĘµ-ÄęĪÄ±¾ĘµĀŹ£Øterm frequency-inverse document frequency£¬TI£©�¢word2vecµÄøÄ½ųŠĶCNNĪŖ·ÖĪöÄ£ŠĶ£¬½ØĮ¢ĮĖŅ»Ģ×ŅŌµ±µŲĻą¹Ų°²Č«ĶųÕ¾Ėł·¢²¼µÄ°²Č«ŠĀĪÅŹĀ¼žĪŖŃŠ¾æ¶ŌĻó£¬ŅŌĶŚ¾ņŗĶ·ÖĪöŹĀ¼žÖŠ´ęŌŚµÄĶžŠ²Ņž»¼ĪŖÄæµÄÖĒÄÜ»Æ»ńČ��¢·ÖĪö�¢Õ¹Ź¾Źż¾ŻŃŠÅŠĻµĶ³£¬ŅŌ±ć»ńČ�æÖ²ĄĶžŠ²Ķ»·¢ŹĀ¼ž°²±£Ō¤¾ÆµČ¼¶£¬ŠÖś°²±£²æĆÅĢįÉż³ĒŹŠ°²Č«ŹĀ¼žĶžŠ²¼ģ²āŠ§ĀŹ£¬´Ó¶ų½µµĶ¶ŌÉē»įŌģ³ÉµÄø÷ĄąĖšŹ§�£1��ĻµĶ³×ÜĢåÉč¼Ę·½°øĻµĶ³µÄÖ÷ŅŖČĪĪńŹĒĶŚ¾ņŗĶ·ÖĪöÕė¶Ōµ±µŲŌŚ»�ĮŖĶųÖŠ·¢²¼µÄĶ»·¢ŹĀ¼žĻą¹ŲŠÅĻ¢²¢¼°Ź±Ļņ³ĒŹŠĶ»·¢ŹĀ¼žÓ¦¼±¹ÜĄķ²æĆÅĢįŹ¾Ō¤¾ÆµČ¼¶£¬ÓĆÓŚæ¼ĀĒŹĒ·ńĢįÉżĻąÓ¦µŲĒųÓ¦¼±¹ÜĄķĮ¦¶Č£¬ĢįøßÓ¦¼±±£ÕĻ²æĆÅ¹¤×÷Š§ĀŹŅŌ¼õÉŁĻąÓ¦ĖšŹ§£¬Ņņ´ĖĻµĶ³¹¦ÄÜÉč¼ĘĪŖČēĶ¼1ĖłŹ¾µÄ3´óÄ£æé�£ÕūøöĻµĶ³µÄ³ĒŹŠæÖ²ĄĶ»·¢ŹĀ¼žµÄĶžŠ²·ÖĪö¹¤×÷Į÷³Ģ·ÖĪŖ3øö½×¶Ī£¬²ÉÓĆpythonæŖŌ´æņ¼ÜScrapy£¬ŹµĻÖ¶ŌÄā¶ØĶųÕ¾µÄ±éĄśÅĄČ�£¬»ńČ�Ķ»·¢ŹĀ¼žĻą¹ŲŠÅĻ¢£¬ŅŌ½į¹¹»Æ·½Ź½´ęČėµ½Źż¾ŻæāÖŠ�£ŌŁĄūÓĆ·Ö´ŹĒåĻ´¹¦ÄÜ½ųŠŠŌ¤´¦Ąķ£¬ŌŁ´śČėCNNŗĖŠÄĖć·ØÄ£ŠĶÖŠ·ÖĪöŃŠÅŠ£¬øų³öÓ¦¼±µČ¼¶£¬×īŗó²ÉÓĆB/S£ØBrowser/Server£©¼¼ŹõŹµĻÖ¶ŌÓ¦¼±µČ¼¶ŗĶĻąÓ¦Źż¾ŻµÄÕ¹Ź¾£¬ÕūĢ×ĻµĶ³¾ßĢå¹¤×÷Į÷³ĢČēĶ¼2ĖłŹ¾�£µ�ĢõĶ»·¢ŹĀ¼žĶžŠ²³Ģ¶ČµÄ»®·Ö£¬²Īæ¼ĪŅ¹śĶ»·¢¹«¹²ŹĀ¼ž·ÖĄąµČ¼¶£¬½įŗĻĻµĶ³Ó¦ÓĆ»·¾³µÄŹµ¼Ź£¬½«µ�ĢõŹĀ¼žµÄµČ¼¶»®·ÖĪŖ4øöµČ¼¶£¬·Ö±šĪŖI¼¶£ØŗģÉ«£©�¢II¼¶£Ø³ČÉ«£©�¢III¼¶£Ø»ĘÉ«£©�¢IV¼¶£ØĄ¶É«£©£¬ĶžŠ²³Ģ¶Č·Ö±š¶ŌÓ¦ÖŲ´óĶžŠ²�¢½Ļ´óĶžŠ²�¢Ņ»°ćĶžŠ²�¢ĒįĪ¢ĶžŠ²�£³ĒŹŠÓ¦¼±µČ¼¶Ņ²½«·ÖĪŖ4ÖÖ³Ģ¶Č£¬·Ö±šĪŖI�¢II�¢III�¢IV¼¶°²±£µČ¼¶£¬I¼¶×īøß£¬Ķ¬Ź±ÅÅ³żĪŽĶžŠ²¶ČŹĀ¼žIV¼¶ŹżĮæ�£°²±£µČ¼¶ŹżÖµ¼ĘĖć¹«Ź½ĪŖ£ŗ[T=0.9a+0.6b+0.3c+0.0d] £Ø1£©ĘäÖŠa£¬b£¬c£¬d·Ö±š¶ŌÓ¦4ÖÖµČ¼¶ĶžŠ²¶ČĶ»·¢ŹĀ¼žµÄŹżĮæ£¬²ĪÕÕĄąĖĘG.A.MillarµÄ9¼¶Įæ»Æ·½·Ø£Ū10£Ż£¬½«ŹĀ¼žĄąŠĶ²ÉÓĆĖÄ¼¶Įæ»ÆČØÖŲÖµ£¬·Ö±šĪŖ0.9£¬0.6£¬0.3£¬0.0�£ÓÉÓŚ¹ŲÓŚĶ»·¢ŹĀ¼žĶžŠ²¶ČµÄÓļĮĻĻą¶Ō½ĻÉŁ£¬²ÉÓĆČĖ¹¤ÉøŃ�±ź¼ĒµÄ·½·Ø¶Ō²É¼ÆŃł±¾½ųŠŠ±ź¼Ē·ÖĄą£¬ŅŌ×ī½ü1øöŌĀĪŖ1øöĘŚ¼ä¶Ī£¬Ķ¬ĶłĘŚŹż¾Ż±Č½Ļ£¬Č·¶Ø±ķ1ĖłŹ¾ĶžŠ²µČ¼¶ŹżÖµTČ�Öµ·¶Ī§�£øł¾ŻÉĻŹöÉč¼Ę·½°ø£¬ŌŚWindows 10ÉĻŅŌæŖ·¢ÓļŃŌpythonĪŖÖ÷£¬²ÉÓĆB/S¼Ü¹¹Éč¼Ę£¬¼Æ½įHTML�¢ CSS�¢JavaScript�¢EchartsµČ¼¼ŹõæŖ·¢ĻµĶ³Ē°ĢØ½ēĆę£»Ź¹ÓĆScrapyÅĄ³ęæņ¼Ü¶ŌÖø¶ØĶ³Ņ»×ŹŌ´¶ØĪ»·ū£Øuniform resource locator£¬URL£©Źż¾Ż½ųŠŠ×�Č�²¢ĄūÓĆJieBa·Ö´Ź¶ŌĘä½ųŠŠ·Ö´Ź�¢ĒåĻ´£»²ÉÓĆ½įŗĻĮĖword2vecµÄøÄ½ųŠĶCNNÄ£ŠĶ¶ŌŹż¾Ż½ųŠŠĶžŠ²¶Č·ÖĄą£»Źż¾Żæā¹ÜĄķĻµĶ³²ÉÓĆMySQL£»ŅŌDjangoĪŖWeb·žĪńĘ÷�£ŌŚÓ²¼ž·½Ćę£¬¾ł²ÉÓĆLenovo Inter£ØR£©Core£ØTM£©i5 -7400CPU·žĪńĘ÷£¬8 GBŌĖŠŠÄŚ´ę£¬Centos7²Ł×÷ĻµĶ³£¬ĘäÖŠŹż¾ŻŃŠÅŠ»śĘ÷ĻŌæØĪŖNVIDIA GeForce GTX 1060 Founders?�£2��CNN·ÖĪöŃŠÅŠĖć·ØŌŚ¹¹½ØĶžŠ²¶ČŃŠÅŠÄ£ŠĶŹ±£¬Ź×ĻČŠčŅŖ¶ŌŹż¾Ż²É¼ÆČėæāÄ£æéĖł²É¼ÆµÄŹż¾Ż½ųŠŠŌ¤´¦Ąķ£¬½«ĪÄ±¾Źż¾Ż×Ŗ»»³ÉĶųĀēÄ£ŠĶµÄŹäČėĻņĮæ¾ŲÕó£¬ĻµĶ³²ÉÓĆµÄword2vecŹĒŅ»ÖÖæģĖŁÓŠŠ§µŲŃµĮ·´ŹĻņĮæÄ£ŠĶµÄ·½·Ø£Ū11£Ż£¬¾ßĢåĪŖĻČ¶ŌĪÄ±¾[w]²ÉÓĆJieBa·Ö´Ź¶ŌÕūøöĪÄ±¾½ųŠŠ·Ö´Ź´¦Ąķ£¬´¦ĄķŗóĪÄ±¾ÖŠµÄĆæ1ĢõŹż¾ŻŗĶ¾¹ż·Ö´ŹŗóµÄĪÄ±¾×Ŗ»»ĪŖµĶĪ¬ŹżÖµĻņĮæµÄŠĪŹ½ČēĻĀ£ŗ[w=[w1,...,wn]] £Ø2£©[V=[Vw1,...,Vwn]] £Ø3£©ĘäÖŠ[n]ĪŖ´ŹÓļøöŹż£¬ĮŠĻņĮæVwiÓė´ŹwiĻą¶ŌÓ¦£¬ÓÉ¶ąĪ¬ŹżÖµ¹¹³É�£¶ųĪŖĮĖæĢ»´ŹÓļ¶ŌĪÄ±¾µÄÖŲŅŖ¶Č£¬ŌŚ½«µ�´Ź×Ŗ»»³É´ŹĻņĮæŹ±ÓĆøÄ½ųŠĶ´ŹĘµ-ÄęĪÄ±¾ĘµĀŹ£Ū12£Ż½ųŠŠĻņĮæ´ŹČØÖŲµÄ¼ĘĖć£¬Ź¹µĆĪÄ±¾Éś³ÉµÄ´ŹĻņĮæ´ÓøßĪ³¶ČøßĻ�ŹčµÄ´«Ķ³Źż¾Ż±ä³ÉĮĖĄąĖĘĶ¼ĻńµÄĮ¬Šų³ķĆÜ¾ŲÕóŹż¾Ż�£½«»ńČ�µÄĪÄ±¾Źż¾Ż×Ŗ»»³É´ŹĻņĮæŗó£¬ĻµĶ³²ÉÓĆµÄ¾ķ»żÉń¾ĶųĀē»įĶØ¹ż°Ń´ŹĻņĮæ²»Ķ¬µÄĢŲÕ÷Ę´½Ó×÷ĪŖ¾ķ»żÉń¾ĶųĀēµÄŹäČė£¬Ź¹µĆĶųĀēÄ£ŠĶŌŚŃµĮ·¹ż³ĢÖŠÕė¶Ō²»Ķ¬µÄĢŲÕ÷ŠÅĻ¢Ą´Ń§Ļ°ŗĶµ÷ÕūÄ£ŠĶµÄ²ĪŹż£¬´Ó¶ų»ńµĆøü¶ąµÄŅž²ŲŠÅĻ¢�£Ķ¬Ź±ĪŖĮĖĢįøßĶųĀēµÄ±ķ´ļÄÜĮ¦£¬¶Ō¾ķ»żÉń¾ĶųĀē½ųŠŠĮĖÓÅ»Æ£¬ÓÅ»ÆŗóµÄÉń¾ĶųĀē½į¹¹ČēĶ¼3ĖłŹ¾£¬ÕūøöĶųĀē½į¹¹×Ü¹²ÓÉ5øö²æ·Ö×é³É£¬·Ö±šĪŖŹäČė²ć�¢¾ķ»ż²ć�¢æē²ć�¢³Ų»Æ²ćŗĶČ«Į¬½Ó²ć£Ø°üŗ¬Źä³ö²ć£©�£¶ŌÓŚĶųĀē½į¹¹ÖŠĢķ¼ÓµÄæē²ć£¬ĻµĶ³ŌŚ´«Ķ³ĶųĀē½į¹¹µÄ»ł´�ÉĻ£¬ŌŚ¾ķ»ż²ćŗóĆęŌö¼ÓĮĖ1øöæēĶØµĄ²ć£Ū13£Ż£¬Ź¹µĆŌŚĆę¶ŌĢįČ�ĢŲÕ÷¶ąĪŖ·ĒĻßŠŌµÄĒéæöĻĀ£¬æÉŅŌĢįČ�³öøü³éĻóµÄĢŲÕ÷£¬´Ó¶ųĢįøßĶųĀēµÄ±ķ´ļÄÜĮ¦�£Ęä±¾ÖŹŹĒ1øö[1�Į1]µÄ¾ķ»żŗĖ£¬ŹµĻÖŌŚŅŌŌ±¾¾ķ»ż²ćµÄŹä³öci×÷ĪŖæē²ćµÄŹäČė£¬¶ŌÓ¦ĻąÓ¦ĶØµĄµÄČØÖŲ¾ŲÕó[¦Ų1Tk-h+1]ÓėĘ«²īÖµb2£¬²¢ĶØ¹ż·ĒĻßŠŌ¼¤»īŗÆŹżŹµĻÖŗÆŹżÓ³Éä£¬µĆµ½ĶØ¹żŹ½£Ø4£©ŌĖĖćŗóæē²ć½į¹ūC�£[C=f(¦Ų1Tk-h+1ci+b2)] £Ø4£©3��ĻµĶ³ŹµĻÖ¼°²āŹŌ3.1��ĶųĀēÄ£ŠĶ½ØĮ¢ĶųĀēÄ£ŠĶŃµĮ·Źż¾Ż²ÉÓĆŹż¾Ż²É¼ÆÄ£æé»ńČ�µÄŹµ¼ŹŹż¾Ż£¬´ÓÖŠČ�4ÖÖĶžŠ²µČ¼¶Ķ»·¢ŹĀ¼ž¹²10 000Ģõ£¬²¢¶ŌŹż¾Ż½ųŠŠČĖ¹¤±ź¼Ē�£ĪŖĮĖĘĄ¹ĄĖć·ØÄ£ŠĶ¶ŌĪÄ±¾Źż¾ŻĢŲÕ÷Ź¶±šµÄÓŠŠ§ŠŌ£¬Ķ³¼ĘÄ£ŠĶĆæ1øöepochŹż¾ŻøöŹżÓėÕżČ··ÖĄąŹż¾ŻøöŹż£¬ĶØ¹żĮ½ÕßµÄ±ČÖµŠĪ³ÉÄ£ŠĶµÄ×¼Č·ĀŹA¼°ĖšŹ§ÖµL£¬´Ó¶ųŃéÖ¤Ä£ŠĶµÄĪČ¶ØŠŌ�£[A=nt/ncL=f(y,x)] £Ø5£©Ź½£Ø5£©ÖŠ£¬[nt]±ķŹ¾×ÜŹż¾ŻøöŹż£¬[nc]±ķŹ¾ÕżČ··ÖĄąøöŹż£»²ÉÓĆµÄŗÆŹżĪŖ½»²ęģŲŗÆŹż[f]£¬[y]ĪŖĶØ¹żÄ£ŠĶŌ¤²āµÄĄą±š£¬xĪŖÕżČ·µÄ±ź¼ĒÖµ�£½«ÉĻŹöµÄŹż¾Ż¼Æ´śČėµ½Éč¼ĘŗĆµÄ¾ķ»żÉń¾ĶųĀēÄ£ŠĶÖŠ£¬²ÉÓĆøßĖ¹·Ö²¼µÄ·½Ź½³õŹ¼»ÆČØÖŲWŗĶĘ«²ībµÄ¾ŲÕó£¬Źä³öĄąŠĶĪŖ4£ØI�¢II�¢III�¢IV¼¶ĶžŠ²¶Č£©�¢batch_sizeĪŖ64�¢Ń§Ļ°ĀŹĪŖ0.001�¢×ī´óµü´ś´ĪŹżĪŖ3 000�¢ČØÖŲĖ�¼õĪŖ0.005�¢²āŹŌ¼äøōĒų¼äĪŖ50øöepoch£¬dropoutĪŖ0.5£¬ÓÅ»ÆĘ÷Ń�ÓĆAdam£¬ĘäĖū²ĪŹż²Ī¼ūĶ¼3µÄ¾ķ»żÉń¾ĶųĀē½į¹¹�£ČēĶ¼4·Ö±šĪŖŃµĮ·Ź±Åś´ĪĖšŹ§ŹżÖµŗĶ±ä»ÆĒ÷ŹĘ�¢ŃµĮ·Ź±×¼Č·ĀŹ±ä»ÆĒ÷ŹĘ£¬´ÓĶ¼4ÖŠæÉŅŌæ´³öĖę×Åµü´ś´ĪŹżµÄŌö¼Ó£¬ĖšŹ§ÖµÖš½�¼õŠ�×īÖÕĒ÷½ü0.2£¬¾«Č·¶ČÖš½�Ōö¼Ó×īÖÕĒ÷½ü94%�£ŌŚŃµĮ·µÄĶ¬Ź±£¬°´²āŹŌ¼äøō½ųŠŠ²āŹŌ£¬ČēĶ¼5ĖłŹ¾£¬Ä£ŠĶĖšŹ§ÖµŅ²ŹĒÖš½�¼õŠ�£¬¶ų¾«Č·¶ČŌŚ3 000´Īµü´śŗóæÉŅŌ´ļµ½80%ŅŌÉĻ£¬ÓÉÓŚĶØ¹żÅĄ³ę»ńČ�µÄ¶ąŃłŠŌŹż¾ŻŅŌ¼°ČĖ¹¤±ź¼ĒŃµĮ·¼ÆµÄŌŅņ£¬³öĻÖŅ»¶Ø·¶Ī§µÄĘ«²īÖµŹōÕż³£ĻÖĻó£¬ŃµĮ·½į¹ū±ķĆ÷£¬±¾ĻµĶ³Éč¼ĘŹ¹ÓĆµÄøÄ½ųŠĶ´ŹĘµ-ÄęĪÄ±¾ĘµĀŹ�¢word2vecµÄøÄ½ųŠĶ¾ķ»żÉń¾ĶųĀēÄ£ŠĶÄÜ¹»½ĻŗĆµÄŹ¶±š³öĶ»·¢ŹĀ¼žĶžŠ²ĄąŠĶ�£3.2��ŃŠÅŠĖć·ØŠŌÄÜ¶Ō±Č·ÖĪöĪŖĮĖ²āŹŌŃŠÅŠÄ£ŠĶµÄŠŌÄÜ£¬¶Ō3ÖÖ²»Ķ¬µÄĪÄ±¾·ÖĄąÄ£ŠĶŌŚ±¾ĪÄ»ńČ�µÄŹż¾Ż¼ÆÉĻ½ųŠŠĮĖ¶Ō±ČŹŌŃé£¬Ķ¬Ź±ĪŖĮĖŹ¹µĆÄ£ŠĶ×¼Č·ĀŹ´ļµ½×īøß£¬²Īæ¼ĮĖŌĀŪĪÄÉčÖĆĮĖ¶Ō±ČŹŌŃéµÄ²ĪŹż£¬²¢Ķ³Ņ»µü´ś´ĪŹżĪŖ3 000´Ī£¬Ćæ100´ĪĪŖ1øöÅś´Ī£»ŹŌŃéĶØ¹ż×¼Č·ĀŹ£Øprecision£©�¢ÕŁ»ŲĀŹ£Ørecall£©�¢µ÷ŗĶĘ½¾łĀŹ£ØFScore£©Ą´ĘĄ¼ŪÄ£ŠĶŠŌÄÜ�£[P=PTrue(mi)PTrue(mi)+PFalse(mi)] £Ø6£©[R=PTrue(mi)A(mi)] £Ø7£©[F=2PRP+R] £Ø8£©Ź½£Ø6£©~£Ø8£©ÖŠPĪŖ×¼Č·ĀŹ£¬RĪŖÕŁ»ŲĀŹ£¬FĪŖµ÷ŗĶĘ½¾łĀŹ£»PTrue£Ømi£©ĪŖÕżČ·Ō¤²āĪŖmiĄąµÄøöŹż£¬PFalse£Ømi£©ĪŖ´ķĪóŌ¤²āĪŖmiĄąµÄøöŹż£¬A£Ømi£©ĪŖŹµ¼ŹmiĄąµÄøöŹż�£ĶØ¹ż¾ßĢåŹŌŃé£¬µĆµ½±ķ2ĖłŹ¾3ÖÖÄ£ŠĶŃµĮ·ŗó»ńµĆµÄ·ÖĄąŠ§¹ū£¬¶Ō±Č·ÖĪö·¢ĻÖ±¾ĪÄĖłÓĆµÄÄ£ŠĶ£ØTI-Word-CNN£©ŌŚ·ÖĄąŠŌÄÜÉĻÓŠŅ»¶ØµÄĢįÉż£¬Ļą±ČÓŚWord-CNN£Ū14£ŻÄ£ŠĶ¼°Word-RCNN£Ū15£ŻÄ£ŠĶµ÷ŗĶĘ½¾łĀŹ·Ö±šĢįÉżĮĖ5.4%ŗĶ3%�£±ķ2��²ÉŃłŹż¾ŻĶžŠ²¶ČŃŠÅŠ¶Ō±Č Tab. 2��Comparison of threat degree of sampled data %[Ä£ŠĶ\&×¼Č·ĀŹ\&ÕŁ»ŲĀŹ\&µ÷ŗĶĘ½¾łĀŹ\&Word-CNN\&89.3\&87.3\&88.3\&Word-RCNN\&91.9\&89.5\&90.7\&TI-Word-CNN\&94.3\&93.2\&93.7\&]¶ųÉĻŹö3ÖÖÄ£ŠĶŌŚ±¾ĪÄÉøŃ�±ź¼ĒµÄŹż¾Ż¼ÆÉĻ½ųŠŠ30øöÅś´Īµü´śŗó£¬µĆµ½ĮĖČēĶ¼6ĖłŹ¾ŃµĮ·×¼Č·ĀŹ±ä»ÆĒśĻßĶ¼£¬´ÓĶ¼ÖŠæÉŅŌæ´³ö±¾ĪÄŃŠÅŠÄ£ŠĶĆæÅśµü´śŠ§¹ū¶¼ŅŖÓÅÓŚĘäĖūĮ½ÖÖ£¬´ļµ½ĻąĶ¬µÄ·ÖĄąŠ§¹ūĖłÓĆµÄŃµĮ·Åś´ĪøüÉŁ£¬ÕāŅ²½ųŅ»²½ĖµĆ÷±¾ĪÄŃ�Č�µÄŃŠÅŠÄ£ŠĶæÉŅŌČ�µĆøüŗĆµÄŃµĮ·¾«¶ČŗĶŹż¾Ż·ÖĄąÄÜĮ¦�£Ķ¼6��3ÖÖÄ£ŠĶ30Åś´Īµü´ś×¼Č·ĀŹ±ä»ÆĒśĻßFig. 6��Variation curves of iteration accuracy rate of 30 batches of three modelsĪŖĮĖøü½ųŅ»²½¶Ō±Č·ÖĪö±¾ĪÄ²ÉÓĆÄ£ŠĶµÄÓÅŌ½ŠŌ£¬¶ŌŠĀ×�Č�µÄĶųŅ³Ķ»·¢ŹĀ¼žŹż¾Ż²ÉÓĆ³éČ�Źż¾ŻµÄ·½Ź½¶Ō3ÖÖ·ÖĄąÄ£ŠĶ½ųŠŠ²āŹŌ£¬ÓĆÓŚ²āŹŌµÄŹż¾Ż½«´ÓÕūĢåŹż¾ŻÖŠĖę»ś³éČ�200ĢõŹż¾Ż£¬ŅŖĒóø²øĒµ½I�¢II�¢III�¢IVĖÄÖÖĶžŠ²³Ģ¶Č£¬ĒŅ²»Ķ¬ĶžŠ²µČ¼¶µÄĻą¹ŲŹĀ¼žø÷50Ģõ£¬×īŗó½«Źż¾ŻŹäČėµ½Ä£ŠĶÖŠ½ųŠŠ·ÖĪö´¦Ąķ£¬½į¹ūČē±ķ3ĖłŹ¾£¬øų³öĮĖ3ÖÖÄ£ŠĶÅŠ¶Ļ½į¹ū£¬ĶØ¹żĪó²ī·ÖĪö£¬ĻµĶ³²ÉÓĆµÄŃŠÅŠÄ£ŠĶŹµ¼Ź²āŹŌ×¼Č·ĀŹ´ļµ½ĮĖ93%£¬µĆ³öĖäČ»ĻµĶ³´ęŌŚŅ»¶ØµÄĪó²ī£¬µ«ŹĒŃŠÅŠ·ÖĄąŠ§¹ū»¹ŹĒ½ĻŗĆ£¬ÄÜ¹»»ł±¾ŹµĻÖĶ»·¢ŹĀ¼žĪÄ±¾·ÖĪö�£±ķ3��Źµ¼Ź²ÉŃłŹż¾ŻĶžŠ²¶ČŃŠÅŠ¶Ō±ČTab. 3��Comparison of threat degree of sampled data[ŃŠÅŠÄ£ŠĶ\&I¼¶ĶžŠ²ĢõŹż\&II¼¶ĶžŠ²ĢõŹż\&III¼¶ĶžŠ²ĢõŹż\&IV¼¶ĶžŠ²ĢõŹż\&×¼Č·ĀŹ/%\&Word-CNN\&41\&46\&56\&57\&87\&Word-RCNN\&45\&53\&44\&58\&90\&TI-Word-CCNN\&46\&47\&52\&55\&93\&]3.3��Źµ¼ŹŌĖŠŠ²āŹŌŅŌĻµĶ³ÄæĒ°Éč¶ØµÄURLĪŖĄż£¬ĻµĶ³ĄūÓĆ½ØĮ¢µÄø÷ÖÖ¹¦ÄÜ£¬²É¼ÆĮĖ15 293ĢõĻą¹ŲŹż¾Ż£¬²¢¶Ō½ü4øöŌĀµÄŹż½ųŠŠĮĖĶžŠ²¶ČŃŠÅŠ£¬Õė¶Ō·¢²¼Ź±¼äĒų¼äÉč¶ØĪŖ2019.3.1-3.29£¬Źµ¼ŹŃŠÅŠ½į¹ūČē±ķ4ĖłŹ¾�£ŌŚ´ĖĘŚ¼ä£¬ĻµĶ³¹²²É¼ÆĮĖ110ĢõĻą¹ŲŠĀĪÅŹĀ¼ž£¬¾ĻµĶ³·ÖĪöÓėÅŠ±š£¬ĘäÖŠÓŠ76ĢõĶ»·¢ŹĀ¼žŹōÓŚIV¼¶ĶžŠ²£¬ÓŠ20ĢõŹż¾ŻŹōÓŚIII¼¶ĶžŠ²¶Č£¬II¼¶ĶžŠ²µČ¼¶Źż¾ŻÓŠ9Ģõ£¬ÓŠ5ĢõŹż¾Ż±»ÅŠ¶ØĪŖI¼¶ĶžŠ²¶Č£»²ÉÓĆĶžŠ²¼ĘĖć¹«Ź½µĆ°²±£µČ¼¶ŹżÖµTĪŖ15.6£¬øł¾Ż±ķ1µÄ°²±£µČ¼¶»®·ÖµÄČ�Öµ·¶Ī§£¬Č·¶Ø°²±£µČ¼¶ĪŖIII¼¶�£±ķ4��2019.3.1-3.29ĶžŠ²Źż¾ŻŹżĮæĶ³¼ĘTab. 4��Statistics of threat data during 2019.3.1-3.29[×ÜĮæ\&I¼¶ĶžŠ²ĢõŹż\&II¼¶ĶžŠ²ĢõŹż\&III¼¶ĶžŠ²ĢõŹż\&IV¼¶ĶžŠ²ĢõŹż\&Ō¤¾ÆĢõŹż\&ŃŠÅŠ°²±£µČ¼¶\&110\&76\&20\&9\&5\&14\&III\&]ĻµĶ³ŅŌÉč¶ØµÄURLĮ´½Ó¶ŌĻąÓ¦µÄĶųŅ³ŠĀĪÅŹż¾Ż½ųŠŠ×�Č�£¬æÉŹÓ»Æ½ēĆęČēĶ¼7ĖłŹ¾£¬²É¼ÆµÄ¾ßĢåŹż¾ŻŠÅĻ¢°üĄØŹż¾Ż±źĢā�¢Źż¾ŻÄŚČŻ�¢·¢²¼Ź±¼ä¼°Źż¾ŻµÄĄ´Ō´£¬²¢ŅŌ²ÉČ�Ź±¼äĪŖ»ł×¼´´½ØŹż¾Ż±ąŗÅ�¢´´½ØŹ±¼ä£¬²¢ŌŚÕ¹Ź¾Ņ³ĆęÉčÖĆ¶ŌŹż¾ŻµÄ²Ł×÷¹¦ÄÜ£¬ĄūÓĆÉ¢µćĶ¼ŗĶĢõŠĪĶ¼·Ö±šÕ¹Ź¾½ü1øöŌĀŹż¾Ż·Ö²¼ĒéæöŗĶ½ü4øöŌĀø÷ĶžŠ²¶ČĶ³¼ĘĮæ£¬ŅŌ±ćĪŖČĖ¹¤·ÖĪöĢį¹©²Īæ¼ŅĄ¾Ż�£ĶØ¹żŌ¤¾ÆĻµĶ³£¬´ÓĶ¼ÖŠæÉŅŌÖ±¹ŪµÄæ´³ö£¬½ü4øöŌĀµÄŹż¾ŻÕ¹Ź¾ÖŠIVĄąĶžŠ²ŹĀ¼žĻą±ČĶ»³ö£¬ĒŅŌŚ²āŹŌČÕĘŚĘŚ¼ä£¬IIĄąĶžŠ²ŹĀ¼žŌŚ27µ½30ŗÅÖ®¼ä·¢Éś½Ļ¶ą£¬IIIĄąÖ÷ŅŖ¾ÓÓŚ13µ½23ŗÅ£¬½ØŅéøł¾ŻŹż¾ŻĒéæö£¬Ó¦øĆÕė¶ŌøĆ¶ĪČÕĘŚĄą½įŗĻ³ĒŹŠŹµ¼ŹĒéæöæ±²ģŌŅņ£¬ŅŌ±ć¼°Ź±²ÉČ�ĻąÓ¦´ėŹ©£¬½µµĶĶ»·¢ŹĀ¼ž¶ŌÉē»įŌģ³ÉµÄø÷ĄąĖšŹ§�£ÓÉĻµĶ³µÄŌĖŠŠ½į¹ūæÉæ´³ö£¬ĻµĶ³ÄÜ¹»ŹµĻÖ¶ŌÉč¶Ø×ŹŌ´Źż¾Ż½ųŠŠ²É¼Æ�¢Ō¤´¦Ąķ£¬²¢ĶØ¹żŃµĮ·Ķź±ĻµÄ¾ķ»żÉń¾ĶųĀē¶ŌŹż¾Ż½ųŠŠ·ÖĪöŌ¤¾Æ£¬Ņ²ÄÜ¹»ĶØ¹żæÉŹÓ»ÆÄ£æéŹµĻÖ¶Ō·ÖĪöŗóµÄŹż¾Ż½į¹¹½ųŠŠÕ¹Ź¾£¬×ÜĢåĄ´Ėµ£¬ĻµĶ³ÕūĢåŌĖŠŠĪČ¶ØĒŅŠŌÄÜĮ¼ŗĆ�£4��½į��ĀŪ±¾ĪÄÕė¶Ō»�ĮŖĶų·¢²¼µÄø÷ÖÖĶ»·¢ŹĀ¼ž£¬½įŗĻ³ĒŹŠ°²±£²æĆÅµÄŅµĪńŠčĒó£¬øų³öĮĖæÖ²ĄĶ»·¢ŹĀ¼žĶžŠ²Ō¤¾ÆĻµĶ³µÄÉč¼ĘÓėŹµĻÖ·½°ø�£ĻµĶ³²ÉÓĆÉč¶ØµÄURLĮ´½Ó£¬ĄūÓĆScrapyĶųĀēÅĄ³ęæņ¼ÜŹµĻÖ¶ŌĶ»·¢ŹĀ¼žµÄŹż¾ŻµÄ²É¼Æ£»ĄūÓĆJieBa·Ö´ŹŹµĻÖ¶Ō²É¼ÆµÄµ�ĢõŹż¾Ż½ųŠŠĒåĻ´�¢·Ö´Ź£»²ÉÓĆ½įŗĻĮĖøÄ½ųŠĶ´ŹĘµ-ÄęĪÄ±¾ĘµĀŹ�¢word2vecµÄøÄ½ųŠĶ¾ķ»żÉń¾ĶųĀēÄ£ŠĶŹµĻÖ¶ŌŹż¾ŻĶžŠ²µČ¼¶µÄ·ÖĄą£¬²¢øł¾ŻĶłĘŚŹż¾ŻĘĄÅŠ³öŃŠÅŠĘŚ¼äÄŚµÄ°²±£µČ¼¶£»Ķ¬Ź±ĄūÓĆæÉŹÓ»Æ¼¼Źõ·ÖĄą³ŹĻÖŹż¾ŻŃŠÅŠ½į¹ū�£´Ó¶Ō±Č·ÖĪö¼°Źµ¼ŹŌĖŠŠ½į¹ūĄ´æ´£¬ĻµĶ³ŅŃ»ł±¾´ļµ½ĮĖÉč¼ĘÄæ±ź£¬æÉŅŌ×÷ĪŖĻą¹Ų°²±£²æĆÅµÄĘĄÅŠĶ»·¢ŹĀ¼žøØÖśŌ¤¾ÆŠÅĻ¢ĻµĶ³�£ŗóŠų½«ŌŚŃŠÅŠÄ£ŠĶÓÅ»ÆÉĻÉīČėŃŠ¾æ£¬ŅŌĢįøßĶžŠ²¶ČĘĄÅŠ¾«Č·¶Č£¬½µµĶĖšŹ§Öµ�£