ĪÄÕĀ

�¶Īäŗŗ¹¤³Ģ´óŃ§Ń§±Ø�· 2021Äź06ĘŚ 681-688 ³ö°ęČÕĘŚ£ŗ2021-12-31 ISSN:1674-2869 CN:42-1779/TQ

»łÓŚ¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄĆę²æ±ķĒéŹ¶±š

Ćę²æ±ķĒéŅņĘäÄÜÕęŹµ³ŹĻÖ²¢´«µŻŠÅĻ¢£¬³ÉĪŖČĖĆĒČÕ³£Éś»īµÄÖ÷ŅŖ¹µĶØ·½Ź½Ö®Ņ»£¬ŠÄĄķŃ§¼ŅÄŖŗ²±ņŃŠ¾æ±ķŹ¾£¬ĶØ¹żÓļŃŌČĖĄąÖ»´«µŻ45%µÄŠÅĻ¢£¬°üĄØÓļĘų�¢Óļµ÷�¢æŚŅōµČĘäĖūø½¼ÓĢõ¼ž£¬ĘäÓą55%µÄŠÅĻ¢ŌņĶØ¹żĆę²æ±ķĒéµÄ²»Ķ¬ŠĪĢ¬¼ÓŅŌ³ŹĻÖ�£ĖłŅŌ¼°Ź±µŲ·ÖĪö·¢ŃŌÕßµÄ±ķĒé±ä»Æ£¬æÉŅŌŹ¹ĢżÕß´§Ä¦·¢ŃŌÕßŠÄĄķ×´Ģ¬£¬ĶĘ²ā·¢ŃŌÕßµÄĒéŠ÷£¬½ų¶ųĶĘ¶Ļ·¢ŃŌÕß¶Æ»ś�£ĶØĖ×¶ųŃŌ£¬Ćę²æ±ķĒéŹ¶±šŹĒ½čÖś¼ĘĖć»ś½«ČĖĄąĖ¼Ī¬ÖĒÄÜ»Æ£¬±ćÓŚ´Ł½ųČĖÓėČĖµÄČŗĢå½»»�£¬³ŹĻÖŃŠ¾æ¶ŌĻóĒéøŠµÄ²»Ķ¬ŠĪĢ¬£¬Ź¹ŃŠ¾æÕß½čÖśĆę²æ±ķĒéµÄ²»Ķ¬ŠĪĢ¬Ō¤²āŃŠ¾æ¶ŌĻóµÄĒéŠ÷ŗĶŅāĶ¼�£ČēŗĪČĆ»śĘ÷¶Į¶®ČĖµÄĮ³²æ±ķĒé£¬øÄ±äµ�Ņ»µÄ¼üÅĢŹäČė»ņÕßÓļŅōŹäČėµÄŹäČė·½Ź½£¬ÄÜ¹»Ź¹»śĘ÷Ō½Ą´Ō½ÖĒÄÜ»Æ£¬Āś×ćČĖĄąŌŚČĖ»ś½»»�ÖŠµÄøüøßŠčĒó£¬ĢįøßČĖ»ś½»»�µÄŹęŹŹ¶Č£¬Ģįøß»śĘ÷·žĪńµÄÖŹĮæ£¬ŹĒµ±Ē°ĪŅĆĒŃŠ¾æµÄÖŲŅŖĪŹĢā£Ū1£Ż�£½üÄźĄ´£¬Ćę²æ±ķĒéŹ¶±šµÄŃŠ¾æŗĶÓ¦ÓĆĮģÓņĶŲæķ£¬ŹĒ¼ĘĖć»śŹÓ¾õ�¢ČĖ»ś½»»��¢Ķ¼ĻńŹ¶±šµČĮģÓņµÄÖŲµćŃŠ¾ææĪĢā�£´«Ķ³µÄĶ¼ĻńĢŲÕ÷ĢįČ�·½·Ø£¬ÓŠ¾Ö²æ¶žŌŖÄ£Ź½£Ū2-3£Ż £Ø local binary pattern£¬LBP£©�¢GaborŠ�²Ø½įŗĻĢŻ¶ČÖ±·½Ķ¼±ä»»£Ū4-5£Ż£Øhistogram of oriented gradient£¬HOG£©�¢Ö÷³É·Ö·ÖĪö·Ø£Ū6£Ż £Øprincipal component analysis£¬PCA£©�¢»łÓŚÄ£ŠĶµÄ·½·Ø£Ū7£ŻµČ£¬¶ų´«Ķ³µÄ·½·ØÓÉÓŚ´ęŌŚ¼ĘĖćĮæ´ó�¢Ā³°ōŠŌ²»×ćµČĪŹĢā£¬ŌŚÓ¦ÓĆĀäµŲÖŠ±Č½ĻĄ§ÄŃ�£Ņņ´Ė£¬»łÓŚŹż¾ŻĒż¶ÆµÄĆę²æ±ķĒéŹ¶±šŹÕ»ńĮĖ½Ļ¶ą¹Ų×¢¶Č£Ū8£Ż�£2004Äź£¬AhonenµČ£Ū9£ŻŹ¹ÓĆµÄLBPĖć·Ø±»ÓĆÓŚĆę²æŹ¶±šĮģÓņ£¬ŅŌ»ńµĆøüøßŠ§µÄĢŲÕ÷ĢįČ��£ŌŚŹ¶±š·ÖĄąµÄČĪĪń·½Ćę£¬²ÉÓĆµü´śĖć·Ø£Øadaboost£©ŗĶÖ§³ÖĻņĮæ»ś£ØSVM£©µČ£Ū10£Ż£¬ÕāŠ©¶¼ŹĒČĖĪŖÉč¼ĘµÄŅ»Š©ĢŲÕ÷ĢįČ�·½·Ø£¬´ó¶¼ĖšŹ§ĮĖŌÓŠĶ¼ĻńÖŠµÄŅ»Š©ĢŲÕ÷ŠÅĻ¢£¬Źµ¼Ź¼ģ²āµÄ¾«¶ČŹÜµ½ĮĖŗÜ´óÓ°Ļģ£»LiµČ£Ū11£ŻŹĒĶØ¹żøÄ±ä²»Ķ¬µÄŹż¾Ż¼ÆĄ´ĢįøßČĖĮ³±ķĒéŹ¶±š·ÖĄąČĪĪńµÄ×¼Č·ĀŹ£¬Ź¹ÓĆEMĖć·ØÓĆĄ´¹żĀĖ²»æÉææµÄ±źĒ©�£ŠģĮÕĮÕµČ£Ū12£ŻĢį³öŅ»ÖÖ²¢ŠŠ¾ķ»żÉń¾ĶųĀēĄ´Ėõ¶ĢĶųĀēµÄŃµĮ·Ź±¼ä£¬»ńµĆĮĖ65.6%µÄ¾«¶Č£¬Õāøö²¢ŠŠ½į¹¹¾ßÓŠ3øö²»Ķ¬ĶØµĄ£¬·Ö±šĢįČ�²»Ķ¬Ķ¼ĻńĢŲÕ÷½ųŠŠČŚŗĻŗĶ·ÖĄą£¬Ö÷ŅŖÓ¦ÓĆÓŚ´¦ĄķŌŚŹżĮæ�¢·Ö±ęĀŹ�¢´óŠ�µČ²īŅģ½Ļ´óµÄ±ķĒéŹż¾Ż¼Æ£¬²¢µĆµ½øß×¼Č·ĀŹŗĶĖõ¶ĢŹ±¼ä�£ĖäČ»Źż¾ŻĒż¶ÆµÄ·½·ØĪŖČĖĮ³Ćę²æ±ķĒéŹ¶±šĪŹĢā´ųĄ´ĮĖŗÜ´óµÄŠŌÄÜĢįÉż£¬µ«ŹĒ¶ŌŹż¾Ż´ó¹ęÄ£²É¼ÆÓė±ź×¢Ģį³öĮĖŗÜøßŅŖĒó£¬Ėę×ÅĖłÓĆŹż¾ŻÄ£ŠĶø´ŌÓ¶ČŌö´ó£¬¹Ų×¢µÄĪŹĢā¾Ķ×ŖŅĘµ½ĮĖŠŌÄÜµÄĢįÉż�£ŗś²½·¢µČ£Ū13£ŻŌŚĆę²æ±ķĒéŹ¶±šČĪĪńÖŠŅżČėøß²ćÓļŅåŠÅĻ¢£¬´Ó¶ųĢįøßĮĖĆę²æ±ķĒéµÄŹ¶±šĀŹ�£ÖģČšµČ£Ū14£ŻĄūÓĆÉī¶ČŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄĻą½įŗĻŌŚĶĘ¼öĮģÓņŹÜµ½¹ć·ŗ¹Ų×¢�£Éī¶ČŃ§Ļ°ÓėÖŖŹ¶Ķ¼Ę×¼¼ŹõµÄ½įŗĻæÉŅŌĶ¬Ź±·¢»ÓŹż¾ŻĒż¶ÆÓėÖŖŹ¶ĶĘĄķµÄ¹¦ÄÜ£¬½ų¶ųĢįøßÄ£ŠĶµÄ·ŗ»ÆÄÜĮ¦�£»łÓŚµ±Ē°Ćę²æ±ķĒéŹ¶±šµÄ¹Ų×¢ĪŹĢā£¬ĪŖ½ųŅ»²½ĢįøßÄ£ŠĶµÄ×¼Č·ĀŹÓėĀ³°ōŠŌ£¬±¾ĪÄĢį³öŅ»ÖÖ»łÓŚ¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄĆę²æ±ķĒéŹ¶±š·½·Ø£Ømulti-task learning algorithm model£¬ MLAM£©£¬øĆ·½·ØĶØ¹ż·Ö±š¹¹½Ø»łÓŚŹż¾ŻµÄŌ¤²āÄ£ŠĶŗĶ»łÓŚÖŖŹ¶µÄĶ¼Ę×ĶĘĄķ»śÖĘ£¬½«¶žÕß½ųŠŠńīŗĻ£¬½ų¶ųŹµĻ°¶ąČĪĪńŃ§Ļ°µÄÄæ±ź�£øł¾Ż²»Ķ¬ČĖµÄĒéŠ÷±ķÕ÷£¬²»Ķ¬ÖÖ×å�¢ŠŌ±š�¢ÄźĮä�¢¹¤×÷µÄČĖŌŚ±ķ´ļĒéŠ÷Ź±Ćę²æ±ķĒé¶¼ÓŠÄ³ÖÖŅž²ŲĢŲÕ÷£Ø¾Ö²æ±ķĒé£©£¬±¾ĪÄĢį³ö¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄĆę²æ±ķĒéŹ¶±š·½·Ø�£±ČČē£¬¶«·½ČĖŗĶĪ÷·½ČĖŌŚ±ķĒéÉĻ¾Ķ»įÓŠŗÜ´óµÄ²īŅģ£¬Ī÷·½ČĖøüĘ«°®ÓĆæäÕÅµÄ±ķĒé±ķ´ļ³öĻ²Å°§ĄÖ£¬¶ų´«Ķ³µÄÉī¶ČŃ§Ļ°·½·ØĪ´æ¼ĀĒøöĢåµÄ²īŅģ£¬ĖłŅŌ±¾ĪÄŅż½ųĮĖÖŖŹ¶Ķ¼Ę×ŌĖÓĆµ½Éī¶ČŃ§Ļ°µÄ¼¼Źõµ±ÖŠ�£ÄæĒ°µÄÉī¶ČŃ§Ļ°æņ¼ÜŅŃ¾æÉŅŌĶź³É¶Ėµ½¶ĖŹµĢåÖ®¼äµÄŹ¶±š�¢¹ŲĻµ³éČ��¢¹ŲĻµČŚŗĻ�¢¹ŲĻµ²¹Č«µČČĪĪń£¬´´½ØÖŖŹ¶Ķ¼Ę×�£±¾ĪÄĢį³öµÄ·½·ØæÉŅŌ»łÓŚÖŖŹ¶Ķ¼Ę×½ØĮ¢ĘšĒéŠ÷±ķÕ÷ÓėøöĢåµÄĮŖĻµ£¬½ų¶ųĢįøßČĖĮ³ĒéŠ÷Ź¶±šµÄŠŌÄÜ�£1��»łÓŚ¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄĆę²æ±ķĒéŹ¶±šÓÉÓŚ´«Ķ³Ćę²æŹ¶±šĖć·ØµÄ¾ÖĻŽŠŌ£¬ČĖĪŖøÉČÅŅņĖŲ½Ļ´ó£¬Ėć·ØµÄĀ³°ōŠŌŗĶŹ¶±š¾«¶Č¶¼ÓŠ´żĢįøß�£±¾ĪÄĢį³öMLAMĖć·Ø£¬øĆĖć·ØŹĒŅ»øö¶Ė¶Ō¶ĖµÄĶØÓĆÉī¶ČŹ¶±šæņ¼Ü£¬øĆæņ¼ÜĶź³ÉČĖĮ³±ķĒéŹ¶±šµÄÖ÷ĢåČĪĪń�£Ķ¬Ź±ŅżČėÖŖŹ¶Ķ¼Ę×Ē¶ČėČĪĪń×÷ĪŖøØÖśŹ¶±šČĪĪń£¬ÖŖŹ¶Ķ¼Ę×½«ČĖĮ³Ź¶±šÖŠ·Ē³£ÖŲŅŖµÄĒéŠ÷ŅņĖŲŅŌÖŖŹ¶µÄŠĪŹ½½ųŠŠ´ę´¢£¬²¢ÓĆÓŚĢįøßÉī¶ČŃ§Ļ°µÄŌ¤²ā×¼Č·ĀŹ�£ÖŖŹ¶Ķ¼Ę×ŗĶĶ¼ĻńŹ¶±šÕāĮ½øö×ÓČĪĪńĖäČ»ŹĒ¶ĄĮ¢ŃµĮ·Óė¹¤×÷µÄ£¬µ«ŹĒ±¾ĪÄÉč¼ĘĮĖŅ»ÖÖ½»²ęŃ¹Ėõµ�ŌŖ½«Į½øöÄ£æé½ųŠŠńīŗĻ£¬½ų¶ųŹµĻÖŌŚŹ¶±šĖć·ØÖŠµÄ¾Ö²æ±ķĒé£Øitem£©ÓėÖŖŹ¶Ķ¼Ę×ÖŠµ�øö»ņÕß¶ąøöŹµĢå£Øentity£©Ö®¼äµÄ¹ŲĮŖ�£½«ĶĘ¼öĖć·ØÖŠµÄÓĆ»§£Øuser£©ÓėĪļĘ·£Øitem£©´´ŠĀŠŌŅżČėČĖĮ³Ź¶±šĮģÓņ£¬·Ö±šÓĆÓŚ±ķŹ¾´żŹ¶±š¶ŌĻó£ØøöĢå£©Óė¾Ö²æ±ķĒé£¬²¢²ÉÓĆÖŖŹ¶Ķ¼Ę×¹¹½Ø¶žÕßÖ®¼äµÄ¹ŲĻµ�£ÖŖŹ¶Ķ¼Ę×µÄŅżČėĪŖČĖĮ³Ź¶±šĢį¹©ĮĖŅ»øöÖŖŹ¶æā£¬²»½öæÉŅŌ½ØĮ¢ĘšøöĢåÓėøöĢåÖ®¼äµÄ¹ŲĻµ£¬¶ųĒŅæÉŅŌ±ķÕ÷øöĢåÓė¾Ö²æ±ķĒéÖ®¼äµÄ¹ŲĻµ£¬°ļÖśČĖĮ³Ź¶±šŌ¤²āÄ£ŠĶøüŗĆµŲĶź³ÉČĪĪń�£ĪŖĮĖ¶Ō¾Ö²æ±ķĒéŗĶøöĢåÖ®¼äµÄ¹²ĻķĢŲÕ÷½ųŠŠ½ØÄ££¬±¾ĪÄMLAMĖć·ØĢį³öĮĖ½»²ęŃ¹Ėõµ�ŌŖ£Øcross & compression unit£©£¬æÉŅŌ½ØĮ¢¾Ö²æ±ķĒé£Øitem£©ŗĶøöĢå£Øentity£©ĢŲÕ÷Ö®¼äµÄøß½×½»»�£¬²¢×Ō¶ÆæŲÖĘĮ½øöČĪĪńµÄ½»²ęÖŖŹ¶×ŖŅĘ�£Ź¹ÓĆ½»²ęŃ¹Ėõµ�ŌŖŗó£¬¾Ö²æ±ķĒé£Øitem£©ŗĶøöĢå£Øentity£©µÄ±ķÕ÷æÉŅŌĻą»�²¹³ä£¬±ÜĆāĮ½øöČĪĪń²śÉś¹żÄāŗĻŗĶŌėÉł£¬²¢Ģįøß·ŗ»ÆÄÜĮ¦�£MLAMĖć·ØµÄ¹¤×÷ŌĄķ½éÉÜČēĻĀ�£1.1��Ä£ŠĶæņ¼ÜMLAMÄ£ŠĶæņ¼ÜČēĶ¼1ĖłŹ¾£¬Ö÷ŅŖ°üĄØ3øöÄ£æé£ŗŹ¶±šÄ£æé�¢ÖŖŹ¶Ķ¼Ę×Ē¶ČėÄ£æéÓė½»²ęŃ¹Ėõµ�ŌŖ£¬ĘäÖŠ×ó²ąĪŖŹ¶±šČĪĪń£¬ÓŅ²ąŹĒÖŖŹ¶Ķ¼Ę×ĢŲÕ÷Ń§Ļ°ČĪĪń�£Ėć·ØÕūĢåæņ¼ÜĶØ¹ż½»ĢęÓÅ»ÆĮ½øöČĪĪńµÄ²»Ķ¬ĘµĀŹ½ųŠŠŃµĮ·£¬ŅŌĢįøßMLAMĖć·ØŌŚÕęŹµ»·¾³ÖŠµÄĮé»īŠŌŗĶŹŹÓ¦ŠŌ�£[Target][Predicted probability][Y][t][Tail][Predicted tail][f][Cross & compress units ][±ķĒé][ĒéŠ÷][ČżŌŖ×éĶ·²æ][¹ŲĻµ][UL][U][[UL£¬VL]][VL][V1][V][C][C][hL][h1][h][rL][r][��][��][��][��][��]Ķ¼1��MLAMŹ¶±šĖć·Øæņ¼ÜFig. 1��Framework of MLAM recognition algorithm1.2��Ź¶±šÄ£æéŹ¶±šÄ£æéµÄŹäČėĪŖ±ķĒéŹ¶±šÕßĻņĮæUÓėĒéŠ÷±ķÕ÷ĻņĮæV£¬Źä³öĪŖ±ķĒéŹ¶±šÕß¶ŌÓŚĒéŠ÷±ķÕ÷µÄĒéŠ÷±ķÕ÷ĀŹY£¬Ä£æé·ÖĪŖlow-levelŗĶhigh-levelĮ½²æ·Ö£¬ĘäÖŠlow-level²æ·ÖŹ¹ÓĆ¶ą²ćøŠÖŖĘ÷ £Ømulti-lay perceptron£¬MLP£©´¦Ąķ±ķĒéŹ¶±šÕßµÄĢŲÕ÷UL£¬ĒéŠ÷±ķÕ÷²æ·ÖŹ¹ÓĆ½»²ęŃ¹Ėõµ�ŌŖĄ´½ųŠŠ´¦Ąķ£¬·µ»ŲŅ»ĆÅĒéŠ÷±ķÕ÷µÄĢŲÕ÷YL£¬×īŗó½«ULÓėVLĘ´½Ó£¬ĶØ¹żŹ¶±šĖć·ØÖŠµÄŗÆŹżfRS£¬Źä³öĒéŠ÷±ķÕ÷Ō¤²āÖµ£Ū15-16£Ż�£¶ŌÓŚøų¶Ø±ķĒéŹ¶±šÕßµÄ³õŹ¼ĢŲÕ÷ĻņĮæU£¬Ź¹ÓĆL½×µÄMLPĢįČ�ĘäĢŲÕ÷£ŗ[UL=M(M[???M(U)]=ML(U)] £Ø1£©[VL=Ee~s(u)CL(C, e)[C]] £Ø2£©[Yuv=¦Ņ[fRS(UL,VL)]] £Ø3£© [M(x)=¦Ņ(Wx+b)] £Ø4£©ĘäÖŠµÄ[M(x)=¦Ņ(Wx+b)]ĪŖČ«Į¬½ÓÉń¾ĶųĀē²ć£¬ČØÖŲĪŖW£¬Ę«ÖĆĪŖbŅŌ¼°·ĒĻßŠŌ¼¤»īŗÆŹż[¦Ņ(?)]£¬ŌŚĒéŠ÷±ķÕ÷VÖŠŹ¹ÓĆL½×½»²ęŃ¹Ėõµ�ŌŖĢįČ�ĢŲÕ÷�£1.3��ÖŖŹ¶Ķ¼Ę×Ē¶ČėÄ£æéÖŖŹ¶Ķ¼Ę×Ē¶ČėÄ£æé£Ū17£Ż¾ĶŹĒ½«ČżŌŖ×éµÄĶ·²æŗĶ¹ŲĻµĒ¶Čėµ½Ņ»øöĻņĮææÕ¼äÖŠ£¬Ķ¬Ź±±£Įō½į¹¹£¬¶ŌÓŚÖŖŹ¶Ķ¼Ę×Ē¶ČėÄ£ŠĶ£¬ĻÖÓŠµÄŃŠ¾æĢį³öĮĖŅ»øöÉī¶ČÓļŅåĘ�Åä¼Ü¹¹£¬ÓėŹ¶±šÄ£æéĄąĖĘ£¬øł¾Żøų¶ØÖŖŹ¶Ķ¼Ę×GŅŌ¼°ŹµĢå-¹ŲĻµ-ŹµĢåČżŌŖ×é£Øh£¬r£¬t£©£¬ĘäÖŠ·Ö±šĶØ¹ż½»²ęŃ¹Ėõµ�ŌŖÓė·ĒĻßŠŌ²ć´¦ĄķČżŌŖ×éĶ·²æhŗĶ¹ŲĻµrµÄ³õŹ¼ĢŲÕ÷ĻņĮæ�£Ö®ŗó½«Ē±ŌŚĢŲÕ÷¹ŲĮŖŌŚŅ»Ęš£¬×īŗóÓĆK½×MLPŌ¤²āĪ²²æt£ŗ[hL=Ee~s(h)CL(V, h)[e]] £Ø5£©[rL=ML(r)] £Ø6£©[t=MkhLrL] £Ø7£©ĘäÖŠS£Øh£©ĪŖhµÄ¹ŲĮŖĻī¼ÆŗĻ£¬[t]ĪŖøł¾ŻĪ²²ætµĆ³öµÄŌ¤²āĻņĮæ�£1.4��½»²ęŃ¹Ėõµ�ŌŖ½»²ęŃ¹Ėõµ�ŌŖ£Ū18£ŻŹĒĪŖĮĖÄ£Äā¾Ö²æ±ķĒé£Øitem£©ŗĶŹµĢå£Øentity£©Ö®¼äµÄĢŲÕ÷½»»�£¬ĘäÖ»´ęŌŚÓŚMLKRĖć·ØµÄ³õŹ¼½×²ćÖŠ£¬ÓÉÓŚĆę²æŹ¶±šĖć·ØÖŠµÄĒéŠ÷±ķÕ÷£Øitem£©ŗĶÖŖŹ¶Ķ¼Ę×Ē¶ČėÄ£æéÖŠµÄŹµĢå£Øentity£©ÓŠ¶ŌÓ¦¹ŲĻµ£¬²¢ĒŅÓŠ×Å¶ŌĶ¬Ņ»ĒéŠ÷±ķÕ÷£Øitem£©µÄĆčŹö£¬ĘäÖŠembeddingĻąĖĘ¶Č¼«øß£¬¼´æÉŅŌ±»Į¬½Ó£¬ÓŚŹĒÖŠ¼äĆæŅ»²ć¶¼Ź¹ÓĆ½»²ęŃ¹Ėõµ�ŌŖ×÷ĪŖĮ¬½ÓµÄ½įŗĻ�£ČēĶ¼2ĖłŹ¾£¬L²ćµÄŹäČėĪŖĒéŠ÷±ķÕ÷itemµÄembedding [VL]ŗĶŹµĢåµÄembedding [eL]£¬ĻĀŅ»²ćµÄŹä³öĪŖembedding£¬½»²ęŃ¹Ėõµ�ŌŖÄ£æé·ÖĪŖĮ½²æ·Ö£ŗ½»²ęĢŲÕ÷¾ŲÕó£Øcross£©ŗĶŃ¹Ėõ²ć£Øcompress£©£¬ĘäÖŠ½»²ęĢŲÕ÷¾ŲÕó£Øcross£©½«[VL]£¬[eL]½ųŠŠŅ»´Ī½»²ę£¬[VL]ĪŖd�Į1µÄĻņĮæ£¬[eL]ĪŖ1�ĮdµÄĻņĮæ£¬¾ŲÕó¼ĘĖćŗó»ńµĆd�ĮdµÄ¾ŲÕó[CL]�£Ń¹Ėõ²ć£Øcompress£©½«½»²ęŗóµÄ¾ŲÕó[CL]ÖŲŠĀŃ¹Ėõ»Ųembedding space£¬²¢ĶØ¹ż²ĪŹż[WL]Ń¹ĖõŹä³ö[VL+1]£¬[eL+1] £Ū19-20£Ż�£[VL=VLeTL=VL(1)eL(1)???VL(1)eL(d)??VL(d)eL(1)???VL(d)eL(d)] £Ø8£©[ VL+1=CLwVVL+CTLwEVL+bVL=Ve¦³LwVVL+][V¦³eLwEVL+bVL] £Ø9£©[eL+1=CLwVEL+CTLwEEL+bEL=Ve¦³LwVEL+] [V¦³eLwEEL+bEE] £Ø10£©[[VL+1,eL+1]=C(VL,eL)] £Ø11£©1.5��ŃµĮ·¹ż³ĢMLAMĖć·ØµÄĶźÕūµÄĖšŹ§ŗÆŹżĪŖ[?=?RS+?KG+?REG=u�ŹU,v�ŹV¦Ģ(yuv, yuv)-¦Ė1((h,r,t)�ŹGscore(h, r, t)-] [(h�Æ,r�Æ,t�Æ)?Gscore(h�Æ, r�Æ, t�Æ))+¦Ė2W] £Ø12£©ŌŚ¹«Ź½£Ø12£©ÖŠ£¬µŚŅ»Ļī²āĮæČĖĮ³Ź¶±šÄ£æéÖŠµÄĖšŹ§£¬ĘäÖŠuŗĶv·Ö±š±éĄśÓĆ»§ŗĶ±ķĒéĢŲÕ÷£¬¦ĢŹĒ½»²ęģŲŗÆŹż�£µŚ¶žĻī¼ĘĖćÖŖŹ¶Ķ¼Ę×ĢŲÕ÷Ń§Ļ°Ä£æéÖŠµÄĖšŹ§£¬Äæ±źŹĒĢįøßĖłÓŠÕżČ·ČżŌŖ×éµÄ·ÖŹż£¬¼õÉŁĖłÓŠ´ķĪóČżŌŖ×éµÄ·ÖŹż£¬×īŗóŅ»ĻīŹĒ·ĄÖ¹¹ż¶ČÄāŗĻµÄÕżŌņĻī�£[¦Ė1]ŗĶ[¦Ė2]ŹĒČØŗā²ĪŹż£¬ĪŖĢįøß¼ĘĖćŠ§ĀŹ£¬ŃµĮ·¹ż³ĢÖŠ²ÉÓĆøŗ²ÉŃł¼¼Źõ�£ŌŚŹ¶±šĖć·Ø²æ·ÖÖŠ£¬ŹäČėµÄŹĒ±ķĒéŹ¶±šÕßUŗĶĒéŠ÷±ķÕ÷V£¬ÓĆ±ķĒéŹ¶±šÕß¶ŌĒéŠ÷±ķÕ÷µÄøŠŠĖČ¤µÄøÅĀŹ×÷ĪŖŹä³ö£¬±ćÓŚøüŗĆĢåĻÖ³öŌ¤²āÄ£ŠĶŌŚČĖĮ³Ź¶±šÖ÷¹ŪŠŌ·½ĆęµÄæ¼Įæ�£ĪŖĮĖ½ØĮ¢ĒéŠ÷ĢŲÕ÷µÄøöĢå²īŅģŠŌ£¬±¾ĪÄÉč¼Ę½»²ęŃ¹Ėõµ�ŌŖ£¬½»²ęŃ¹Ėõµ�ŌŖ´ī½ØĘšŌ¤²āÄ£ŠĶÓėÖŖŹ¶Ķ¼Ę×Ö®¼äµÄĒÅĮŗ£¬ŹµĻÖĮ½øöÄ£æéÖ®¼äµÄŠÅĻ¢¹²Ļķ�£ŌŚ½»ĢęŃ§Ļ°µÄ¹ż³ĢÖŠ£¬·Ö±š¹Ģ¶ØŹ¶±šĖć·ØÄ£æéµÄ²ĪŹżŗĶÖŖŹ¶Ķ¼Ę×µÄ²ĪŹż£¬Ķ¬Ź±ŃµĮ·ĮķŅ»øöÄ£æéµÄ²ĪŹż£¬ĶØ¹żĄ´»Ų½»ĢęŃµĮ·µÄ·½Ź½£¬Ź¹ĖšŹ§²»¶Ļ¼õŠ��£ĘäÖŠĄūÓĆÄ£ŠĶ½ųŠŠŃ§Ļ°µÄ¹ż³Ģ°üĄØ¶ą´Īµü´ś£¬ĪŖĮĖ½«Ź¶±šĖć·ØµÄŠŌÄÜ¾�æÉÄÜ´ļµ½×īÓÅ£¬ŌŚĆæ´Īµü´ś¹ż³ĢÖŠ£¬½»Ģę¶ŌĆę²æŹ¶±šÄ£æéŗĶÖŖŹ¶Ķ¼Ę×Ä£æé½ųŠŠŃµĮ·�£¶ŌÓŚĆæ´ĪµÄµü´śÖŠĮ½øöÄ£æéµÄŃµĮ·¶ųŃŌ£¬¾łŹĒĶØ¹żŅŌĻĀµÄ¼øøö²½Öč£ŗŌŚŅ»øöŃµĮ·ĀÖÖŠ·ÖĪŖĮ½øö½×¶Ī£ŗĆę²æŹ¶±šÄ£æéŗĶÖŖŹ¶Ķ¼Ę×ĢŲÕ÷Ń§Ļ°Ä£æé�£Ź×ĻČ´ÓŹäČėŹż¾ŻÖŠĢįČ�Š�²æ·Ö£¬¶ŌĒéŠ÷±ķÕ÷itemŗĶhead·Ö±šĢįČ�ĢŲÕ÷Öµ£¬ĄūÓĆĢŻ¶ČĻĀ½µ£Øgradient descent£©Ėć·ØøüŠĀ×īÖÕŌ¤²āŗÆŹżÖµ�£ŌŚĆæ´Īµü´śµÄ¹ż³ĢÖŠ£¬Ź×ĻČ¶ŌŹ¶±šĖć·ØÄ£æéŃµĮ·i£Øi >1£©´Ī£¬Č»ŗó¶ŌÖŖŹ¶Ķ¼Ę×Ä£æéŃµĮ·1´Ī£¬ŅņĪŖøü¹Ų×¢ÓŚĢįÉżŹ¶±šŠŌÄÜ�£MLAMĖć·ØÖ÷ŅŖµÄŃµĮ·¹ż³ĢČēĻĀ£ŗ1£©Ź×ĻČ¹¹½Ø·ÖĄąŹ¶±šĪÄ¼žYŗĶÖŖŹ¶Ķ¼Ę×G£»2£©ĶØ¹żMLAMÄ£ŠĶ¶ŌŹż¾Ż½ųŠŠŃ§Ļ°£¬µĆ³öŌ¤²āÄ£ŠĶ£»3£©Ō¤²ā±ķĒéŹ¶±šÕßU¶ŌĒéŠ÷±ķÕ÷VøŠŠĖČ¤µÄøÅĀŹ£»4£©½«Ź¶±šĖć·ØŗĶÖŖŹ¶Ķ¼Ę×·Ö±šŹÓ×÷Į½øö·ÖĄėČĪĪń£¬´Ó¶ų¶ŌĮ½øöÄ£æé½ųŠŠ½»ĢęŃ§Ļ°�£2��ŹµŃé²æ·Ö2.1��ČĖĮ³Źż¾Ż¼Æ2.1.1��CK+Źż¾Ż¼Æ��Cohn-Kanade+Źż¾ŻæāŹĒŌŚCohn-KanadeÉĻĄ©Õ¹¶ųĄ´µÄ£¬ŹĒ±ķĒéŹ¶±šÖŠ±Č½Ļ³£ÓĆµÄŹż¾Żæā�£Ėü»łÓŚCohn-KandaŹż¾Ż¼Æ£¬ÓÉ123øö²āŹŌŌ±µÄ593øöĶ¼ĻńŠņĮŠ×é³É�£²āŹŌČĖŌ±øł¾ŻŅŖĒóÖĘ×÷ĮĖ23øöĆę²æ¶Æ×÷ŠņĮŠ�£Õāøö¹ż³ĢÖŠĆæøö²āŹŌČĖŌ±Ķ¼ĻńŠņĮŠŹżĮæ²»¾�ĻąĶ¬£¬×īÉŁ10 Ö�£¬×ī¶ąæÉ´ļ60Ö��£Źż¾ŻæāÖŠ°üĄØĮĖÄźĮä18�«30 ĖźµÄŃĒÖŽŗĶ·ĒÖŽČĖ£¬ĘäÖŠÅ®ŠŌŃł±¾¾Ó¶ą£¬±¾ĪÄ½«øĆŹż¾Ż¼ÆµÄ20%»®·ÖĪŖ²āŹŌ¼Æ£¬80%ÓĆÓŚŃµĮ·Ä£ŠĶ£Ū21£Ż�£2.1.2��FER2013 Źż¾Ż¼Æ��FER2013Źż¾ŻæāŹĒKaggle±ČČüµÄŹż¾Ż¼Æ£¬´ĖŹż¾ŻæāĪŖ.csvĪÄ¼ž£¬Ź¹ÓĆÖ®Ē°ŠčŅŖŹ×ĻČ½ųŠŠøńŹ½×Ŗ»»£¬ĢįČ�³öĻąÓ¦µÄŃł±¾¼Æ�£ŌĶ¼ĻńŹĒ48 �Į 48 µÄ»Ņ¶ČĶ¼Ļń£¬×Ü¹²ÓŠ7ĄąĒéøŠ�£ŌŚŹż¾ŻæāÖŠ£¬øĆŹż¾Ż¼ÆÓŠ´óĮæĶźÕūµÄĆę²æ±ķĒéŹż¾Ż£¬²»½ö°üĄØÕęŹµµÄĆę²æ±ķĒéĶ¼Ļń£¬»¹°üĄØæØĶØ±ķĒéĶ¼Ļń�£øĆŹż¾Ż¼Æ¹² °üŗ¬35 887ÕÅČĖĮ³Ķ¼Ę¬£¬ĘäÖŠŃµĮ·¼Æ28 709ÕÅ£¬ŃéÖ¤¼Æ3 589ÕÅ£¬²āŹŌ¼Æ3 589ÕÅ�£2.2�� ŹµŃé½į¹ūÓė·ÖĪö2.2.1��Ä£ŠĶ²āŹŌ½į¹ū·ÖĪö��øĆĪÄŹµŃéŹĒ»łÓŚPython3.8°ę±¾ĻĀµÄPyTorchæņ¼Ü£¬Ó²¼žÅäÖĆĪŖNVIDIA GTX3080�£ĪŖĮĖŃéÖ¤±¾ĪÄĖć·ØµÄÓŠŠ§ŠŌŗĶÕżČ·ŠŌ£¬´Ó¶ų½ųŠŠĮĖ¶ą´ĪŹµŃéŃéÖ¤£¬øĆŹµŃéŹ×ĻČ²ÉÓĆFER2013Źż¾Ż¼Æ½ųŠŠÄ£ŠĶŃµĮ·£¬øĆŹż¾Ż¼ÆÖŠ¹²¼Ę35 887ÕÅ±ķĒéĶ¼Ę¬£¬¶ųĒŅ¶¼ŹĒÕżĆęÅÄÉćµÄĶ¼Ę¬£¬±ÜĆāĮĖŅņĪŖ½Ē¶Č�¢¹āÕÕ¶ųŅżĘšµÄĪó²īĪŹĢā�£ÓÉÓŚŹż¾Ż¼ÆÖŠµÄĶ¼Ę¬¶¼ŹĒĖę»śÅÅĮŠµÄ£¬ĖłŅŌÖ±½ÓČ�Ē°28 709ÕÅĶ¼Ę¬×öŃµĮ·¼ÆŃµĮ·Ä£ŠĶ£¬Č�ŗó3 589ÕÅĶ¼Ę¬×ö²āŹŌ¼Æ£¬Ęä´ĪÓĆCK+Źż¾Ż¼Æ½ųŠŠ¶Ō±Č²ĪÕÕ£¬ŹµŃé½į¹ū¶Ō±ČČē±ķ1ŗĶ±ķ2ĖłŹ¾�£±ķ1��»łÓŚFER2013Źż¾Ż¼ÆµÄŹµŃé½į¹ūTab. 1��Experimental results based on FER2013 data set[±ķĒé ŃµĮ·Ńł±¾Źż ²āŹŌŃł±¾Źż Ź¶±šÕżČ·ĀŹ ÉśĘų 3 995 958 0.633 Ńį¶ń 436 111 0.672 æÖ¾å 4 097 1024 0.642 øßŠĖ 7 215 1774 0.686 Õż³£ 4 965 1233 0.613 ÉĖŠÄ 4 830 1247 0.612 ¾ŖŃČ 3 171 831 0.684 ]±ķ2��»łÓŚCK+Źż¾Ż¼ÆµÄŹµŃé½į¹ūTab. 2��Experimental results based on CK+ data set[±ķĒé ŃµĮ·Ńł±¾Źż ²āŹŌŃł±¾Źż Ź¶±šÕżČ·ĀŹ ÉśĘų 122 13 0.930 Ńį¶ń 160 5 0.972 æÖ¾å 68 17 0.933 øßŠĖ 187 7 0.981 ÉĖŠÄ 76 20 0.910 ¾ŖŃČ 225 8 0.983 Õż³£ 49 24 0.888 ]´Ó±ķ1æÉæ´³ö£¬±¾ĪÄÄ£ŠĶ¶ŌæŖŠÄŗĶ¾ŖŃČĮ½ÖÖ±ķĒéŹ¶±š×¼¶Č×īøß£¬FER2013Źż¾Ż¼Æ·Ö±šĪŖ0.686ŗĶ0.684£¬CK+Źż¾Ż¼Æ·Ö±šĪŖ0.981ŗĶ0.984�£µ«¶Ō±ÆÉĖŗĶæÖ¾åŹ¶±š×¼Č·ĀŹ½ĻµĶ£¬FER2013Źż¾Ż¼Æ·Ö±šĪŖ0.612ŗĶ0.642£¬CK+Źż¾Ż¼Æ·Ö±šĪŖ0.910ŗĶ0.934�£ĶØ¹ż¶ŌFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼Æ½éÉÜ£¬²¢½ųŠŠŹż¾ŻŌ¤´¦Ąķ£¬ŅżČė¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×±ķĒéŹ¶±šĖć·ØÄ£ŠĶ£¬ĄūÓĆŃµĮ·Ä£ŠĶŌŚ²»Ķ¬µÄŹż¾Ż¼ÆÉĻ½ųŠŠ²āŹŌ£¬²ÉÓĆ¶ąÖÖĘĄ¼ŪÖø±ź½ųŠŠŗāĮæ£¬²¢Óė¶ąÖÖ½ĻŠĀ±ķĒéŹ¶±š·½·Ø±Č½Ļ£¬½ų¶ųÖ¤Ć÷·½·ØÓŠŠ§ŠŌ�£Ķ¼3ĪŖ±¾ĪÄ»łÓŚ¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄ±ķĒéŹ¶±šÄ£ŠĶŌŚFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆÉĻµĆ³öµÄŃµĮ·ŃéÖ¤¾«¶ČĒśĻßĶ¼�£ÓÉĶ¼3æÉÖŖ£¬»łÓŚ¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄ±ķĒéŹ¶±šÄ£ŠĶ¾ßÓŠĮ¼ŗĆµÄŃ§Ļ°ÄÜĮ¦£¬µ±ŃµĮ·´ĪŹżŌö¼Ó£¬ŃéÖ¤¾«¶ČŗĶŃéÖ¤ĖšŹ§Ņ²ĖęŃµĮ·¾«¶ČŗĶŃµĮ·ĖšŹ§Öµ±ä»Æ£¬ÕūøöŃµĮ·¹ż³Ģ²¢Ī´³öĻÖĒ·ÄāŗĻŗĶ¹żÄāŗĻĻÖĻó£¬ĒŅŌŚĮ½øöŹż¾Ż¼ÆÉĻ±ķĻÖ½ĻŗĆ£¬ĖµĆ÷±¾ĪÄĢį³öµÄ»łÓŚ¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄ±ķĒéŹ¶±šÄ£ŠĶ¾ßÓŠĮ¼ŗĆµÄ·ŗ»ÆÄÜĮ¦ŗĶŃ§Ļ°ÄÜĮ¦�£ŌŚFER2013ŗĶCK+Źż¾Ż¼ÆÉĻ£¬ÓĆ±¾ĪÄÄ£ŠĶ½ųŠŠŹµŃéŗĶŠŌÄÜ·ÖĪö£¬½į¹ū·Ö±šČē±ķ3ŗĶ±ķ4 ĖłŹ¾£¬±ķÖŠµÄ×¼Č·ĀŹ±ķŹ¾ĆæøöĄą±šŌ¤²āÕżČ·µÄ×¼Č·ĀŹ£» ÕūĢå×¼Č·ĀŹ±ķŹ¾7øöĄą±šµÄŌ¤²āÕżČ·µÄĘ½¾ł×¼Č·ĀŹ£» ČØÖŲĘ½¾łÖµ±ķŹ¾ø÷ŹżÖµ³ĖŅŌĻąÓ¦ČØÖŲ£¬Č»ŗó¼Ó×ÜĒóŗĶ£¬ŌŁ³żŅŌ×Üµ�Ī»Źż£» ŹżĮæ±ķŹ¾ĆæŅ»øöĄą±šŌ¤²āµÄŹżĮæ�£ŠčŅŖĖµĆ÷µÄŹĒ£¬ÓÉÓŚFER2013Źż¾Ż¼Æ´ęŌŚ×Å²æ·Ö±źĒ©´ķĪó£¬µ¼ÖĀŌŚøĆŹż¾Ż¼ÆÉĻ½ųŠŠ²āŹŌ£¬ĖłŅŌĶØ³£µĆµ½µÄ·ÖĄą¾«¶Č²»øß�£Č»¶ų£¬×÷ĪŖŅ»øö½Ļ´óČĖĮ³±ķĒéŹż¾Ż¼Æ£¬øĆŹż¾Ż¼ÆŌŚĆę²æ±ķĒéŹ¶±šĮģÓņČŌ¹ć·ŗÓ¦ÓĆ�£ÓÉ±ķ3æÉ¼ū£¬Ńį¶ńĄą�¢æÖ¾åĄą�¢Õż³£ĄąµÄ¾«Č·ĀŹŗĶÕŁ»ŲĀŹĻą²ī½Ļ´ó£¬ÕūĢå×¼Č·ĀŹÖ»ÓŠ0.671£¬ÕāÓėFER2013Źż¾Ż¼Æ´ęŌŚ±źĒ©´ķĪóŗĶŹż¾Ż¼ÆĄļµÄŃł±¾´ķĪóÓŠ½Ļ´ó¹ŲĻµ�£ÓÉ±ķ4æÉæ´³ö£¬±¾ĪÄ·½·Ø¶ŌŹż¾Ż¼ÆÖŠĆæŅ»ĄąµÄ·ÖĄą¾«Č·ĀŹ�¢»Ų¹éĀŹŗĶF1Öµ¶¼½Ļøß£¬ÕūĢå×¼Č·ĀŹ´ļ0.987�£øßŠĖ�¢¾ŖŃČŗĶŃį¶ńµÄ±ķĒéŗÜČŻŅ×Ź¶±š£¬¶ųĘäÓąµÄ±ķĒéŌņ²»Č»�£Ķ¬Ź±£¬´ó¶ąŹż»ģĻż·¢ÉśŌŚ·ßÅŗĶŃį¶ń£¬±ÆÉĖŗĶ·ßÅŅŌ¼°æÖ¾åŗĶ¾ŖŃČµÄ±ķĒéÖ®¼ä�£·ÖĪöŌŅņ£ŗ·ßÅŗĶŃį¶ń±ķĒéŌŚ×ģ°ĶÖÜĪ§µÄĪĘĄķøÄ±ä½ĻĄąĖĘ£¬±ÆÉĖŗĶ·ßÅ±ķĒéĪĘĄķ±ä»Æ¶¼½ĻČõ£¬æÖ¾åŗĶ¾ŖŃČĮ½ÖÖ±ķĒéŌŚŃŪ¾¦ø½½üµÄĪĘĄķ½ĻĪŖĻąĖĘ�£ŌŚFER2013ŗĶCK+Źż¾Ż¼ÆÉĻ£¬²ÉÓĆ¶ąøöĘäĖū±ķĒéŹ¶±š·½·Ø½ųŠŠ²āŹŌŗĶŃéÖ¤£¬²¢Óė±¾ĪÄ·½·Ø½ųŠŠ±Č½Ļ£¬µĆµ½µÄ½į¹ūČē±ķ5ŗĶ±ķ6ĖłŹ¾�£±ķ3��»łÓŚFER2013Źż¾Ż¼ÆµÄ²āŹŌÖø±źTab. 3 ��Test indicators based on FER2013 data set[±ķĒé ¾«Č·ĀŹ ÕŁ»ŲĀŹ F1 ×¼Č·ĀŹ ÉśĘų 0.60 0.62 0.61 0.623 Ńį¶ń 0.90 0.65 0.76 0.654 æÖ¾å 0.59 0.43 0.50 0.433 øßŠĖ 0.87 0.87 0.87 0.873 ÉĖŠÄ 0.55 0.52 0.53 0.518 ¾ŖŃČ 0.81 0.83 0.82 0.829 Õż³£ 0.61 0.77 0.68 0.765 ]±ķ4��»łÓŚCK+Źż¾Ż¼ÆµÄ²āŹŌÖø±źTab. 4��Test indicators based on CK+ data set[±ķĒé ¾«Č·ĀŹ ÕŁ»ŲĀŹ F1 ×¼Č·ĀŹ ÉśĘų 0.96 1.00 0.98 1.000 Ńį¶ń 0.94 1.00 0.97 1.000 æÖ¾å 1.00 1.00 1.00 1.000 øßŠĖ 1.00 0.97 0.99 0.972 ÉĖŠÄ 1.00 1.00 1.00 1.000 ¾ŖŃČ 1.00 0.93 0.97 0.934 Õż³£ 0.90 1.00 0.95 1.000 ]±ķ5��»łÓŚFER2013Źż¾Ż¼ÆµÄŹ¶±šĀŹ±Č½ĻTab. 5��Comparison of recognition rate based on FER2013 data set[·½·Ø ¾«Č·ĀŹ ÕŁ»ŲĀŹ F1 ×¼Č·ĀŹ LBP+SVM[21] 0.60 0.62 0.61 0.623 VGG11 0.58 0.57 0.57 0.586 ResNet18 0.59 0.56 0.56 0.583 AlexNet 0.59 0.60 0.59 0.611 GoogLeNet 0.61 0.59 0.62 0.626 øĆĪÄ 0.63 0.69 0.69 0.685 ]±ķ6��»łÓŚCK+Źż¾Ż¼ÆµÄŹ¶±šĀŹ±Č½ĻTab. 6��Comparison of recognition rate based on CK+ data set[·½·Ø ¾«Č·ĀŹ ÕŁ»ŲĀŹ F1 ×¼Č·ĀŹ LBP+SVM 0.96 0.97 0.98 0.96 VGG11 0.98 1.00 0.97 0.98 ResNet18 0.98 0.97 0.97 0.97 AlexNet 0.97 0.97 0.97 0.97 GoogLeNet 0.98 0.99 0.98 0.98 øĆĪÄ 0.99 1.00 1.00 0.99 ]2.2.2��²»Ķ¬ĶųĀē½į¹¹¶Ō±ČŹµŃé·ÖĪö��AlexNetŹĒŅ»ÖÖŌŚLeNetµÄ»ł´�ÉĻ¼ÓÉīĮĖĶųĀēµÄ½į¹¹£¬ĖüĖłŹ¹ÓĆµÄŹĒ²ćµžµÄ¾ķ»ż²ć£Ø¼´¾ķ»ż²ć+¾ķ»ż²ć+³Ų»Æ²ć£©Ą´ĢįČ�Ķ¼ĻńµÄĢŲÕ÷£¬Ź¹ÓĆDropoutŅÖÖĘ¹żÄāŗĻŗĶŹż¾ŻŌöĒæ£Ødata augmentation£©ŅÖÖĘ¹żÄāŗĻ£¬Ź¹ÓĆReluĢę»»Ö®Ē°µÄSigmoidµÄ×÷ĪŖ¼¤»īŗÆŹż£¬Ķ¼4£Øa£©ŗĶĶ¼5£Øa£©ĪŖFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆŌŚAlexNetĶųĀē½į¹¹ŃµĮ·ĒśĻß�£øĆĶųĀē¼Ü¹¹Ó¦ÓĆŌŚFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆÉĻĆęµĆµ½×¼Č·ĀŹĪŖ0.61ŗĶ0.97£¬×ÜĢåĄ´Ėµ£¬AlexNetĶųĀē½į¹¹ŌŚĢŲÕ÷ĢįČ�²»¹»Č«Ćę�£[1.00.80.60.40.2][Accuracy][TrainingTest][ b ][ a ][ d ][ c ][0 2 4 6 8 10 12 14 16 18 20Epoch][1.00.80.60.40.2][Accuracy][0 2 4 6 8 10 12 14 16 18 20Epoch][TrainingTest][0 2 4 6 8 10 12 14 16 18 20Epoch][0 2 4 6 8 10 12 14 16 18 20Epoch][1.00.80.60.40.2][Accuracy][1.00.80.60.40.2][Accuracy][TrainingTest][TrainingTest]Ķ¼4��FER2013Źż¾Ż¼ÆŃµĮ·¹ż³ĢĒśĻß£ŗ £Øa£© AlexNetĶųĀē½į¹¹£¬ £Øb£© GoogLeNetĶųĀē½į¹¹£¬ £Øc£© ResNetĶųĀē½į¹¹£¬ £Ød£© VGG11ĶųĀē½į¹¹Fig. 4��Training process curves based on FER2013 data set£ŗ £Øa£© AlexNet network structure£» £Øb£© GoogLeNet network structure£» £Øc£© ResNet network structure£» £Ød£© VGG11 network structureGoogLeNetĶųĀē¼Ü¹¹ĢįÉżĮĖ¶ŌĶųĀēÄŚ²æ¼ĘĖć×ŹŌ´µÄĄūÓĆ£¬Ōö¼ÓĮĖĶųĀēµÄÉī¶ČŗĶæķ¶Č£¬ĶųĀēÉī¶Č´ļµ½22²ć£Ø²»°üĄØ³Ų»Æ²ćŗĶŹäČė²ć£©£¬µ«Ć»ÓŠŌö¼Ó¼ĘĖć´ś¼Ū£¬½«Č«Į¬½Ó²ć±ä³ÉĻ�ŹčĮ¬½Ó£¬°üĄØ¾ķ»ż²ć£¬Ź¹ÓĆDropout½ā¾ö¹żÄāŗĻĪŹĢā£¬Ķ¼4£Øa£©ŗĶĶ¼5£Øb£©ĪŖFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆŌŚGoogLeNetĶųĀē½į¹¹ŃµĮ·ĒśĻß�£øĆĶųĀē¼Ü¹¹Ó¦ÓĆŌŚFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆÉĻĆęµĆµ½×¼Č·ĀŹĪŖ0.621ŗĶ0.980�£VGG11ĖäČ»¼õÉŁĮĖ¾ķ»ż²ć²ĪŹż£¬µ«Źµ¼ŹÉĻĘä²ĪŹżæÕ¼ä±Č AlexNet´ó£¬ĘäÖŠ¾ų´ó¶ąŹżµÄ²ĪŹż¶¼ŹĒĄ´×ŌÓŚµŚŅ»øöČ«Į¬½Ó²ć£¬ŗÄ·Ńøü¶ą¼ĘĖć×ŹŌ´£¬²ÉÓĆĮĖMulti-ScaleµÄ·½·ØĄ´ŃµĮ·ŗĶŌ¤²ā£¬Ķ¼4£Øc£©ŗĶĶ¼5£Øc£©ĪŖFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆŌŚVGG11ĶųĀē½į¹¹µÄŃµĮ·ĒśĻß�£øĆĶųĀē¼Ü¹¹Ó¦ÓĆŌŚFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆÉĻĆęµĆµ½×¼Č·ĀŹĪŖ0.586ŗĶ0.980�£ResNet-18ŃµĮ·æÉŅŌ´ļµ½½ĻÉīµÄĶųĀē²ć´Ī£¬ŗÜÄŃŃµĮ·£¬ŅņĪŖĢŻ¶Č·´Ļņ´«²�µ½Ē°ĆęµÄ²ć£¬ÖŲø´Ļą³ĖæÉÄÜŹ¹ĢŻ¶ČĪŽĒīŠ�£¬Ķ¼4£Ød£©ŗĶĶ¼5£Ød£©ĪŖFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆŌŚResNet-18ĶųĀē½į¹¹ŃµĮ·ĒśĻß�£µ«ŹĒøĆĶųĀē¼Ü¹¹Ó¦ÓĆŌŚFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆÉĻĆęµĆµ½×¼Č·ĀŹĪŖ0.583ŗĶ0.970�£¶Ō±Č±ķ5ŗĶ±ķ6æÉµĆ£¬ŌŚFER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆÉĻ½ųŠŠ¶Ō±ČŹŌŃé£¬¶Ō±ČĘäĖūĆę²æ±ķĒéŹ¶±š·½·Ø£¬²ÉÓĆ±¾ĪÄÄ£ŠĶÄÜ¹»»ńµĆøüŗĆµÄ±ķĒéŹ¶±š½į¹ū£¬FER2013Źż¾Ż¼ÆŗĶCK+Źż¾Ż¼ÆŌŚ»łÓŚ¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄĆę²æ±ķĒéŹ¶±šæņ¼Ü×īøßČ�µĆĮĖ¾«¶ČĪŖ0.689ŗĶ0.992�£3��½į��ĀŪ±¾ĪÄĢį³öµÄ»łÓŚ¶ąČĪĪńŃ§Ļ°ŗĶÖŖŹ¶Ķ¼Ę×µÄĆę²æ±ķĒéŹ¶±š·½·Ø£¬ÓėĻÖÓŠÉī¶ČŃ§Ļ°·½·ØĻą±Č£¬øĆ·½·ØŌŚ²»Ķ¬¹ęÄ£Źż¾Ż¼ÆÉĻ´ļµ½ĮĖøü×¼Č·�¢øüÓŠŠ§µÄŹ¶±šŠ§¹ū£¬ÓČĘäæÉŅŌ×¼Č·Ź¶±š�°æģĄÖ�±ŗĶ�°·ßÅ�±£¬»¹æÉ½ųŅ»²½²ÉČ�Ī¢µ÷²ßĀŌŠŽÕżÖīČē�°¾ŖĻ²�±ŗĶ�°æÖ¾å�±µČ´ķĪó·ÖĄą�£´ĖĶā£¬ÓėĘäĖüĻÖÓŠ·½·ØĻą±Č£¬±¾ĪÄ·½·ØŌŚCK+ŗĶFER2013Źż¾Ż¼ÆÉĻ·Ö±š´ļµ½ĮĖ99.16%ŗĶ68.85%µÄĘ½¾ł×¼Č·¶Č�£MLAMĖć·ØĶØ¹żČŚŗĻÉī¶ČŃ§Ļ°ÓėÖŖŹ¶Ķ¼Ę×£¬ŌŚĆę²æ±ķĒéŹ¶±šČĪĪńÉĻĶ»ĻŌÓÅŹĘ�£ĖµĆ÷øöĢåÖ®¼äµÄ¾Ö²æ±ķĒéÄÜĢįøßĆę²æ±ķĒéŹ¶±š×¼Č·ĀŹ£¬ÖŖŹ¶Ķ¼Ę×ÄÜ¶ŌČĖĢåÓėČĖĢå�¢ČĖĢåÓė¾Ö²æ±ķĒéÖ®¼äµÄø´ŌÓ¹ŲĮŖ½ųŠŠ½ØÄ£�£³ż´ĖÖ®Ķā£¬±¾ĪÄ²ÉÓĆµÄ½»²ęŃ¹Ėõµ�ŌŖŹĒĮ½ÖÖŹż¾ŻÄ£ŠĶńīŗĻµÄ¹Ų¼ü�£MLAMĖć·ØæÉŅŌ´¦ĄķæÕ¼äĢŲÕ÷£¬ŌŚĪ´Ą´ÓŠĒ±Į¦Ó¦ÓĆÓŚøü¼Óø´ŌÓµÄČĖĮ³ĒéŠ÷±ķÕ÷ČĪĪńÖŠ£¬ŹµĻÖøüÉī²ć´ĪµÄČĖ»ś½»»�£¬ŌŚ»śĘ÷ÉĻ±ķĻÖ³öøüÉī²ć´Īøü·įø»±ĘÕęµÄ±ķĒé£¬²¢ÓŠĶūŌö¼ÓÓļŅōµČ¶ąÄ£Ģ¬ŠÅĻ¢£¬Ģį¹©øüŗĆµÄČĖ»ś½»»�ŠŌ�£