ĪÄÕĀ

�¶Īäŗŗ¹¤³Ģ´óŃ§Ń§±Ø�· 2026Äź01ĘŚ 103-110 ³ö°ęČÕĘŚ£ŗ2026-02-28 ISSN:1674-2869 CN:42-1779/TQ

»łÓŚ×Ō¼ą¶½Ō¤ŃµĮ·µÄµ�Ļø°ūĄąŠĶ×¢ŹĶ·½·Ø

µ�Ļø°ūRNA²āŠņ¼¼ŹõĪŖŃŠ¾æČĖŌ±Ģį¹©ĮĖÉīČė·ÖĪöµ�øöĻø°ūµÄÄÜĮ¦[1]£¬øĆ¼¼ŹõµÄŗĖŠÄÄæ±źŹĒ¾«Č·Ź¶±šĆæøöĻø°ūµÄ¾ßĢåĻø°ūĄąŠĶ�£Č»¶ų£¬Ļø°ūĄąŠĶµÄ±ź×¢¹ż³Ģ²»½öŗÄŹ±£¬¶ųĒŅøß¶ČŅĄĄµ×Ø¼ŅµÄ×ØŅµÖŖŹ¶[2]�£Ćę¶ŌÅÓ´óµÄµ�Ļø°ūRNA²āŠņŹż¾Ż¼Æ£¬´«Ķ³µÄ»łÓŚ×Ø¼ŅÖŖŹ¶µÄČĖ¹¤×¢ŹĶ·½·ØĆęĮŁ×Å¾Ž´óĢōÕ½£¬²¢ĒŅ×¢ŹĶ½į¹ūĶłĶł´ųÓŠŅ»¶ØµÄÖ÷¹ŪŠŌ[3]�£

ÄæĒ°¹ŲÓŚĻø°ūĄąŠĶ×¢ŹĶµÄŃŠ¾æ´óÖĀæÉŅŌ·ÖĪŖ»łÓŚ±ź¼Ē»łŅņµÄ·½·Ø�¢»łÓŚĻą¹ŲŠŌµÄ·½·ØŗĶ»łÓŚÉī¶ČŃ§Ļ°µÄ·½·Ø[4]�£Ź×ĻČ£¬»łÓŚ±ź¼Ē»łŅņµÄ·½·ØŌŚµ�Ļø°ūRNA²āŠņµÄ³õĘŚ½×¶Ī·¢»ÓĮĖÖŲŅŖ×÷ÓĆ�£Č»¶ų£¬ÕāÖÖ·½·ØµÄÓŠŠ§ŠŌČ�¾öÓŚ±ź¼Ē»łŅņŹż¾ŻæāµÄ×¼Č·ŠŌ�£¾�¹ÜÓŠČēĪÄĻ×[5-6]µČæÉ¹«æŖ·ĆĪŹµÄŹż¾Żæā£¬µ«Ņ»Š©±ź¼Ē»łŅņČŌŅĄĄµÓŚĻÖÓŠµÄŃŠ¾æÖŖŹ¶�£Ęä´Ī£¬»łÓŚĻą¹ŲŠŌµÄ·½·ØŅ²±»¹ć·ŗ²ÉÓĆ£¬µ«ĘäŅ×ŹÜÅś´ĪŠ§Ó¦µÄÓ°Ļģ£¬ŠčŅŖøßÖŹĮæµÄ²Īæ¼Źż¾Ż¼ÆŅŌČ·±£ĄąŠĶ×¢ŹĶµÄ×¼Č·ŠŌ�£×īŗó£¬»łÓŚÉī¶ČŃ§Ļ°µÄ·½·Ø¶ŌŌėÉłŗĶŹż¾ŻµÄæÉ±äŠŌ¾ßÓŠĀ³°ōŠŌ£¬²»ŅĄĄµÓŚČĖ¹¤Ń�ŌńµÄ±ź¼Ē»łŅņ[7]£¬½üÄźĄ´µĆµ½ĮĖ¹ć·ŗÓ¦ÓĆ�£ĄżČē£¬×Ō¶Æ±ąĀėĘ÷[8]�¢±ä·Ö×Ō±ąĀėĘ÷[9]ŗĶÉś³É¶Ōæ¹ĶųĀē[10]µČ¼¼Źõ£¬³£±»ÓĆÓŚĻø°ū¾ŪĄą�¢Ļø°ūĄąŠĶ×¢ŹĶŗĶĶĘ¶Ļ»łŅņµ÷æŲĶųĀēµČČĪĪń�£´ĖĶā£¬Ķ¼Ä£ŠĶŅ²³£³£ÓĆÓŚĻø°ūĄąŠĶ×¢ŹĶ[11]£¬ĄūÓĆ»łŅņ¹²±ķ´ļ¹ŲĻµ»ņĻø°ūĻąĖĘŠŌĄ´ĢįøßĻø°ūĄąŠĶ×¢ŹĶµÄ×¼Č·ŠŌ[12]�£Ėę×Åµ�Ļø°ū×éŃ§Źż¾ŻĮæµÄ¼¤Ōö£¬æŖ·¢×Ō¶Æ»Æ�¢æģĖŁĒŅ×¼Č·µÄĻø°ūĄąŠĶ×¢ŹĶ·½·ØŅŃ³ÉĪŖøĆĮģÓņµÄŃŠ¾æČČµć�£

ŌŚ½«Transformer¼Ü¹¹Ó¦ÓĆÓŚµ�Ļø°ūŹż¾ŻµÄĻø°ūĄąŠĶ×¢ŹĶµÄŃŠ¾æÖŠ£¬YangµČ[13]Õ¹ĻÖĮĖŌŚ´ó¹ęÄ£ĪŽ±ź¼Ēµ�Ļø°ūRNA²āŠņŹż¾ŻÉĻ½ųŠŠ×Ō¼ą¶½Ń§Ļ°µÄĒ±Į¦£¬Ģį¹©ĮĖĪČ½��¢×¼Č·µÄĻø°ūĄąŠĶ×¢ŹĶ�£Č»¶ų£¬µ±Ćę¶ŌĻø°ūĄąŠĶ·Ö²¼²»Ę½ŗāµÄŹż¾Ż¼ÆŹ±£¬ĘäŠŌÄÜŹÜµ½ĮĖÓ°Ļģ£¬ÕāæÉÄÜŹĒÓÉÓŚ´ęŌŚĻ�ÓŠĻø°ūĄąŠĶ»ņĘ«²ÉŃłŌģ³ÉµÄ[14]�£Ņņ´Ė£¬±¾ŃŠ¾æĢį³öĮĖ»łÓŚĒØŅĘŃ§Ļ°ŗĶTransformerµÄÉī¶ČŃ§Ļ°ĶųĀēµ�Ļø°ū±źĒ©×¢ŹĶĶųĀē(single-cell label annotation network, ScLabel-Net)£¬ÓĆÓŚµ�Ļø°ūŹż¾ŻµÄĻø°ūĄąŠĶ×¢ŹĶ£¬øĆĶųĀēŅżČėĮĖĪ»ÖĆĒ¶ČėŗĶŹż¾ŻŌöĒæµČ¼¼Źõ�£Ī»ÖĆĒ¶Čė±»ÕūŗĻµ½Ćæøö»łŅņ±ķ´ļĒ¶ČėÖŠ£¬ŅŌ½ØĮ¢»łŅņÓė»łŅņÖ®¼äµÄæÕ¼äĻą¶ŌĪ»ÖĆ¹ŲĻµ[15]�£Ėę»śÉĻ²ÉŃłÕāŅ»Źż¾ŻŌöĒæ¼¼Źõ¶ŌŠ�Ńł±¾Źż¾Ż½ųŠŠø´ÖĘĄ©³ä£¬´ļµ½Óė×ī¶ąŹż¾ŻµÄŃł±¾ĮæŅ»ÖĀµÄŹż¾ŻĮæ�£ÕāĮ½ÖÖ¼¼Źõ·Ö±š½ā¾öĮĖ×Ō×¢ŅāĮ¦»śÖĘ²»æ¼ĀĒŹäČėŠņĮŠµÄĖ³ŠņŗĶŠ�Ńł±¾Źż¾ŻµĆ²»µ½³ä·ÖŃµĮ·µÄÄŃĢā�£ĶØ¹żÉĻŹöøÄ½ų£¬ScLabel-NetÄÜ¹»øüÓŠŠ§µŲ´¦Ąķ²»Ę½ŗāŹż¾Ż¼Æ£¬´Ó¶ųŌŚµ�Ļø°ūŹż¾ŻµÄĻø°ūĄąŠĶ×¢ŹĶČĪĪńÖŠ±ķĻÖ³öøüøßµÄ×¼Č·ŠŌŗĶĀ³°ōŠŌ�£

1 ŹµŃé²æ·Ö

ÕūĢåµÄŃŠ¾æĮ÷³ĢČēĶ¼1ĖłŹ¾£¬Ö÷ŅŖ·ÖĪŖŹż¾Ż×¼±ø�¢Źż¾ŻŌ¤´¦Ąķ�¢ScLabel-NetµÄ¹¹½ØŅŌ¼°ŠŌÄÜĘĄ¹Ą4øö²æ·Ö�£

Ź×ĻČ£¬½«¶ąøöŹż¾Ż»ć¼Æ²¢ÕūŗĻµ½Ņ»øöĪÄ¼žÖŠ[16]�£½Ó×Å£¬Ä£ŠĶ½ÓŹÕ»łŅņ±ķ´ļ¾ŲÕó×÷ĪŖŹäČė£¬²¢Ź¹ÓĆPython¹¤¾ß°üSCANPY[17]¶ŌŹż¾Ż½ųŠŠŌ¤´¦Ąķ£¬°üĄØČ�³żµĶÖŹĮæĻø°ū�¢Źż¾Ż¹éŅ»»Æ�¢¶ŌŹż×Ŗ»»ŅŌ¼°ÉøŃ�øß±ä»łŅņ�£Č»ŗó£¬ScLabel-NetŌŚĪ´±ź¼ĒµÄ´ó¹ęÄ£µ�Ļø°ūŹż¾Ż¼ÆÉĻ½ųŠŠŌ¤ŃµĮ·£¬Ö¼ŌŚŹ¶±šĻø°ūĄąŠĶµÄĒ±ŌŚĢŲÕ÷£¬ŅŌ¼õÉŁ²»Ķ¬Źż¾Ż¼ÆÖ®¼äµÄÅś´ĪŠ§Ó¦[13]£¬ĖęŗóŌŚĢŲ¶ØµÄÓŠ±źĒ©µÄÄæ±źŹż¾Ż¼ÆÉĻ½ųŠŠĪ¢µ÷�£×īŗó£¬¶ŌÄ£ŠĶŠŌÄÜ½ųŠŠČ«ĆęĘĄ¹Ą£¬ŅŌŃéÖ¤Ä£ŠĶµÄŹµÓĆŠŌŗĶĶØÓĆŠŌ�£

1.1 Źż¾Ż»ńČ�

ŃŠ¾æĖłÉę¼°µÄŹż¾ŻŗøĒĮĖ4øöŠ�ŹóµÄ²»Ķ¬Ę÷¹Ł£¬°üĄØ·Ī²æ�¢Ęų¹Ü�¢ÉöŌąŗĶŅČĻŁ£¬¹²10øöµ�Ļø°ūŹż¾Ż¼Æ£¬²¢ĒŅ°üŗ¬ĮĖ5ÖÖ²»Ķ¬µÄ²āŠņ¼¼Źõ�£Čē±ķ1ĖłŹ¾£¬ÕāŠ©Źż¾Ż¼Æ±»·ÖĪŖ3øöĄą±š£ŗÓĆÓŚŌ¤ŃµĮ·µÄĪŽ±źĒ©Źż¾Ż¼Æ�¢ÓĆÓŚĪ¢µ÷ŃµĮ·ŗĶŠŌÄÜĘĄ¹ĄµÄÓŠ±źĒ©Źż¾Ż¼ÆŅŌ¼°ÓĆÓŚÄ£ŠĶŠŌÄÜĘĄ¹ĄµÄĪŽ±źĒ©Źż¾Ż¼Æ�£

Ō¤ŃµĮ·½×¶ĪŹ¹ÓĆµÄČōøÉøöŠ�Źó·Ī²æŹż¾Ż¼ÆĄ´Ō´ÓŚPanglaoDB[5]£¬Ņ»¹²°üŗ¬ĮĖ100 024øöĻø°ū£¬ŗøĒĮĖ25ÖÖ²»Ķ¬µÄĻø°ūĄąŠĶ�£ŌŚŹż¾ŻŌ¤´¦Ąķ½×¶Ī£¬½«ÕāŠ©Š�Źó·Ī²æŹż¾Ż¼ÆŗĻ²¢³ÉŅ»øö´óµÄŹż¾Ż¼Æ£ØPanglao£©ÓĆÓŚŌ¤ŃµĮ·ČĪĪń�£Ī¢µ÷ŃµĮ·Éę¼°µÄŠ�Źó·Ī²æŹż¾Ż¼Æ°üĄØĄ´Ō´ÓŚ»łŅņ±ķ´ļŹż¾ŻæāµÄGSE267861[18]ŗĶGSE264032[19]£¬ŅŌ¼°4øöĄ´×Ō¶ÆĪļĻø°ūĶ¼Ę×£Øanimal cell atlas£¬ACA£©Źż¾ŻæāÖŠŠ�ŹóĘäĖūĘ÷¹ŁµÄŹż¾Ż¼Æ[20]£¬·Ö±šŹĒALIGNED_Lung�¢ALIGNED_Trachea�¢ALIGNED_KidneyŗĶALIGNED_PancreasŹż¾Ż¼Æ�£ĪŖĮĖ½ųŅ»²½ŃéÖ¤Ä£ŠĶŌŚÕęŹµ³�¾°ÖŠµÄ·ŗ»ÆÄÜĮ¦£¬ŃŠ¾æÖŠ»¹ĢŲ±šŃ�ÓĆĮĖ3øöĄ´×ŌACAŹż¾ŻæāÖŠµÄQuake�¢Plasschaert�¢BaronŹż¾Ż¼Æ[20]£¬²¢ĒŅÕā3øöŹż¾Ż¼ÆĪ´ŌŚŌ¤ŃµĮ·ŗĶĪ¢µ÷ŃµĮ·¹ż³ĢÖŠŹ¹ÓĆ�£

±ķ1 ŃŠ¾æÖŠĖłÓŠµÄµ�Ļø°ūŹż¾Ż¼ÆĻźĒé

Table 1 Details of all single-cell datasets in the study

[Ąą±š Źż¾Ż¼Æ ĄąŠĶ

ŹżĮæ Ļø°ū

ŹżĮæ »łŅņ

ŹżĮæ Ō¤ŃµĮ· Panglao 25 100 024 45 549 GSE267861 12 24 520 32 285 GSE264032 16 31 928 32 285 Ī¢µ÷ŃµĮ· ALIGNED_Lung 17 16 599 25 174 ALIGNED_Trachea 18 12 619 33 948 ALIGNED_Kidney 37 63 659 35 210 ALIGNED_Pancreas 22 3 450 25 410 Quake 13 5 449 23 341 ŠŌÄÜĘĄ¹Ą Plasschaert 8 6 977 28 205 Baron 13 1 886 14 877 ]

1.2 Źż¾ŻŌ¤´¦Ąķ

ŌŚµ�Ļø°ūRNA²āŠņŹż¾Ż·ÖĪöÖŠ£¬»łŅņ±ķ´ļ¾ŲÕóĶØ³£¾ßÓŠøßĻ�ŹčŠŌ[21]£¬Ņņ´Ė¶ŌŹż¾Ż¼Æ½ųŠŠŌ¤´¦ĄķÖĮ¹ŲÖŲŅŖ�£Ź×ĻČ£¬ĄūÓĆSCANPY½«ĆæøöŹż¾Ż¼ÆµÄ»łŅņ±ķ´ļ¾ŲÕó×Ŗ»»ĪŖÓŠ×¢ŹĶµÄŹż¾Ż¶ŌĻó£¬²¢½ųŠŠÖŹĮææŲÖĘ£¬°üĄØĻø°ū¹żĀĖ£ØŅĘ³ż»łŅņŹżÉŁÓŚ200ĒŅĻßĮ£Ģåŗ¬Įæ³¬¹ż25%µÄĻø°ū£©ŗĶ¹éŅ»»Æ�£½Ó×Å£¬¶ŌĆæøöĻø°ūµÄ»łŅņ±ķ´ļÖµ½ųŠŠ¶ŌŹż×Ŗ»»£¬²¢ÉøŃ�³ö±ä»Æ½Ļ´óµÄ»łŅņ�£

ÓĆÓŚŌ¤ŃµĮ·ŗĶĪ¢µ÷ŃµĮ·µÄŹż¾Ż¼Æ°´8�Ć2µÄ±ČĄż·ÖĪŖŃµĮ·¼ÆŗĶ²āŹŌ¼Æ£¬ĘäÖŠ 80% µÄŹż¾ŻĶØ¹żĪåÕŪ½»²ęŃéÖ¤²ßĀŌÓĆÓŚÄ£ŠĶŃµĮ·£¬ĘäÓą20%ÓĆÓŚŠŌÄÜĘĄ¹Ą�£´ĖĶā£¬ŌŚŌ¤ŃµĮ·ŗĶĪ¢µ÷ŃµĮ·¹ż³ĢÖŠĪ´¼ūµÄŹż¾Ż¼ÆĆ»ÓŠ±»»®·Ö£¬¶ųŹĒÖ±½ÓÓĆÓŚĘĄ¹ĄÄ£ŠĶŌŚÕęŹµ³�¾°ÖŠµÄŌ¤²āÄÜĮ¦�£

1.3 ScLabel-NetĶųĀē¼Ü¹¹

ScLabel-NetŹĒŅ»ÖÖ»łÓŚ×Ō¼ą¶½Ō¤ŃµĮ·µÄÉī¶ČŃ§Ļ°ĶųĀē£¬ÓÉĪ»ÖĆĒ¶Čė�¢»łŅņ±ķ´ļĒ¶Čė�¢Performer[22]±ąĀėĘ÷ŗĶ·ÖĄą²ć×é³É�£

Ź×ĻČ£¬ScLabel-Net øł¾Żµ�Ļø°ūŹż¾ŻµÄŹōŠŌŅżČė·ÖĻä¼¼Źõ£¬ÓĆĄ´±ķŹ¾²»Ķ¬µÄ»łŅņ±ķ´ļĖ®Ę½�£»łŅņ±ķ´ļĒ¶ČėĶØ³£ŅŌ¾ŲÕóŠĪŹ½±ķŹ¾£¬¶ųĪ»ÖĆĒ¶ČėµÄŌĖÓĆÓŠÖśÓŚÄ£ŠĶŹ¶±š²¢ĄūÓĆ»łŅņµÄĻą¶ŌĪ»ÖĆ¹ŲĻµ£¬´Ó¶ųøüÉīČėµŲĄķ½āŹż¾ŻµÄ½į¹¹[23]�£Ęä´Ī£¬ŌŚŌ¤ŃµĮ·½×¶Ī£¬Ē¶Čė½į¹ū±»ŹäČėµ½±ąĀėĘ÷ÖŠ�£±ąĀėĘ÷Ź×ĻČ¶ŌŹäČėŹż¾Ż½ųŠŠ±ąĀė½«ŌŹ¼Źż¾Ż×Ŗ»»ĪŖ³éĻó±ķŹ¾£¬Ėęŗó¶Ō±ąĀėŗóµÄŹż¾Ż½ųŠŠ±ķÕ÷Ń§Ļ°£¬ŅŌÉś³ÉŌ¤²ā½į¹ū£¬Č»ŗó¾¹żĪ¬¶Č×Ŗ»»£¬ÖŲ½ØŌŹ¼Źż¾Ż£¬²¢ĄūÓĆŌŹ¼±źĒ©¼ĘĖć½»²ęģŲĖšŹ§�£ČēĶ¼2ĖłŹ¾£¬ScLabel-NetŌŚĪ¢µ÷ŃµĮ·¹ż³ĢÖŠ£¬Õė¶ŌĢŲ¶ØČĪĪńµÄŹż¾ŻŹäČėµ½Ō¤ŃµĮ·ŗĆµÄ±ąĀėĘ÷ÖŠ£¬±ķÕ÷Ń§Ļ°µÄ½į¹ū¾¹żŅ»Ī¬¾ķ»ż½ųŠŠĢŲÕ÷ĢįČ�£¬Č»ŗó½«Ņ»Ī¬¾ķ»ż½į¹ūĖĶČėµ½·ÖĄą²ć½ųŠŠ·ÖĄą£¬·ÖĄą²ćŹä³öĆæøöĄą±šµÄøÅĀŹ�£×īÖÕĶØ¹ż¹éŅ»»ÆÖøŹżÉś³ÉÕżČ·µÄĻø°ūĄąŠĶ£¬´Ó¶ųĶź³É·ÖĄąČĪĪń�£

1.3.1 »łŅņ±ķ´ļĒ¶Čė »łŅņ±ķ´ļĒ¶ČėĆęĮŁµÄÖ÷ŅŖĢōÕ½ŹĒ²»Ķ¬²āŠņ¼¼ŹõÖ®¼ä´ęŌŚµÄ¾ų¶Ō±ķ´ļĖ®Ę½±äŅģŠŌ�£ÓÉÓŚ²āŠņÉī¶ČµÄ²»Ķ¬£¬²»Ķ¬Åś´ĪµÄ²āŠņŃł±¾ŌŚŹż¾ŻĮæ¼¶ÉĻæÉÄÜ»į±ķĻÖ³öĻŌÖųµÄ²īŅģ[24]�£ĪŖ´Ė£¬»łÓŚ·ÖĻäµÄ¼¼ŹõĶØ¹ż½«ĖłÓŠ±ķ´ļÖµ×Ŗ»»ĪŖĻą¶ŌÖµ£¬´Ó¶ųŌŚ²»Ķ¬²āŠņÅś´ĪÖ®¼ä½ØĮ¢Ņ»øöĶ³Ņ»µÄ±Č½Ļ»ł×¼�£ÕāÖÖ·½·ØÄÜ¹»×ī´óĻŽ¶ČµŲ¼õÉŁ²»Ķ¬²āŠņ·½°øµÄÓ°Ļģ£¬½µµĶŹż¾ŻŌėÉł�£¾ßĢåĄ´Ėµ£¬½«»łŅņ±ķ´ļ¾ŲÕó[Y]ÖŠĆæøöĻø°ūµÄ·ĒĮć±ķ´ļÖµ»®·ÖĪŖ [B]øöĮ¬ŠųĒų¼ä[[bk,bk+1]]£¬ĘäÖŠ [k�Ź1,2, �, B]£¬[bk]±ķŹ¾Ä³øöĻø°ūµÄĒų¼ä±ß½ē±ķ´ļÖµ�£ĆæøöĻø°ū¶¼¼ĘĖćĮĖŅ»Ģ×ŠĀµÄ·ÖĻä±ß½ē£¬Ņņ´ĖĒų¼ä±ß½ē[bk]æÉÄÜŌŚ²»Ķ¬Ļø°ūÖ®¼äÓŠĖł²»Ķ¬�£ĆæøöĒų¼ä°üŗ¬Ņ»²æ·Ö¾ßÓŠĻąĖĘ±ķ´ļÖµµÄ»łŅņ£¬[Yi,j]±ķŹ¾µŚ[j]øö»łŅņŌŚµŚ[i]øöĻø°ūÖŠµÄ±ķ´ļÖµ£¬[yi,j]Ōņ±ķŹ¾µŚ[i]øöĻø°ūµÄµŚ[j]øö»łŅņµÄ·ÖĻä±ķ´ļÖµ£¬ČēŹ½(1) ĖłŹ¾�£

[yi,j=k, Yi,j>0 ĒŅYi,j�Źbk,bk+10, Yi,j=0] (1)

·ÖĻä¼¼ŹõČ·±£ĮĖ[yi,j]µÄÓļŅåŌŚ²»Ķ¬µÄÅś´ĪÖŠ±£³ÖŅ»ÖĀ�£ĄżČē£¬ [yi,j=B]µÄÖµŹ¼ÖÕ±ķŹ¾»łŅņµÄ×īøß±ķ´ļĮæ�£´ĖĶā£¬ŌŚ·ÖĻä²½ÖčÖ®Ē°»¹½ųŠŠĮĖ log1p ×Ŗ»»£¬ŅŌ¾�Įæ¼õÉŁøß»łŅņ±ķ´ļÖµµÄÓ°Ļģ£¬²¢Ź¹Źż¾Ż·ūŗĻÕżĢ¬·Ö²¼�£Ćæøö»łŅņ±ķ´ļÖµ[Yi,j]µÄ log1p ±ä»»æÉ±ķŹ¾ĪŖ£ŗ

[Y�Æi,j=ln1+Yi,j] (2)

Ņņ´Ė£¬µŚ[i]øöĻø°ūµÄ·ÖĻä±ķ´ļÖµµÄ×īÖÕŹäČėĻņĮæ±ķŹ¾ĪŖ£ŗ

[yi=yi,1,yi,2,?,yi,N] (3)

ĘäÖŠ£¬[N]±ķŹ¾»łŅņµÄŹżĮæ�£

×ŪÉĻĖłŹö£¬·ÖĻä¼¼Źõ½«»łŅņ±ķ´ļÖµÕāŅ»Į¬Šų±äĮæĄėÉ¢»Æ£¬²¢½«·ÖĻä½į¹ū×Ŗ»»ĪŖŅ»øö200Ī¬µÄĻņĮæ£¬øĆĻņĮæĖęŗóÓĆ×÷ScLabel-NetµÄ»łŅņ±ķ´ļĒ¶Čė�£

1.3.2 ĖšŹ§ŗÆŹż ŌŚŌ¤ŃµĮ·¹ż³ĢÖŠ£¬²ÉÓĆ»łÓŚTransformerµÄĖ«Ļņ±ąĀėĘ÷±ķŹ¾£Øbidirectional encoder representations from Transformers£©[25]µÄŃŚĀėÓļŃŌÄ£ŠĶ·½·Ø£¬Ėę»śĘĮ±Ī·ĒĮć»łŅņ±ķ´ļŹż¾Ż£¬Č»ŗóŹ¹ÓĆŹ£ÓąµÄ±ķ´ļÖµÖŲ½ØŌŹ¼ŹäČėŹż¾Ż�£Ņņ´Ė£¬Ō¤ŃµĮ·½×¶ĪĄūÓĆ½»²ęģŲĖšŹ§×÷ĪŖÖŲ½ØĖšŹ§£¬¾ßĢåČēĻĀ£ŗ

[LRec=-i=1Cj=1Gxi,jln (pi,j)] (4)

ĘäÖŠ:[C]±ķŹ¾Ļø°ūŹż£¬[G]±ķŹ¾±»ŃŚøĒµÄ»łŅņ±ķ´ļÖµµÄŹżĮæ£¬[xi,j]ŗĶ[pi,j]·Ö±š±ķŹ¾µŚ[j]øö»łŅņŌŚµŚ[i]øöĻø°ūÖŠµÄÕęŹµ±ķ´ļŗĶŌ¤²ā±ķ´ļ�£

´ĖĶā£¬ŌŚĪ¢µ÷ŃµĮ·½×¶ĪŹ¹ÓĆ½»²ęģŲĖšŹ§Įæ»ÆÕęŹµĻø°ūĄąŠĶ±źĒ©ŗĶŌ¤²āĻø°ūĄąŠĶ±źĒ©Ö®¼äµÄ²īŅģ£¬¾ßĢåČēĻĀ£ŗ

[LPred=-i=1Mziln (qi)] (5)

ĘäÖŠ£¬[zi]ŗĶ[qi]·Ö±š±ķŹ¾µŚ[i]øöĻø°ūµÄÕęŹµ±źĒ©ŗĶŌ¤²ā±źĒ©�£

1.4 ŠŌÄÜĘĄ¹ĄÖø±ź

ÓÉÓŚŠčŅŖ½ā¾öŹż¾Ż·Ö²¼²»Ę½ŗāµÄ¶ą·ÖĄąĪŹĢā£¬Ņņ´Ė²ÉÓĆŅŌĻĀ4øöÖø±źĄ´ĘĄ¹ĄÄ£ŠĶŠŌÄÜ£¬°üĄØ×¼Č·ĀŹ(A)�¢ŗź¹Ū¾«Č·ĀŹ(Pm)�¢ŗź¹ŪÕŁ»ŲĀŹ(Rm)ŗĶŗź¹ŪF1·ÖŹż(F1)[26]£¬¼ĘĖć¹«Ź½ČēĻĀ£ŗ

[A=T+NT+N+F+M] (6)

[Pm=1nl=1nTlTl+Fl] (7)

[Rm=1nl=1nTlTl+Ml] (8)

[F1=2�ĮP�ĮRP+R] (9)

ĘäÖŠ£ŗ[n]ŹĒĻø°ūĄąŠĶµÄŹżĮæ£¬[l]±ķŹ¾ĆæøöĻø°ūĄąŠĶµÄĖ÷Ņż£¬[T]ŗĶ[N]·Ö±š±ķŹ¾ÕżČ··ÖĄąµÄŃōŠŌŹżĮæŗĶŅõŠŌŹżĮæ£¬[F]ŗĶ[M]·Ö±š±ķŹ¾±»´ķĪó·ÖĄąµÄŅõŠŌŹżĮæŗĶŃōŠŌŹżĮæ�£

2 ½į¹ūÓėĢÖĀŪ

2.1 ŹµŃéÉč±ø

ĖłÓŠŹµŃé¾łŌŚŅ»ĢØ´īŌŲUbuntu 18.04 LTS²Ł×÷ĻµĶ³µÄ·žĪńĘ÷ÉĻÖ´ŠŠ£¬øĆ·žĪńĘ÷Åä±øĮĖÓ¢ĢŲ¶ūæįī£i9-10920X´¦ĄķĘ÷�¢2æéÓ¢Ī°´ļGeForce GTX 3090 GPUŅŌ¼°188 GBµÄŌĖŠŠÄŚ´ę�£ScLabel-Net²ÉÓĆPython 3.8ŗĶPyTorch 1.8.1Éī¶ČŃ§Ļ°æņ¼Ü¹¹½Ø�£Ķ¬Ź±»¹Ź¹ÓĆSCANPY�¢RÓļŃŌµČÓĆÓŚŹż¾ŻŌ¤´¦Ąķ�¢·ÖĪöŗĶæÉŹÓ»Æ�£

ScLabel-NetŌŚPanglaoŠ�Źó·Ī²æŹż¾Ż¼ÆÉĻ½ųŠŠĮĖ20ĀÖµÄŌ¤ŃµĮ·£¬ĆæøöÅś´Ī´óŠ�ÉčÖĆĪŖ2£¬Ź¹ÓĆAdamÓÅ»ÆĘ÷£¬³õŹ¼Ń§Ļ°ĀŹ´óŠ�ĪŖ10-4£¬²¢Ź¹ÓĆÓąĻŅĶĖ»šČČÖŲĘōŃ§Ļ°ĀŹµ÷Õū²ßĀŌ�£Ō¤ŃµĮ·½įŹųŗó£¬Ä£ŠĶŌŚÄæ±źŹż¾Ż¼ÆÉĻ¼ĢŠų½ųŠŠ20ĀÖµÄĪ¢µ÷ŃµĮ·£¬²ÉÓĆĪåÕŪ½»²ęŃéÖ¤²ßĀŌ�£Ī¢µ÷ŃµĮ·µĆ³öµÄ×īÓÅÄ£ŠĶČØÖŲ±»±£´ęĘšĄ´£¬ŅŌ±ćŌŚ²āŹŌ¼ÆÉĻ½ųŠŠŠŌÄÜĘĄ¹Ą�£

2.2 ScLabel-NetŌŚŠ�Źó·Ī²æĻø°ūĄąŠĶŌ¤²āÖŠµÄÓ¦ÓĆ

ScLabel-NetŌŚGSE267861�¢GSE264032ŗĶALIGNED_LungŠ�Źó·Ī²æŹż¾Ż¼ÆÉĻĶź³ÉĮĖĪ¢µ÷�£ČēĶ¼3(a)ĖłŹ¾£¬GSE267861ŗĶGSE264032µÄŹż¾Ż°´ÕÕ8�Ć2µÄ±ČĄż»®·ÖĪŖŃµĮ·¼ÆŗĶ²āŹŌ¼Æ�£Ņņ´Ė£¬ScLabel-NetŌŚÕāĮ½øöŹż¾Ż¼ÆµÄ²āŹŌ¼ÆŅŌ¼°QuakeŹż¾Ż¼ÆÉĻ½ųŠŠĮĖŠŌÄÜĘĄ¹Ą�£Čē±ķ2ĖłŹ¾£¬ScLabel-NetÓė»łÓŚĻą¹ŲŠŌµÄ·½·Ø£ØCell BLAST[20]�¢SingleR[27]�¢Scmap_cell[28]�¢Scmap_cluster[28]ŗĶCHETAH[29]£©£¬ŅŌ¼°»łÓŚÉī¶ČŃ§Ļ°µÄ·½·Ø£ØACTINN[30]�¢TOSICA[31]£©½ųŠŠĮĖ¶Ō±Č�£½į¹ū±ķĆ÷£¬ScLabel-NetŌŚAŗĶF1·½Ćę±ķĻÖ³öøüÓÅŌ½µÄŠŌÄÜ�£ĢŲ±šŹĒ£¬ŌŚQuakeŹż¾Ż¼ÆÉĻ½ųŠŠĘĄ¹ĄŹ±£¬ScLabel-NetµÄŠŌÄÜ×īĪŖĶ»³ö£¬AĪŖ0.986£¬F1ĪŖ0.847�£´ĖĶā£¬ČēĶ¼3(b)ĖłŹ¾£¬ScLabel-NetŌŚGSE264032Źż¾Ż¼ÆÉĻµÄ±ķĻÖĀŌŃ·ÓŚĘäĖūĮ½øöŹż¾Ż¼Æ£¬ÕāæÉÄÜŹĒÓÉÓŚøĆŹż¾Ż¼ÆµÄø´ŌÓ¶Č½ĻøßĒŅ¹ęÄ£½Ļ´ó£Ø°üŗ¬16ÖÖĻø°ūĄąŠĶ£¬ĘäÖŠ4ÖÖĄąŠĶÕ¼×ÜŹż¾ŻµÄ±ČĄż²»µ½1%£©£¬¾�¹ÜČē´Ė£¬ScLabel-NetŌŚGSE264032Źż¾Ż¼ÆÉĻµÄAĪŖ0.922£¬F1ĪŖ0.706£¬ČŌÓÅÓŚĘäĖū·½·Ø�£

2.3 ScLabel-NetµÄæēĘ÷¹ŁĄąŠĶ×¢ŹĶ

ŌŚŹµ¼ŹÓ¦ÓĆÖŠ£¬æÉÓĆµÄŹż¾Ż¼ÆĶłĶłĄ´×Ō²»Ķ¬Ę÷¹Ł£¬Ņņ´ĖŠčŅŖĘĄ¹ĄÄ£ŠĶŌŚæēĘ÷¹ŁŹż¾Ż¼ÆÉĻµÄŠŌÄÜ�£Čē±ķ3ĖłŹ¾£¬ScLabel-NetŌŚŠ�Źó²»Ķ¬Ę÷¹ŁÉĻ±ķĻÖ³öÉ«£¬Ę½¾ł×¼Č·ĀŹ´ļµ½97.4%£¬¶ųĮ½ÖÖ»łÓŚÉī¶ČŃ§Ļ°µÄ·½·ØµÄĘ½¾ł×¼Č·ĀŹ·Ö±šĪŖ93.7%ŗĶ95.7%£¬»łÓŚĻą¹ŲŠŌµÄ·½·ØµÄŠŌÄÜøüŹĒĆ÷ĻŌĻĀ½µ�£ĘäÖŠ£¬SingleR±ķĻÖ×ī²ī£¬ŌŚ3øöĘ÷¹ŁÉĻµÄA·Ö±šĪŖ0�¢0.047ŗĶ0.094£¬ÕāæÉÄÜŹĒŅņĪŖĘäø½´ųµÄ7øö²Īæ¼Źż¾Ż¼Æ£Ø5øöČĖĄąŹż¾Ż¼ÆŗĶ2øöŠ�ŹóŹż¾Ż¼Æ£¬ĘäÖŠŠ�Źó²Īæ¼Źż¾Ż¼ÆĪŖŠ�ŹóĆāŅßŅÅ´«Ń§Źż¾ŻæāŗĶŠ�ŹóRNA²āŠņŹż¾Żæā£©Ć»ÓŠŗÜŗĆµŲø²øĒĖłÓŠĻø°ūĄąŠĶ�£Óė»łÓŚĻą¹ŲŠŌµÄ·½·ØŗĶ»łÓŚÉī¶ČŃ§Ļ°µÄ·½·ØĻą±Č£¬ScLabel-NetŌŚæēĘ÷¹ŁŗĶæēĘ½ĢØ³�¾°ÖŠ±ķĻÖ³öøüÓÅŌ½ŗĶĪČ¶ØµÄŠŌÄÜ�£

2.4 Ėę»śÉĻ²ÉŃł

×éŃ§·ÖĪöÖŠĘÕ±é´ęŌŚŹż¾Ż·Ö²¼²»Ę½ŗāµÄĪŹĢā£¬ĶØ³£ÓÉŃ�ŌńŠŌ²ÉŃłŗĶŗ±¼ūŹż¾ŻµÄĻ�Č±ŠŌŅżĘš�£Ėę»śÉĻ²ÉŃł¼¼ŹõæÉŅŌÓŠŠ§»ŗ½āĪ¢µ÷Źż¾Ż¼ÆÖŠµÄ²»Ę½ŗā·Ö²¼�£ČēĶ¼4ĖłŹ¾£¬ScLabel-Net ŌŚ4øöĘ÷¹ŁµÄ6øöŹż¾Ż¼ÆÉĻ¶¼Č�µĆĮĖĻŌÖųµÄŠŌÄÜĢįÉż�£ŌŚ¾¹żÉĻ²ÉŃł´¦ĄķµÄŹż¾Ż¼ÆÉĻ£¬ScLabel-NetµÄA·Ö±šĢįÉżĮĖ1.6%�¢2.2%�¢2.8%ŗĶ8.3% QuakeŗĶALIGNED_KidneyŹż¾Ż¼ÆµÄA·Ö±šĢįÉżĮĖŌ¼10.9%ŗĶ18.8%�£ŌŚF1·ÖŹż·½Ćę£¬ALIGNED_KidneyŹż¾Ż¼ÆµÄĢįÉż×īĪŖĻŌÖų£¬´ļµ½ 214.5%�£Õā±ķĆ÷£¬ŌŚČ±·¦Źż¾ŻŌöĒæµÄĒéæöĻĀ£¬Ä³Š©Ąą±šµÄŌ¤²āŠŌÄÜ²¢²»ĄķĻė�£ÕāŠ©·¢ĻÖ±ķĆ÷£¬»łÓŚĖę»śÉĻ²ÉŃłµÄŹż¾ŻŌöĒæ¼¼ŹõÄÜĻŌÖųĢįÉżScLabel-NetŌŚĻø°ūĄąŠĶ±ź×¢ČĪĪńÖŠµÄŠŌÄÜ�£

<G:\Īäŗŗ¹¤³Ģ´óŃ§\2025\µŚ6ĘŚ\ÕÅĒē-4.tif>[F1][1.2

1.0

0.8

0.6

0.4

0.2

0.0

][GSE267861

GSE264032

Quake

Plasschaert

ALIGNED_Kidney

Baron][Źż¾ŻŌöĒæ ·ĒŹż¾ŻŌöĒæ]

Ķ¼4 ScLabel-NetŌŚŹż¾ŻŌöĒæŗóµÄŠŌÄÜ±ķĻÖ

Fig. 4 Performance of ScLabel-Net with data enhancement

2.5 ×Ō¼ą¶½Ō¤ŃµĮ·¶ŌScLabel-NetŠŌÄÜŗĶŃµĮ·Š§ĀŹµÄÓ°Ļģ

ŌŚµ�Ļø°ūŹż¾Ż¼ÆµÄĻø°ūĄąŠĶ±ź×¢ČĪĪńÖŠ£¬²ÉÓĆĮĖŌŚ´óŠĶĪ´±ź¼ĒŹż¾Ż¼ÆÉĻ½ųŠŠ×Ō¼ą¶½Ō¤ŃµĮ·µÄĒØŅĘŃ§Ļ°²ßĀŌ£¬ÓŠŠ§ĢįÉżĮĖ±¾ĪÄÄ£ŠĶŌŚŠ�Źó·Ī²æ¼°ĘäĖūĘ÷¹ŁÉĻµÄŠŌÄÜ�£ČēĶ¼5ĖłŹ¾£¬¾¹żŌ¤ŃµĮ·µÄScLabel-Net ŌŚGSE267861�¢GSE264032ŗĶQuakeµČ3øöŹż¾Ż¼ÆÉĻČ�µĆĮĖøüŗĆµÄŠŌÄÜĒŅŌŚÉöŌąµČĘäĖūĘ÷¹ŁŹż¾Ż¼ÆÉĻµÄŠŌÄÜŅ²ÓŠĖłŌöĒæ�£ŅŌGSE267861µÄŹż¾Ż¼ÆĪŖĄż£¬Ō¤ŃµĮ·ŗóµÄAŗĶF1·Ö±š´ļµ½ĮĖ0.955ŗĶ0.943£¬Ļą½ĻÓŚĪ´½ųŠŠŌ¤ŃµĮ·µÄAŗĶF1ÓŠĮĖĻŌÖųµÄĢįÉż�£Ķ¬Ź±£¬¾¹żŌ¤ŃµĮ·µÄScLabel-Net ŌŚÄæ±źŹż¾Ż¼ÆÉĻ½ųŠŠĪ¢µ÷ŗó£¬ŹÕĮ²ĖŁ¶ČĆ÷ĻŌ¼Óæģ�£

3 ½į ĀŪ

±¾ŃŠ¾æĶØ¹żScLabel-Netæņ¼Ü£¬²ÉÓĆ×Ō¼ą¶½Ō¤ŃµĮ·²ßĀŌ¶Ōµ�Ļø°ūŹż¾ŻÖŠµÄĻø°ūĄąŠĶ½ųŠŠ×¢ŹĶ£¬ŗøĒ10øöŹż¾Ż¼Æ�£½į¹ū±ķĆ÷£¬ScLabel-NetŌŚŠ�Źó·Ī²æŹż¾Ż¼ÆÉĻµÄĘ½¾ł×¼Č·ĀŹ±ČĻÖÓŠ×ī¼Ń·½·ØĢįÉżĮĖŌ¼2%£¬ĒŅŌŚ´¦Ąķø´ŌÓŹż¾Ż¼ÆŹ±ĻŌÖųÓÅÓŚ»łÓŚĻą¹ŲŠŌŗĶÉī¶ČŃ§Ļ°µÄ·½·Ø�£ŃŠ¾æ»¹·¢ĻÖ£¬Ėę»śÉĻ²ÉŃłµÄŹż¾ŻŌöĒæ¼¼ŹõÄÜÓŠŠ§»ŗ½āµ�Ļø°ūŹż¾Ż¼ÆÖŠ³£¼ūµÄĄąŠĶ·Ö²¼²»Ę½ŗāĪŹĢā�£ScLabel-Net²»½ö¼õÉŁĮĖŃµĮ·Ź±¼ä£¬»¹ÓŠŠ§ĢįÉżĮĖŠ�ŹóĻø°ūĄąŠĶ×¢ŹĶµÄ×¼Č·ŠŌŗĶŠ§ĀŹ£¬¼ÓĖŁĮĖÉśĪļŃ§ĮģÓņµÄŃŠ¾æ½ų³Ģ£¬½ā¾öĮĖ´ó¹ęÄ£Źż¾Ż´¦ĄķÖŠµÄĢōÕ½£¬ĢįÉżĮĖĻø°ūĄąŠĶ×¢ŹĶµÄæÉŠŠŠŌŗĶÓŠŠ§ŠŌ�£