SOPG: Uundaji wa Nywila Zilizoagizwa Kulingana na Utafutaji kwa Mitandao ya Neva Yenye Kujirejesha

Yaliyomo

1.1 Utangulizi na Muhtasari
2. Njia ya SOPG
- 2.1 Dhana ya Msingi ya Uundaji Unaotegemea Utafutaji
- 2.2 Ujumuishaji na Miundo ya Kujirejesha (GPT)
3. Maelezo ya Kiufundi na Msingi wa Hisabati
4. Matokeo ya Majaribio na Uchambuzi wa Utendaji
- 4.1 Ulinganisho na Uchaguzi wa Nasibu
- 4.2 Ulinganishaji na Miundo ya Hali ya Juu
5. Ufahamu Muhimu na Muhtasari wa Takwimu
6. Mfumo wa Uchambuzi: Mfano wa Kesi Bila Msimbo
7. Matumizi ya Baadaye na Mwelekeo wa Siku Zijazo
8. Marejeo
9. Uchambuzi wa Asili wa Mtaalamu

1.1 Utangulizi na Muhtasari

Nywila bado ndio njia kuu ya kuthibitisha utambulisho wa mtumiaji, na hivyo kukisia nywila ni eneo muhimu katika utafiti wa usalama wa mtandao kwa madhumuni ya kushambulia (kuvunja) na ya kujihami (tathmini ya nguvu). Njia za jadi, kuanzia kanuni za kimapokeo hadi miundo ya takwimu kama vile minyororo ya Markov na PCFG, zina mipaka katika ufanisi na utofauti. Kuja kwa ujifunzaji wa kina, hasa mitandao ya neva yenye kujirejesha kama GPT, kuliahidi mabadiliko makubwa. Hata hivyo, kizuizi kikubwa kilibaki: njia ya uundaji yenyewe. Uchaguzi wa kawaida wa nasibu kutoka kwa miundo hii huzaa nywila kwa mpangilio wa nasibu, na kusababisha nakala nyingi na mikakati isiyo na ufanisi ya mashambulizi, kwani nywila zenye uwezekano mkubwa (na hivyo zenye uwezekano zaidi) hazipati kipaumbele.

Makala hii inatangaza SOPG (Uundaji wa Nywila Zilizoagizwa Kulingana na Utafutaji), njia mpya ya uundaji ambayo inamlazimisha muundo wa kukisia nywila wenye kujirejesha kutoa nywila kwa mpangilio wa takriban kushuka kwa uwezekano. Hii inashughulikia msingi wa kutokuwa na ufanisi, kuhakikisha hakuna nakala na kwamba nywila zenye uwezekano mkubwa zaidi huzalishwa kwanza, na kuboresha kwa kiasi kikubwa ufanisi wa mashambulizi ya kamusi yanayofuata.

2. Njia ya SOPG

2.1 Dhana ya Msingi ya Uundaji Unaotegemea Utafutaji

SOPG inapita zaidi ya uchaguzi wa nasibu wa kawaida. Inachukulia mchakato wa uundaji wa nywila kama utafutaji unaoongozwa kupitia nafasi kubwa ya mlolongo unaowezekana wa herufi. Badala ya kuchagua alama kwa nasibu katika kila hatua kulingana na usambazaji wa uwezekano wa muundo, SOPG hutumia algoriti ya utafutaji (kama utafutaji wa boriti au lahaja ya kwanza-bora) kuchunguza kwa utaratibu na kupanga viambishi vya nywila vinavyowezekana, daima kupanua zile zenye matumaini zaidi kwanza. Lengo ni kupitia mandhari ya uwezekano wa muundo kwa njia iliyodhibitiwa, yenye kipaumbele cha uwezekano wa juu kwanza.

2.2 Ujumuishaji na Miundo ya Kujirejesha (GPT)

Waandishi wanaweka mbinu yao katika SOPGesGPT, muundo wa kukisia nywila unaotegemea muundo wa GPT. Hali ya kujirejesha ya GPT—kutabiri alama inayofuata kutokana na alama zote zilizopita—inafaa kabisa kwa SOPG. Algoriti ya utafutaji huingiliana na matokeo ya uwezekano wa muundo wa GPT katika kila hatua ya uundaji, na kuyatumia kutathmini na kupa kipaumbele viambishi vya nywila visivyo kamili. Ushirikiano huu huruhusu SOPGesGPT kutumia utambuzi wenye nguvu wa muundo wa GPT huku ikilazimisha mpangilio wa kimantiki na wenye ufanisi wa uundaji.

3. Maelezo ya Kiufundi na Msingi wa Hisabati

Kiini cha SOPG kinahusisha kuvuka mti wa uwezekano uliofafanuliwa na muundo wa kujirejesha. Hebu nywila iwe mlolongo wa alama $p = (t_1, t_2, ..., t_L)$. Muundo hutoa uwezekano wa mlolongo kama $P(p) = \prod_{i=1}^{L} P(t_i | t_1, ..., t_{i-1})$.

Uchaguzi wa nasibu huchagua $t_i$ kulingana na $P(t_i | context)$, na kusababisha matembezi ya nasibu. SOPG, badala yake, hudumisha seti ya viambishi vya nywila. Katika kila hatua, inapanua kiambishi chenye uwezekano wa juu zaidi wa sasa (au alama inayotokana nayo, kama logi-uwezekano). Kigezo kilichorahisishwa cha kuchagua mgombea anayefuata bora kinaweza kuwakilishwa kama:

$\text{Mgombea Anayefuata} = \arg\max_{c \in C} \, \log P(c)$

ambapo $C$ ni seti ya viambishi vyote vinavyozingatiwa, na $P(c)$ ni uwezekano wake kama ulivyohesabiwa na muundo. Hii inahakikisha uvukaji wa tamaa kuelekea nywila kamili zenye uwezekano wa juu. Mbinu kama upana wa boriti hudhibiti nafasi ya utafutaji na usawa kati ya ukamilifu na gharama ya hesabu.

4. Matokeo ya Majaribio na Uchambuzi wa Utendaji

4.1 Ulinganisho na Uchaguzi wa Nasibu

Makala hii kwanza inaonyesha faida ya msingi ya SOPG ikilinganishwa na uchaguzi wa nasibu kwenye muundo huo wa msingi. Matokeo muhimu:

Hakuna Nakala: SOPG hutoa orodha ya kipekee, iliyoagizwa, na kuondoa hesabu zilizopotea kwenye kurudia.
Ufanisi Bora: Ili kufikia kiwango kile kile cha ufuniko (asilimia ya nywila katika seti ya majaribio ambazo zinakisiwa), SOPG inahitaji idadi ndogo sana ya makisio ya muundo na nywila zilizozalishwa. Hii inabadilishwa moja kwa moja kuwa mashambulizi ya haraka na ya bei nafuu.

Maelezo ya Chati (Ya Kubuniwa Kulingana na Maandishi): Chati ya mstari inayoonyesha "Kiwango cha Ufuniko dhidi ya Idadi ya Nywila Zilizozalishwa." Mstari wa SOPG ungepanda kwa kasi mwanzoni, ukikaa karibu na kiwango cha juu cha ufuniko. Mstari wa Uchaguzi wa Nasibu ungepanda polepole zaidi na kwa njia isiyo ya kawaida, na kuhitaji idadi kubwa zaidi ya makisio kufikia kiwango kile kile cha ufuniko.

4.2 Ulinganishaji na Miundo ya Hali ya Juu

SOPGesGPT ililinganishwa katika jaribio la tovuti moja na miundo mikubwa iliyotangulia: OMEN (Markov), FLA, PassGAN (inayotegemea GAN), VAEPass (inayotegemea VAE), na PassGPT ya wakati huo huo (muundo mwingine unaotegemea GPT).

Kiwango cha Ufuniko: SOPGesGPT ilifikia kiwango cha ufuniko cha 35.06%, na kuzidi wengine wote kwa kiasi kikubwa: 254% juu zaidi ya OMEN, 298% zaidi ya FLA, 421% zaidi ya PassGAN, 380% zaidi ya VAEPass, na 81% juu zaidi ya PassGPT.
Kiwango cha Ufanisi: Makala pia inadai uongozi katika "kiwango cha ufanisi," labda kinamaanisha kiwango cha kuzalisha nywila halali, za kipekee zinazolingana na seti ya majaribio, na kusisitiza zaidi ufanisi.

Maelezo ya Chati: Chati ya mihimili yenye kichwa "Ulinganisho wa Kiwango cha Ufuniko wa Miundo ya Kukisia Nywila." Mhimili wa SOPGesGPT (35.06%) ungekuwa mrefu zaidi kuliko mihimili ya OMEN (~10%), FLA (~9%), PassGAN (~7%), VAEPass (~7.5%), na PassGPT (~19.4%).

5. Ufahamu Muhimu na Muhtasari wa Takwimu

Uongozi wa Kiwango cha Ufuniko

35.06%

Ya juu zaidi kati ya miundo iliyolinganishwa, na uboreshaji wa >80% ikilinganishwa na muundo mzuri zaidi unaofuata wa GPT.

Faida ya Ufanisi dhidi ya Nasibu

>10x

Idadi ndogo sana ya makisio/nywila inahitajika kufikia kiwango kile kile cha ufuniko kama uchaguzi wa nasibu.

Uvumbuzi wa Msingi

Mpangilio wa Uundaji

Inabadilisha mwelekeo kutoka muundo wa usanifu hadi mkakati wa kusimbua, sehemu muhimu lakini iliyopuuzwa.

6. Mfumo wa Uchambuzi: Mfano wa Kesi Bila Msimbo

Fikiria muundo uliorahisishwa uliofunzwa kwenye nywila unaopewa uwezekano wa juu kwa mlolongo kama "password123" na "letmein".

Maelezo ya Uchaguzi wa Nasibu: Muundo unaweza kutoa: "xqjf8*", "password123", "letmein", "xqjf8*" (nakala), "aBcDeF", "password123" (nakala). Inapoteza makisio kwenye nywila zenye uwezekano mdogo na zilizorudiwa.
Maelezo ya SOPG: Kwa kutumia utafutaji wake, ingezalisha kwa utaratibu: "password123", "password12", "password", "letmein", "letmein1", "123456". Inaorodhesha wagombea wenye uwezekano wa juu na lahaja zao za karibu kwanza, na kuongeza uwezekano wa kugonga kwa makisio ya mapema. Hii inafanana na kanuni ya utafutaji wa boriti katika tafsiri ya mashine (kama inavyotumika katika miundo kama Transformer ya Google), ambapo kupata mlolongo wenye uwezekano mkubwa zaidi ni muhimu zaidi kuliko kuzalisha zile tofauti, za nasibu.

7. Matumizi ya Baadaye na Mwelekeo wa Siku Zijazo

Matumizi ya Haraka: SOPG inaboresha moja kwa moja zana zinazopatikana kwa tathmini ya nguvu ya nywila ya makini. Makampuni ya usalama yanaweza kujenga vifaa vya kuvunja vyenye ufanisi zaidi kukagua sera za nywila za makampuni. Pia inainua kiwango cha utafiti wa ulinzi, na kuhitaji uundaji wa nywila zinazostahimili makisio hayo yaliyoagizwa na yenye akili.

Mwelekeo wa Utafiti wa Siku Zijazo:

Mikakati ya Utafutaji Mseto: Kuchanganya SOPG na nasibu kidogo kuchunguza nywila zenye uwezekano mdogo kidogo lakini zinazowezekana kuwa halali "zisizo za kawaida," na kuepuka upeo wa ndani katika nafasi ya uwezekano.
Uundaji wa Kukabiliana/Kushambulia: Miundo inayoweza kubadilisha mpangilio wake wa uundaji kulingana na maoni ya sehemu kutoka kwa mfumo lengwa (mfano, majibu ya kudhibiti kiwango), sawa na mashambulizi ya kushambulia katika ML.
Zaidi ya Nywila: Muundo wa uundaji ulioagizwa unaweza kufaa matumizi mengine ya miundo ya kujirejesha ambapo uwezekano wa matokeo unahusiana na "ubora" au "uwezekano," kama vile kuzalisha muundo unaowezekana wa udhaifu wa programu au mlolongo wa trafiki ya mtandao kwa ajili ya majaribio ya usalama.
Hatua za Kuzuia: Utafiti kuhusu sera za uundaji wa nywila na algoriti za kuchanganya ambazo hasa zinapunguza ufanisi wa mashambulizi ya kukisia yaliyoagizwa kwa uwezekano.

8. Marejeo

M. Jin, J. Ye, R. Shen, H. Lu, "Search-based Ordered Password Generation of Autoregressive Neural Networks," Manuscript Submitted for Publication, 2023.
A. Radford, et al., "Language Models are Unsupervised Multitask Learners," OpenAI, 2019. (Msingi wa GPT-2)
J. Goodfellow, et al., "Generative Adversarial Nets," Advances in Neural Information Processing Systems, 2014. (Msingi wa PassGAN)
M. Hitaj, et al., "PassGAN: A Deep Learning Approach for Password Guessing," International Conference on Applied Cryptography and Network Security, 2019.
P. G. Kelley, et al., "Guess Again (and Again): Measuring Password Strength by Simulating Password-Cracking Algorithms," IEEE Symposium on Security and Privacy, 2012. (OMEN, miundo ya Markov)
NIST Special Publication 800-63B, "Digital Identity Guidelines: Authentication and Lifecycle Management," 2017.

9. Uchambuzi wa Asili wa Mtaalamu

Ufahamu wa Msingi: Mafanikio makubwa ya makala hii sio usanifu mwingine wa neva—ni shambulio la upasuaji kwenye kizuizi cha uundaji. Kwa miaka mingi, uwanja wa kukisia nywila, kama uundaji wa maandishi wa mapema, ulijishughulisha na kujenga wakadiriaji bora wa uwezekano (muundo) huku ukitumia njia ya kawaida ya kutoa makisio kutoka kwake (uchaguzi wa nasibu). SOPG inatambua kwa usahihi kutokuwepo kwa uhusiano huu. Ufahamu kwamba jinsi unavyozalisha kutoka kwa muundo ni muhimu kama muundo yenyewe ni wa kina. Inabadilisha mandhari ya ushindani kutoka kwa mashindano ya silaha ya ukubwa wa muundo na data ya mafunzo hadi moja ambayo inajumuisha ufanisi wa algoriti katika kusimbua, somo ambalo jamii pana ya ML ilijifunza na miundo ya mlolongo-hadi-mlolongo miaka iliyopita.

Mtiririko wa Kimantiki na Nguvu: Mantiki ni kamili: 1) Miundo ya kujirejesha kama GPT ni wakadiriaji bora wa uwezekano wa nywila. 2) Uchaguzi wa nasibu kutoka kwake hauna ufanisi kwa kukisia, ambapo lengo ni kuongeza idadi ya magengo kwa kila kitengo cha hesabu. 3) Kwa hivyo, badilisha uchaguzi wa nasibu na algoriti ya utafutaji ambayo inapa kipaumbele wazi matokeo yenye uwezekano wa juu. Nguvu iko katika unyenyekevu wake na matokeo yanayoweza kuonyeshwa, makubwa. Uboreshaji wa 81% ikilinganishwa na PassGPT, ambayo inatumia muundo wa msingi sawa, unahusishwa karibu kabisa na njia ya uundaji, na kuthibitisha nadharia. Kuondolewa kwa nakala ni uboreshaji muhimu wa ufanisi wa bure.

Kasoro na Tahadhari: Uchambuzi huu, ingawa unaonyesha, una mapungufu. Kwanza, "jaribio la tovuti moja" linaacha maswali juu ya ujumla. Kama ilivyoelezewa katika makala ya CycleGAN (Zhu et al., 2017) na fasihi pana ya ML, muundo unaweza kufaa kupita kiasi kwa usambazaji wa seti maalum ya data. Je, ubora wa SOPGesGPT unashikilia katika seti mbalimbali za data za nywila kutoka tamaduni na aina tofauti za huduma? Pili, mchakato wa utafutaji una gharama kubwa zaidi ya hesabu kwa kila nywila iliyozalishwa kuliko uchaguzi wa nasibu. Makala yanadai ushindi wa wavu katika "makisio," lakini muda halisi wa ukuta na mzigo wa kumbukumbu wa kudumisha boriti ya utafutaji haujachunguzwa kikamilifu. Je, utafutaji unaweza kuwa kizuizi kwa miundo mikubwa sana au boriti? Mwisho, athari za kimaadili zimepitwa. Hii ni zana yenye nguvu inayopunguza kikwazo cha mashambulizi yenye ufanisi. Ingawa inafaa kwa watetezi, uchapishaji wake unahitaji mjadala sambamba juu ya mikakati ya kupunguza, ambayo haijakua vizuri.

Ufahamu Unaoweza Kutekelezwa: Kwa watendaji wa usalama, makala hii ni amri: tathmini upya mara moja sera za nywila chini ya muundo huu mpya wa tishio. Mahitaji ya urefu na utata ambayo yanazuia miundo ya Markov yanaweza kuanguka kwa haraka kwa miundo ya GPT inayoendeshwa na SOPG. Sera lazima zibadilike kuelekea kukuza kutotabirika badala ya utata tu (mfano, "Tr0ub4dor&3" ina utata lakini inaweza kukisiwa; "correct-horse-battery-staple" ni ndefu zaidi na isiyo na uwezekano mkubwa kwa miundo hii). Kwa watafiti, njia ni wazi: 1) Rudia na jaribu kwenye seti nyingi za data kuthibitisha uthabiti. 2) Chunguza njia mseto, labda kuanzisha SOPG na kanuni kutoka PCFG kuelekeza utafutaji kuelekea nywila zilizoundwa kwa kimantiki. 3) Anzisha utafiti wa kujihami kuhusu uundaji wa nywila "zinazostahimili SOPG," kwa uwezekano kutumia miundo ya kuzalisha kuunda nywila zenye nguvu, zinazokumbukika ambazo ziko katika maeneo yenye uwezekano mdogo wa miundo ya sasa ya washambuliaji. Kazi ya taasisi kama Taasisi ya Kitaifa ya Viwango na Teknolojia (NIST) kuhusu miongozo ya nywila lazima sasa izingatie mruko huu katika akili ya kukisia. SOPG sio uboreshaji tu; ni mabadiliko ya muundo ambayo yanahitaji majibu katika mfumo mzima wa usalama wa nywila.