Chagua Lugha

SOPG: Uundaji wa Nywila Zilizoagizwa Kulingana na Utafutaji kwa Mitandao ya Neva ya Kujirejesha

Uchambuzi wa SOPG, mbinu mpya ya kuunda nywila kwa mpangilio wa kushuka kwa uwezekano kwa kutumia mitandao ya neva ya kujirejesha, ikiboresha sana ufanisi wa kukisia nywila.
computationalcoin.com | PDF Size: 0.5 MB
Ukadiriaji: 4.5/5
Ukadiriaji Wako
Umekadiria waraka huu tayari
Kifuniko cha Waraka PDF - SOPG: Uundaji wa Nywila Zilizoagizwa Kulingana na Utafutaji kwa Mitandao ya Neva ya Kujirejesha

Orodha ya Yaliyomo

1. Utangulizi

Nywila bado ndio njia inayotumika zaidi ya kuthibitisha utambulisho wa mtumiaji. Kwa hivyo, kukisia nywila ni sehemu muhimu ya utafiti wa usalama wa mtandao, ikisaidia upimaji wa usalama wa kushambulia (kupasua) na tathmini ya nguvu ya kujihami. Mbinu za jadi, kutoka kwa uorodheshaji unaotegemea kanuni hadi mifano ya takwimu kama vile minyororo ya Markov na PCFG, zina mapungufu ya asili katika ufanisi na utofauti. Kuja kwa ujifunzaji wa kina, hasa mitandao ya neva ya kujirejesha, kuliahidi mabadiliko makubwa. Hata hivyo, kizuizi muhimu kilibaki: mbinu ya kawaida ya uzalishaji wa sampuli nasibu. Hii husababisha nywila zinazorudiwa na, zaidi ya madhara, mpangilio wa nasibu wa uzalishaji, na kuwalazimisha washambuliaji kuchambua orodha kubwa zisizo na ufanisi. Karatasi hii inatangaza SOPG (Uundaji wa Nywila Zilizoagizwa Kulingana na Utafutaji), mbinu mpya iliyoundwa kufanya mifano ya kukisia nywila ya kujirejesha kuunda nywila kwa mpangilio wa kushuka kwa uwezekano, na hivyo kuongeza sana ufanisi wa shambulio.

2. Usuli na Kazi Inayohusiana

2.1 Mabadiliko ya Kukisia Nywila

Kukisia nywila kumebadilika kupitia awamu tofauti. Mbinu za awali zilitegemea mashambulio ya kamusi na kanuni zilizoundwa kwa mikono (k.m., John the Ripper), ambazo zilikuwa za heuristiki na zinazotegemea uzoefu. Kuenea kwa uvujaji wa nywila kwa kiwango kikubwa (k.m., RockYou mwaka 2009) kulifanya iwezekanavyo kutumia mbinu za takwimu zinazotokana na data. Modeli ya Markov (Weir et al., 2009) na Sarufi ya Mazingira ya Bure ya Uwezekano (PCFG) (Ma et al., 2014) zilitoa mfumo wa kimfumo zaidi, unaotegemea uwezekano wa uzalishaji, ingawa ziliweza kukosa usahihi na hazikuwa na uwezo wa kuiga utegemezi tata na wa masafa marefu katika muundo wa nywila.

2.2 Mbinu za Mitandao ya Neva

Mifano ya ujifunzaji wa kina, hasa Mitandao ya Kuzalisha ya Kupingana (GANs) kama PassGAN (Hitaj et al., 2017) na mifano ya kujirejesha kama vile ile inayotegemea usanifu wa LSTM au GPT, hujifunza usambazaji wa uwezekano wa nywila moja kwa moja kutoka kwa data. Wanaweza kuzalisha nywila zenye utofauti mkubwa na za kweli. Hata hivyo, kwa kawaida hutumia uchanganuzi wa nasibu (k.m., uchanganuzi wa multinomial) kutoka kwa usambazaji uliojifunzwa katika kila hatua ya uzalishaji. Mchakato huu wa msingi haujui mpangilio wa kimataifa wa uwezekano kamili wa nywila, na kusababisha kutokuwa na ufanisi ambayo SOPG inalenga kutatua.

Uboreshaji wa Kiwango cha Ufunikaji

35.06%

Kiwango cha ufunikaji kilichopatikana na SOPGesGPT, kikishinda sana waliotangulia.

Faida ya Ufanisi dhidi ya Uchanganuzi wa Nasibu

Wachache Zaidi

Nywila na uchanganuzi unaohitajika na SOPG kufikia ufunikaji sawa.

Kiwango cha Kurudiwa

0%

SOPG inahakikisha hakuna uzalishaji wa nywila zinazorudiwa.

3. Mbinu ya SOPG

3.1 Dhana ya Msingi

SOPG inabadilisha uzalishaji wa nywila kutoka kwa shida ya uchanganuzi wa nasibu kuwa shida ya utafutaji unaoongozwa. Badala ya kuchagua herufi inayofuata kwa nasibu, inatumia algorithm ya utafutaji (labda aina ya utafutaji wa boriti au utafutaji bora-kwanza) kuchunguza nafasi ya uendelezaji unaowezekana wa nywila, ikipa kipaumbele njia zinazoongoza kwa nywila kamili zenye uwezekano unaokadiriwa wa juu. Lengo ni kutoa orodha ya nywila kwa mpangilio unaokaribia sana mpangilio wa kushuka kwa kweli kulingana na $P(nywila|modeli)$.

3.2 Algorithm ya Utafutaji

Ingawa muhtasari wa PDF haujaelezea algorithm maalum, tabia iliyoelezewa inapendekeza mbinu ambayo huhifadhi foleni ya kipaumbele ya viambishi awali vya nywila zinazowezekana. Katika kila hatua, inapanua kiambishi awali kinachotarajiwa zaidi (uwezekano wa juu zaidi wa jumla) kwa kuuliza mtandao wa neva kuhusu usambazaji wa herufi inayofuata, na kuzalisha wagombea wapya. Kwa kuchunguza kwa kimfumo maeneo yenye uwezekano wa juu ya nafasi ya nywila kwanza, inahakikisha uzalishaji wa mapema wa nywila zinazowezekana zaidi na kwa asili huzuia kurudiwa.

3.3 Modeli ya SOPGesGPT

Waandishi wanaweka mbinu yao kwenye usanifu unaotegemea GPT, na kuunda SOPGesGPT. Modeli ya GPT (k.m., transformer ya kusimamisha tu) hufunzwa kwenye seti za data za nywila zilizovuja ili kutabiri herufi inayofuata katika mlolongo. SOPG kisha hutumika kama mbinu ya uzalishaji/uchanganuzi juu ya modeli hii iliyofunzwa, ikichukua nafasi ya uchanganuzi wa kawaida.

4. Maelezo ya Kiufundi na Uundaji wa Kihisabati

Modeli ya kujirejesha inafafanua uwezekano wa nywila $\mathbf{x} = (x_1, x_2, ..., x_T)$ kama bidhaa ya uwezekano wa masharti: $$P(\mathbf{x}) = \prod_{t=1}^{T} P(x_t | x_1, ..., x_{t-1})$$ ambapo $x_t$ ni herufi katika nafasi $t$, na $T$ ni urefu wa nywila. Uchanganuzi wa kawaida huchagua $x_t \sim P(\cdot | x_1, ..., x_{t-1})$.

SOPG, kwa dhana, inalenga kupata na kutoa mlolongo $\mathbf{x}$ kwa mpangilio wa kupungua kwa $P(\mathbf{x})$. Hii inaweza kutazamwa kama shida ya utafutaji wa njia fupi katika mti ambapo nodi ni viambishi awali, gharama za makali zinahusiana na $-\log P(x_t | kiambishi awali)$, na lengo ni kuorodhesha njia (nywila) kwa mpangilio wa kupanda kwa gharama ya jumla (yaani, kupungua kwa uwezekano). Algorithm kama Utafutaji wa Gharama Sawa (UCS) au aina yake iliyofungwa, Utafutaji wa Boriti na upana mkubwa wa boriti na ukataji wa nguvu, wanaweza kufikia mpangilio huu wa takriban. Ufunguo ni kwamba mpaka wa utafutaji unapewa kipaumbele kwa alama ya uwezekano wa njia ya sasa.

5. Matokeo ya Majaribio na Uchambuzi

5.1 Ulinganisho na Uchanganuzi wa Nasibu

Karatasi hii inawasilisha matokeo ya kulazimisha yanayolinganisha SOPG na uchanganuzi wa nasibu wa kawaida kwenye modeli sawa ya msingi. Matokeo muhimu:

  • Hakuna Kurudiwa: SOPG inazalisha orodha ya kipekee, wakati uchanganuzi wa nasibu hutoa kurudiwa nyingi, na kupoteza juhudi za kompyuta.
  • Ufanisi Bora wa Shambulio: Ili kufikia kiwango cha ufunikaji sawa (asilimia ya nywila katika seti ya majaribio zilizopasuliwa), SOPG inahitaji uchanganuzi mchache sana wa modeli na inazalisha orodha ndogo sana ya jumla. Hii inabadilishwa moja kwa moja kuwa kupasua nywila kwa kasi katika hali halisi za ulimwengu.

5.2 Ulinganisho na Mbinu Bora za Sasa

SOPGesGPT ililinganishwa na mifano kuu ya kukisia nywila: OMEN (Markov), FLA, PassGAN (GAN), VAEPass (VAE), na PassGPT ya kisasa. Katika jaribio la tovuti moja:

  • Kiwango cha Ufunikaji: SOPGesGPT ilifikia 35.06%, ikishinda OMEN kwa 254%, FLA kwa 298%, PassGAN kwa 421%, VAEPass kwa 380%, na PassGPT kwa 81%.
  • Kiwango cha Ufanisi: Karatasi pia inadai uongozi katika "kiwango cha ufanisi," labda kipimo kinachohusiana na ubora au kiwango cha kupiga cha nywila zilizozalishwa mapema, ambacho ndio nguvu kuu ya SOPG.
Hii inaonyesha kuwa mbinu ya uzalishaji (SOPG) ni muhimu kama usanifu wa modeli kwa utendaji.

Ufafanuzi wa Chati (Kinadharia kulingana na maandishi): Chati ya mstari inayolinganisha "Kiwango cha Ufunikaji dhidi ya Idadi ya Nywila Zilizozalishwa" ingeonyesha mkunjo wa SOPGesGPT unapanda kwa kasi na kusimama mapema, wakati mkunjo wa Uchanganuzi wa Nasibu ungepanda polepole zaidi na kuhitaji idadi kubwa zaidi kwenye mhimili wa x kufikia urefu sawa. Chati ya mhimili kwa "Kiwango cha Mwisho cha Ufunikaji" ingeonyesha mhimili wa SOPGesGPT ukiwa juu sana kuliko ule wa OMEN, PassGAN, na PassGPT.

6. Mfumo wa Uchambuzi na Mfano wa Kesi

Mfumo wa Kutathmini Mifano ya Kukisia Nywila:

  1. Usanifu wa Modeli na Mafunzo: Ni nini mtandao wa neva wa msingi (GAN, VAE, Transformer ya Kujirejesha)? Inafunzwa vipi?
  2. Mbinu ya Uzalishaji: Nywila huzalishwaje kutoka kwa modeli iliyofunzwa? (k.m., Uchanganuzi wa Nasibu, Utafutaji wa Boriti, SOPG). Hii ndio lengo kuu la karatasi.
  3. Mpangilio na Ufanisi: Je, mbinu hutoa nywila kwa mpangilio muhimu (kupungua kwa uwezekano)? Ni nini ufanisi wa kompyuta/kukisia?
  4. Utofauti na Kurudiwa: Je, inazalisha nywila mpya au kurudiwa nyingi?
  5. Utendaji wa Kipimo: Kiwango cha Ufunikaji, Kiwango cha Ufanisi, na kasi kwenye seti za data za kawaida (k.m., RockYou).

Mfano wa Kesi Isiyo ya Msimbo: Fikiria washambuliaji wawili, Alice na Bob, wakitumia modeli sawa ya nywila ya GPT iliyofunzwa. Alice anatumia uchanganuzi wa nasibu wa kawaida. Bob anatumia SOPG. Ili kupasua seti ya majaribio ya nywila 1000, programu ya Alice inaweza kuhitaji kuzalisha makisia milioni 10, na kurudiwa 30%, ili kupasua 350. Programu ya Bob inayoendeshwa na SOPG inaweza kuzalisha makisia milioni 1 tu ya kipekee kwa mpangilio bora ili kupasua 350 sawa. Shambulio la Bob lina ufanisi wa rasilimali mara 10 zaidi na linakamilika kwa kasi.

7. Matarajio ya Matumizi na Mwelekeo wa Baadaye

Matumizi ya Haraka:

  • Upimaji wa Nguvu ya Nywila Unaotangulia: Timu za usalama zinaweza kutumia mifano iliyoboreshwa na SOPG kukagua kwa ufanisi zaidi sera za nywila zilizopendekezwa kwa kuzalisha vekta za shambulio zinazowezekana zaidi kwanza.
  • Urejeshaji wa Nywila wa Kihalisi: Zana za urejeshaji wa nywila zinazoruhusiwa kisheria zinaweza kuunganisha SOPG ili kuongeza viwango vya mafanikio ndani ya bajeti ya wakati/kompyuta iliyopunguzwa.
Mwelekeo wa Utafiti wa Baadaye:
  • Mifano ya Mseto: Kuchanganya uzalishaji ulioagizwa wa SOPG na nguvu za usanifu mwingine (k.m., kuunganisha ujuzi wa kisemantiki kutoka kwa mifano kubwa ya lugha).
  • SOPG ya Kubadilika/Inayotumika Mtandaoni: Kubadilisha mkakati wa utafutaji kwa wakati halisi kulingana na maoni kutoka kwa matokeo ya sehemu ya shambulio.
  • Hatua za Kuzuia: Utafiti katika mbinu mpya za kuhifadhi au kuhifadhi nywila ambazo zina uwezo maalum wa kustahimili mashambulio yaliyoagizwa na yanayoendeshwa na uwezekano kama SOPG.
  • Zaidi ya Nywila: Kutumia dhana ya uzalishaji ulioagizwa kwenye nyanja nyingine za usalama kama vile kuzalisha URL zinazowezekana za udanganyifu au aina tofauti za virusi vya kompyuta.

8. Marejeo

  1. Weir, M., Aggarwal, S., Medeiros, B., & Glodek, B. (2009). Password Cracking Using Probabilistic Context-Free Grammars. In IEEE Symposium on Security and Privacy.
  2. Ma, J., Yang, W., Luo, M., & Li, N. (2014). A Study of Probabilistic Password Models. In IEEE Symposium on Security and Privacy.
  3. Hitaj, B., Gasti, P., Ateniese, G., & Perez-Cruz, F. (2017). PassGAN: A Deep Learning Approach for Password Guessing. In International Conference on Applied Cryptography and Network Security.
  4. Goodfellow, I., et al. (2014). Generative Adversarial Nets. Advances in Neural Information Processing Systems.
  5. Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Blog.
  6. Melicher, W., et al. (2016). Fast, Lean, and Accurate: Modeling Password Guessability Using Neural Networks. In USENIX Security Symposium.

9. Uchambuzi wa Asili na Uchambuzi wa Mtaalamu

Uelewa wa Msingi: Karatasi ya Jin et al. inatoa shambulio la upasuaji kwenye kizuizi muhimu lakini kilichopuuzwa katika usalama wa kushambulia unaoendeshwa na AI: mkakati wa uzalishaji. Kwa miaka mingi, uwanja huu umekuwa ukijishughulisha na usanifu wa modeli—GANs dhidi ya VAEs dhidi ya Transformers—kukopa sana kutoka kwa ML ya kawaida, kama inavyoonekana katika mwelekeo kutoka PassGAN (ilivutiwa na GANs za picha [4]) hadi PassGPT (ilivutiwa na LLMs kama GPT-2 [5]). Karatasi hii inasema kwa usahihi kwamba hata modeli kamili inazuiliwa na uchanganuzi wa nasibu wa kijinga. SOPG sio uboreshaji wa kidogo tu; ni mawazo ya msingi ya mchakato wa uchanganuzi, ikibadilisha dhana kutoka "uzalishaji wa nasibu" hadi "uchunguzi unaoongozwa, bora zaidi". Uelewa huu ni wa thamani kwa kukisia nywila kama vile Utafutaji wa Mti wa Monte Carlo wa AlphaGo ulivyokuwa kwa AI ya michezo—ni kuhusu kutafuta nafasi iliyojifunza kwa akili.

Mtiririko wa Kimantiki na Nguvu: Mantiki hiyo ni kamili. 1) Mifano ya kujirejesha hutoa usambazaji wa uwezekano unaoweza kufuatika juu ya mlolongo. 2) Uchanganuzi wa nasibu kutoka kwa usambazaji huu hauna ufanisi wa kupata vitu vya uwezekano wa juu kwa haraka. 3) Kwa hivyo, tumia algorithm ya utafutaji (dhana ya CS iliyothibitishwa vizuri) kuorodhesha matokeo kwa uwezekano. Nguvu iko katika unyenyekevu wake na athari kubwa. Matokeo ni ya kushangaza: uboreshaji wa 81% juu ya modeli ya kisasa ya PassGPT kutokana na kubadilisha mbinu ya uzalishaji tu. Hii inasisitiza kanuni ambayo mara nyingi husahaulika katika AI inayotumika: uhandisi wa uchanganuzi unaweza kutoa faida kubwa kuliko kuongeza ukubwa wa modeli. Hakikisho la kurudiwa sifuri ni ushindi mwingine mkubwa wa vitendo, ukiondoa mizunguko ya kompyuta iliyopotea.

Kasoro na Maswali Yasiyojibiwa: Ufupi wa karatasi katika dondoo iliyotolewa ndio udhaifu wake mkuu. "Algorithm ya utafutaji" ni kisanduku cheusi. Je, ni A*? Utafutaji wa Boriti na heuristiki ya ukataji wa kisasa? Mzigo wa kompyuta wa utafutaji yenyewe haujadiliwa. Ingawa inapunguza idadi ya uchanganuzi unaohitajika kwa kiwango fulani cha ufunikaji, kila hatua ya uchanganuzi katika utafutaji inaweza kuwa ngumu zaidi kuliko uchanganuzi rahisi. Kuna usawazisho kati ya kina cha utafutaji, upana, na ucheleweshaji ambao unahitaji uchambuzi. Zaidi ya hayo, tathmini ni "jaribio la tovuti moja". SOPG inaeneaje kwenye seti tofauti za data (za kampuni dhidi ya watumiaji, lugha tofauti)? Uimara unahitaji uthibitisho.

Uelewa Unaoweza Kutekelezwa: Kwa Wataalamu wa Usalama: Karatasi hii ni wito wa kuamsha. Vipima nguvu vya nywila vya kujihami sasa lazima vizingatie mashambulio yaliyoagizwa, yanayofanana na SOPG, ambayo yana nguvu zaidi kuliko mashambulio ya kawaida ya nguvu au hata mashambulio ya zamani ya neva. Sera za nywila lazima zibadilike. Kwa Watafiti wa AI: Somo ni kuangalia zaidi ya kazi ya hasara. Utaratibu wa uchanganuzi/uzalishaji ni raia wa daraja la kwanza katika kubuni mifumo ya kuzalisha kwa usalama, matibabu, au usanifu. Mbinu hii inaweza kutumika kwa kazi nyingine za usalama za kujirejesha, kama vile kuzalisha mizigo ya shambulio la mtandao. Kwa Waandishi: Hatua inayofuata ni kufungua chanzi algorithm, kuelezea undani wake, na kukimbia vipimo vya kiwango kikubwa, vinavyovuka seti za data. Kushirikiana na mashirika kama Kituo cha Usalama wa Mtandao (CIS) au kurejelea mifumo kutoka kwa Miongozo ya Utambulisho wa Dijiti ya NIST (SP 800-63B) inaweza kuweka kazi hiyo katika viwango vya vitendo vya kujihami. SOPG ni lever bora; sasa tunahitaji kupima nguvu yake kamili na kufundisha watetezi jinsi ya kujiandaa dhidi yake.