SOPG: Tsarin Samar da Kalmar Sirri Mai Tsari Bisa Bincike don Cibiyoyin Jijiyoyi Masu Gudanar da Kai (Autoregressive Neural Networks)

Teburin Abubuwan Ciki

1.1 Gabatarwa & Bayyani
2. Hanyar SOPG
- 2.1 Babban Ra'ayi na Samarwa Mai Tsari Bisa Bincike
- 2.2 Haɗawa da Tsarin Gudanar da Kai (GPT)
3. Cikakkun Bayanai na Fasaha & Tushen Lissafi
4. Sakamakon Gwaji & Binciken Aiki
- 4.1 Kwatantawa da Samun Samfuri Bazuwa
- 4.2 Kwatantawa da Mafi Kyawun Tsarin Zamani
5. Muhimman Bayanai & Taƙaitaccen Ƙididdiga
6. Tsarin Bincike: Nazarin Lamari Ba tare da Lambar Ba
7. Hangen Nesa na Aikace-aikace & Hanyoyin Gaba
8. Nassoshi
9. Binciken Kwararre na Asali

1.1 Gabatarwa & Bayyani

Kalmomin sirri sun ci gaba da zama babbar hanyar tabbatar da mai amfani, wanda ya sa zato na kalmar sirri ya zama muhimmin fanni a cikin binciken tsaron yanar gizo don dalilai na kai hari (fasa) da na tsaro (ƙimar ƙarfi). Hanyoyin gargajiya, daga dabaru na tushen ƙa'ida zuwa tsarin ƙididdiga kamar sarƙoƙin Markov da PCFG, suna da iyakoki a cikin inganci da bambancin. Zuwan ilimin zurfin, musamman cibiyoyin jijiyoyi masu gudanar da kai kamar GPT, sun yi alƙawarin canza tsari. Duk da haka, wata babbar matsala ta ci gaba: hanyar samarwa kanta. Samfurin bazuwa na yau da kullun daga waɗannan tsare-tsare yana samar da kalmomin sirri cikin tsari bazuwa, yana haifar da kwafi masu yawa da dabarun kai hari marasa inganci, saboda kalmomin sirri masu yuwuwar girma (don haka mafi yuwuwa) ba a ba su fifiko ba.

Wannan takarda ta gabatar da SOPG (Samar da Kalmar Sirri Mai Tsari Bisa Bincike), wata sabuwar hanyar samarwa wacce ke tilasta tsarin zato na kalmar sirri mai gudanar da kai ya fitar da kalmomin sirri cikin kusan tsari mai saukowa na yuwuwar. Wannan yana magance babban rashin inganci, yana tabbatar da babu kwafi kuma ana samar da kalmomin sirri mafi yuwuwa da farko, yana inganta tasirin haruffan ƙamus na gaba sosai.

2. Hanyar SOPG

2.1 Babban Ra'ayi na Samarwa Mai Tsari Bisa Bincike

SOPG ya wuce samfurin bazuwa mara hankali. Yana ɗaukar tsarin samar da kalmar sirri a matsayin bincike mai jagora ta cikin sararin samaniya na yuwuwar jerin haruffa. Maimakon ɗaukar alamomi bazuwa a kowane mataki bisa ga rarraba yuwuwar tsarin, SOPG yana amfani da algorithm na bincike (kamar binciken katako ko bambance-bambancen farko mafi kyau) don bincika da kuma jera abubuwan da za a iya zama gabaɗayan kalmar sirri cikin tsari, koyaushe yana faɗaɗa waɗanda suka fi dacewa da farko. Manufar ita ce bi ta yanayin yuwuwar tsarin cikin tsari mai sarrafawa, yuwuwar girma-farko.

2.2 Haɗawa da Tsarin Gudanar da Kai (GPT)

Marubutan sun aiwatar da hanyarsu a cikin SOPGesGPT, tsarin zato na kalmar sirri wanda ya dogara da tsarin GPT. Yanayin gudanar da kai na GPT—hasashen alama ta gaba idan aka ba da duk alamomin da suka gabata—ya dace daidai da SOPG. Algorithm ɗin bincike yana hulɗa tare da sakamakon yuwuwar tsarin GPT a kowane mataki na samarwa, yana amfani da su don kimantawa da ba da fifiko ga ɓangarorin ɓangarorin kalmar sirri. Wannan haɗin gwiwa yana ba da damar SOPGesGPT ya yi amfani da ƙarfin gano tsarin GPT yayin da yake sanya tsari mai ma'ana, mai inganci.

3. Cikakkun Bayanai na Fasaha & Tushen Lissafi

Jigon SOPG ya ƙunshi kewaya bishiyar yuwuwar da tsarin gudanar da kai ya ayyana. Bari kalmar sirri ta zama jerin alamomi $p = (t_1, t_2, ..., t_L)$. Tsarin yana ba da yuwuwar jerin kamar $P(p) = \prod_{i=1}^{L} P(t_i | t_1, ..., t_{i-1})$.

Samfurin bazuwa yana zaɓar $t_i$ bisa ga $P(t_i | mahallin)$, yana haifar da tafiya bazuwa. SOPG, a maimakon haka, yana kiyaye saitin gabaɗayan kalmar sirri. A kowane mataki, yana faɗaɗa gabaɗayan kalmar sirri tare da mafi girman yuwuwar na yanzu (ko maki da aka samo daga gare ta, kamar yuwuwar log). Zaɓi mai sauƙaƙe na mafi kyawun ɗan takara na gaba ana iya wakilta shi kamar haka:

$\text{NextCandidate} = \arg\max_{c \in C} \, \log P(c)$

inda $C$ shine saitin duk gabaɗayan kalmar sirri da ake la'akari da su, kuma $P(c)$ shine yuwuwarsa kamar yadda tsarin ya lissafta. Wannan yana tabbatar da tafiya mai son kai zuwa cikakkun kalmomin sirri masu yuwuwar girma. Fasaha kamar faɗin katako suna sarrafa sararin bincike da daidaitawa tsakanin mafi kyau da farashin lissafi.

4. Sakamakon Gwaji & Binciken Aiki

4.1 Kwatantawa da Samun Samfuri Bazuwa

Takardar ta fara nuna fa'idar asali ta SOPG akan samfurin bazuwa iri ɗaya. Muhimman binciken:

Sifili Kwafi: SOPG yana samar da jerin sunaye na musamman, masu tsari, yana kawar da ɓata lissafi akan maimaitawa.
Inganci Mafi Girma: Don cimma irin wannan yawan rufewa (kashi na kalmomin sirri a cikin saitin gwaji waɗanda ake zato), SOPG yana buƙatar ƙananan ƙididdiga na tsari da kalmomin sirri da aka samar. Wannan yana fassara kai tsaye zuwa saurin kai hari, mai arha.

Bayanin Chati (Hasashe bisa rubutu): Chati mai layi wanda ke nuna "Yawan Rufewa vs. Yawan Kalmomin Sirri da Aka Samar." Layin SOPG zai tashi da sauri da farko, yana tsayawa kusa da matsakaicin yawan rufewa. Layin Samfurin Bazuwa zai tashi da sauri sosai kuma ba daidai ba, yana buƙatar ƙarin zato mai yawa don isa irin wannan yawan rufewa.

4.2 Kwatantawa da Mafi Kyawun Tsarin Zamani

An kwatanta SOPGesGPT a cikin gwaji na rukunin yanar gizo guda ɗaya da manyan magabata: OMEN (Markov), FLA, PassGAN (tushen GAN), VAEPass (tushen VAE), da PassGPT na zamani (wani tsarin tushen GPT).

Yawan Rufewa: SOPGesGPT ya cimma yawan rufewa na 35.06%, ya zarce duk sauran da manyan tazara: 254% mafi girma fiye da OMEN, 298% fiye da FLA, 421% fiye da PassGAN, 380% fiye da VAEPass, da 81% mafi girma fiye da PassGPT.
Yawan Tasiri: Takardar kuma tana da'awar jagoranci a cikin "yawan tasiri," mai yiwuwa yana nufin yawan samar da kalmomin sirri ingantattu, na musamman waɗanda suka dace da saitin gwaji, yana ƙara jaddada inganci.

Bayani na Chati: Chati mai mashaya mai taken "Kwatanta Yawan Rufewa na Tsarin Zato na Kalmar Sirri." Mashaya don SOPGesGPT (35.06%) zai zama dogo sosai fiye da mashayar OMEN (~10%), FLA (~9%), PassGAN (~7%), VAEPass (~7.5%), da PassGPT (~19.4%).

5. Muhimman Bayanai & Taƙaitaccen Ƙididdiga

Jagorancin Yawan Rufewa

35.06%

Mafi girma a cikin tsare-tsaren da aka yi kwatankwacinsu, tare da ingantawa >80% akan tsarin GPT na gaba mafi kyau.

Ribin Inganci vs. Bazuwa

>10x

Ƙananan ƙididdiga/kalmomin sirri da ake buƙata don cimma irin wannan yawan rufewa kamar samfurin bazuwa.

Ƙirƙira ta Asali

Tsarin Samarwa

Yana canza mayar da hankali daga tsarin tsari zuwa dabarar warwarewa, wani muhimmin sashi da aka yi watsi da shi.

6. Tsarin Bincike: Nazarin Lamari Ba tare da Lambar Ba

Yi la'akari da tsarin da aka sauƙaƙa wanda aka horar da shi akan kalmomin sirri wanda ke ba da yuwuwar girma ga jerin kamar "password123" da "letmein".

Binciken Samfurin Bazuwa: Tsarin na iya samarwa: "xqjf8*", "password123", "letmein", "xqjf8*" (kwafi), "aBcDeF", "password123" (kwafi). Yana ɓata zato akan ƙananan yuwuwar da maimaita kalmomin sirri.
Binciken SOPG: Ta amfani da bincikensa, zai samar da cikin tsari: "password123", "password12", "password", "letmein", "letmein1", "123456". Yana jera abubuwan da za a iya zama kalmar sirri masu yuwuwar girma da kuma bambance-bambancensu na kusa da farko, yana haɓaka damar bugu da zato na farko. Wannan yana kwatanta ƙa'idar da ke bayan binciken katako a cikin fassarar inji (kamar yadda ake amfani da shi a cikin tsare-tsare kamar Transformer na Google), inda gano jerin mafi yuwuwa yake da mahimmanci fiye da samar da bambance-bambancen bazuwa.

7. Hangen Nesa na Aikace-aikace & Hanyoyin Gaba

Aikace-aikace Nan da Nan: SOPG kai tsaye yana haɓaka kayan aikin da ake samu don ƙimar ƙarfin kalmar sirri mai himma. Kamfanonin tsaro na iya gina masu fashewa masu inganci don duba manufofin kalmar sirri na kamfani. Hakanan yana ɗaga matakin binciken tsaro, yana buƙatar haɓaka kalmomin sirri masu jurewa irin wannan zato mai tsari, mai hankali.

Hanyoyin Bincike na Gaba:

Dabarun Bincike Guda biyu: Haɗa SOPG tare da ƙayyadaddun bazuwa don bincika ƙananan yuwuwar amma mai yuwuwar ingantattun kalmomin sirri "ba a kan hanya ba," guje wa matsakaicin gida a cikin sararin yuwuwar.
Samarwa Mai Daidaitawa/Mai Adawa: Tsare-tsare waɗanda za su iya daidaita tsarin samarwa bisa ga ɗan ra'ayi daga tsarin manufa (misali, amsoshi masu iyakancewar ƙima), kama da hare-haren adawa a cikin ML.
Bayan Kalmomin Sirri: Tsarin samarwa mai tsari zai iya amfana da wasu aikace-aikacen tsarin gudanar da kai inda yuwuwar fitarwa ke da alaƙa da "inganci" ko "yuwuwar," kamar samar da tsarin raunin software mai ma'ana ko jerin zirga-zirgar cibiyar sadarwa don gwajin tsaro.
Maganganun Tsaro: Bincike kan manufofin ƙirƙirar kalmar sirri da algorithms na hashing waɗanda ke rage ingancin hare-haren zato mai tsari na yuwuwar.

8. Nassoshi

M. Jin, J. Ye, R. Shen, H. Lu, "Samar da Kalmar Sirri Mai Tsari Bisa Bincike na Cibiyoyin Jijiyoyi Masu Gudanar da Kai," Rubutun da Aka Gabatar don Bugawa, 2023.
A. Radford, da sauransu, "Tsarin Harshe Masu Koyon Ayyuka da yawa ba tare da Kulawa ba," OpenAI, 2019. (Tushen GPT-2)
J. Goodfellow, da sauransu, "Cibiyoyin Adawa na Samarwa," Ci gaba a cikin Tsarin Sarrafa Bayanai na Jijiyoyi, 2014. (Tushen PassGAN)
M. Hitaj, da sauransu, "PassGAN: Hanyar Koyon Zurfi don Zato Kalmar Sirri," Taron Duniya akan Tsaron Lambobi da Tsaron Cibiyar Sadarwa, 2019.
P. G. Kelley, da sauransu, "Yi Zato Kuma (Kuma Kuma): Auna Ƙarfin Kalmar Sirri ta Hanyar Kwatanta Algorithms na Fashewar Kalmar Sirri," IEEE Taron Tsaro da Keɓantawa, 2012. (OMEN, tsarin Markov)
NIST Takamaiman Bugawa 800-63B, "Jagororin Shaidar Lambobi: Tabbatar da Gaskiya da Gudanar da Rayuwa," 2017.

9. Binciken Kwararre na Asali

Bayanin Asali: Babban nasarar takardar ba wani tsarin jijiyoyi ba ne—yana da wani hari na tiyata akan matsalar samarwa. Shekaru da yawa, fannin zato na kalmar sirri, kamar samar da rubutu na farko, ya damu da gina mafi kyawun masu kimanta yuwuwar (tsarin) yayin amfani da hanyar mara hankali don cire zato daga gare ta (samfurin bazuwa). SOPG ya gano wannan rabuwa daidai. Bayanin cewa yadda kuke samarwa daga tsarin yana da mahimmanci kamar tsarin kansa yana da zurfi. Yana canza yanayin gasa daga tsananin tseren makamai na girman tsari da bayanan horo zuwa wanda ya haɗa da ingancin algorithm a cikin warwarewa, darasi da al'ummar ML ta fi girma ta koya tare da tsarin jerin-zuwa-jerin shekaru da suka gabata.

Kwararar Ma'ana & Ƙarfafawa: Ma'ana ba ta da aibi: 1) Tsare-tsare masu gudanar da kai kamar GPT suna da kyau sosai masu kimanta yuwuwar kalmar sirri. 2) Samfurin bazuwa daga gare su ba shi da inganci don zato, inda manufar ita ce haɓaka bugu kowace raka'a na lissafi. 3) Don haka, maye gurbin samfurin bazuwa tare da algorithm na bincike wanda ke ba da fifiko a sarari ga fitarwa masu yuwuwar girma. Ƙarfin yana cikin sauƙinsa da sakamako mai girma, mai girma. Ingantawa na 81% akan PassGPT, wanda ke amfani da irin wannan tsarin tushe, ana danganta shi kusan gaba ɗaya ga hanyar samarwa, yana tabbatar da rubutun. Kawar da kwafi shine riba mai mahimmanci, kyauta.

Kurakurai & Faɗakarwa: Binciken, ko da yake yana da gamsarwa, yana da wuraren makanta. Na farko, "gwajin rukunin yanar gizo guda ɗaya" ya bar tambayoyi game da gama gari. Kamar yadda aka lura a cikin takardar CycleGAN (Zhu et al., 2017) da kuma adabin ML mai faɗi, tsarin na iya wuce gona da iri ga rarraba takamaiman bayanan. Shin fifikon SOPGesGPT yana ci gaba a cikin bayanan kalmar sirri daban-daban daga al'adu da nau'ikan sabis? Na biyu, tsarin bincike yana da tsada sosai a lissafi kowane kalmar sirri da aka samar fiye da samfurin bazuwa. Takardar tana da'awar nasara a cikin "ƙididdiga," amma lokacin bango da ƙarin kuɗin ƙwaƙwalwar ajiya na kiyaye katakon binciken ba a bincika sosai ba. Shin binciken zai iya zama matsala ga tsare-tsare masu girma ko katako? A ƙarshe, abubuwan da suka shafi ɗa'a an yi watsi da su. Wannan kayan aiki ne mai ƙarfi wanda ke rage shingen hare-hare masu inganci. Ko da yake yana da amfani ga masu tsaro, bugunsa yana buƙatar tattaunawa a layi daya kan dabarun ragewa, wanda ba a haɓaka shi ba.

Bayanai Masu Aiki: Ga masu aikin tsaro, wannan takarda umarni ce: nan da nan sake kimanta manufofin kalmar sirri a ƙarƙashin wannan sabon tsarin barazana. Tsawon lokaci da buƙatun rikitarwa waɗanda ke hana tsarin Markov na iya faɗi da sauri ga tsarin GPT masu jagorancin SOPG. Dole ne manufofin su ci gaba zuwa haɓaka rashin hasashe maimakon kawai rikitarwa (misali, "Tr0ub4dor&3" yana da rikitarwa amma ana iya zato; "correct-horse-battery-staple" ya fi tsayi kuma ba shi da yuwuwar ga waɗannan tsare-tsare). Ga masu bincike, hanya a bayyane take: 1) Maimaita da gwadawa akan bayanai da yawa don tabbatar da ƙarfi. 2) Bincika hanyoyin haɗin gwiwa, watakila shuka SOPG tare da ƙa'idodi daga PCFG don jagorantar binciken zuwa kalmomin sirri masu tsarin ma'ana. 3) Ƙaddamar da binciken tsaro akan "ƙirƙirar kalmar sirri mai jure wa SOPG," mai yiwuwa ta amfani da tsarin samarwa don ƙirƙirar kalmomin sirri masu ƙarfi, masu tunawa waɗanda ke cikin yankuna masu ƙananan yuwuwar na tsarin maharin na yanzu. Aikin da cibiyoyi kamar Cibiyar Ƙididdiga ta Ƙasa (NIST) ke yi akan jagororin kalmar sirri dole ne yanzu ya yi la'akari da wannan tsalle a cikin hankalin zato. SOPG ba kawai ingantawa ba ne; canjin tsari ne wanda ke buƙatar amsa a ko'ina cikin tsarin tsaron kalmar sirri.