PassGPT: Pemodelan Kata Laluan dan Penjanaan Terpandu dengan Model Bahasa Besar

1. Pengenalan

Walaupun terdapat kemajuan dalam teknologi pengesahan, kata laluan kekal sebagai mekanisme utama kerana kesederhanaan dan kebolehpasangannya. Kebocoran kata laluan menimbulkan ancaman keselamatan yang besar, membolehkan akses tanpa kebenaran dan penambahbaikan alat penggodaman. Kertas kerja ini menyiasat aplikasi Model Bahasa Besar (LLM) untuk pemodelan kata laluan, memperkenalkan PassGPT—sebuah model yang dilatih pada kebocoran kata laluan untuk penjanaan dan anggaran kekuatan.

Penyelidikan menunjukkan bahawa PassGPT mengatasi kaedah sedia ada berasaskan Rangkaian Penentang Generatif (GAN) dengan meneka 20% lebih banyak kata laluan yang tidak pernah dilihat sebelum ini dan memperkenalkan penjanaan kata laluan terpandu—keupayaan baharu untuk menjana kata laluan di bawah kekangan sewenang-wenangnya.

2. Metodologi & Seni Bina

PassGPT dibina berdasarkan seni bina GPT-2, disesuaikan untuk penjanaan berurutan aksara kata laluan. Pendekatan ini berbeza dengan GAN yang menjana kata laluan sebagai unit lengkap.

2.1. Reka Bentuk Model PassGPT

Model ini adalah Transformer autoregresif yang dilatih pada kebocoran kata laluan berskala besar. Ia mempelajari taburan kebarangkalian $P(x_t | x_{

2.2. Penjanaan Kata Laluan Terpandu

Satu inovasi utama ialah penjanaan terpandu peringkat aksara. Dengan memanipulasi prosedur pensampelan (contohnya, menggunakan kebarangkalian bersyarat atau topeng), PassGPT boleh menjana kata laluan yang memenuhi kekangan tertentu, seperti mengandungi simbol tertentu, memenuhi keperluan panjang, atau termasuk subrentetan tertentu—pencapaian yang tidak dapat dicapai dengan GAN standard.

2.3. Penambahbaikan PassVQT

PassVQT menggabungkan teknik Transformer Terkuantiti Vektor (VQT), menggunakan buku kod diskret untuk mewakili penyematan pendam. Ini boleh meningkatkan kekeliruan dan kepelbagaian kata laluan yang dijana, walaupun mungkin melibatkan kos pengiraan.

3. Keputusan Eksperimen

3.1. Prestasi Tebakan Kata Laluan

Eksperimen ke atas kebocoran kata laluan dunia sebenar (contohnya, RockYou) menunjukkan PassGPT jauh mengatasi model generatif terdalam terkini sebelum ini seperti PassGAN. Dalam satu ujian, PassGPT meneka dua kali ganda lebih banyak kata laluan unik yang tidak pernah dilihat sebelum ini berbanding pendekatan berasaskan GAN. Ia juga menunjukkan generalisasi yang kuat kepada set data baharu yang diketepikan.

Perbandingan Prestasi

PassGPT vs. GAN: Kadar kejayaan 20% lebih tinggi dalam meneka kata laluan yang tidak dilihat.

Generalisasi: Prestasi berkesan pada kebocoran kata laluan baharu yang tidak dilihat semasa latihan.

3.2. Analisis Taburan Kebarangkalian

Tidak seperti GAN, PassGPT menyediakan taburan kebarangkalian eksplisit untuk kata laluan. Analisis menunjukkan korelasi kuat antara kebarangkalian kata laluan rendah (log-kebolehjadian negatif tinggi) dan kekuatan tinggi seperti yang diukur oleh penganggar seperti zxcvbn. Walau bagaimanapun, PassGPT mengenal pasti kes di mana kata laluan yang dianggap "kuat" oleh penganggar konvensional mempunyai kebarangkalian yang agak tinggi di bawah modelnya, menunjukkan potensi kerentanan.

Implikasi Carta: Plot serakan hipotesis akan menunjukkan kebarangkalian kata laluan (PassGPT) pada paksi-x dan skor kekuatan (zxcvbn) pada paksi-y, mendedahkan trend negatif umum dengan pencilan ketara di mana kata laluan berketinggian tinggi mempunyai kebarangkalian yang tidak dijangka tinggi.

4. Analisis Teknikal & Kerangka Kerja

Perspektif Penganalisis Industri: Penilaian kritikal terhadap pendekatan PassGPT, implikasinya, dan pengajaran praktikal.

4.1. Teras Wawasan

Kejayaan asas kertas kerja ini bukan sekadar satu lagi model AI untuk kata laluan; ia adalah anjakan paradigma daripada pemadanan corak diskriminatif kepada pemodelan urutan generatif. Walaupun alat seperti Hashcat bergantung pada peraturan dan rantai Markov, dan GAN seperti PassGAN menjana output holistik, PassGPT memperlakukan penciptaan kata laluan sebagai tindakan linguistik. Ini mencerminkan bagaimana LLM seperti GPT-3 menangkap "tatabahasa" dan "semantik" bahasa semula jadi, tetapi di sini diterapkan pada "bahasa" penciptaan kata laluan manusia. Proposisi nilai sebenar ialah taburan kebarangkalian eksplisit dan boleh dijejaki yang disediakannya—ciri yang ketara tiada dalam GAN, yang sering dikritik sebagai "kotak hitam" (Goodfellow et al., 2014). Ini mengalihkan keselamatan kata laluan daripada tekaan heuristik kepada penaakulan kebarangkalian.

4.2. Aliran Logik

Hujah diteruskan dengan logik yang menarik: (1) LLM mendominasi NLP dengan memodelkan urutan; (2) kata laluan adalah urutan aksara dengan struktur pendam; (3) oleh itu, LLM sepatutnya memodelkan kata laluan dengan berkesan. Pengesahan adalah kukuh: prestasi tekaan yang unggul membuktikan premis. Pengenalan penjanaan terpandu adalah lanjutan semula jadi seni bina berurutan—serupa dengan penjanaan teks terkawal dalam model seperti CTRL (Keskar et al., 2019). Analisis taburan kebarangkalian adalah langkah seterusnya yang kritikal, menghubungkan pemodelan generatif kembali ke domain praktikal anggaran kekuatan. Aliran dari pemodelan -> penjanaan -> analisis -> aplikasi adalah koheren dan memberi impak.

4.3. Kekuatan & Kelemahan

Kekuatan: Peningkatan prestasi tidak dapat dinafikan. Keupayaan penjanaan terpandu adalah inovasi tulen dengan aplikasi segera untuk ujian penembusan (menjana calon kata laluan mematuhi peraturan) dan mungkin untuk membantu pengguna mencipta kata laluan yang mudah diingati tetapi kompleks. Menyediakan taburan kebarangkalian adalah kelebihan teori dan praktikal utama, membolehkan pengiraan entropi dan integrasi dengan rangka kerja keselamatan sedia ada.

Kelemahan & Kebimbangan: Kertas kerja ini mengabaikan isu penting. Pertama, kegunaan dwi etika: Ini adalah alat penggodaman yang berkuasa. Walaupun diposisikan untuk penyelidikan "tebakan luar talian", potensi penyalahgunaannya tinggi, dan pelepasan kod/model memerlukan garis panduan etika yang ketat, serupa dengan perdebatan mengenai penyelidikan AI kegunaan dwi lain (Brundage et al., 2018). Kedua, kebergantungan data: Seperti semua model ML, PassGPT hanya sebaik data latihannya. Ia mungkin gagal memodelkan kata laluan dari budaya atau bahasa yang kurang terwakili dalam kebocoran biasa. Ketiga, kos pengiraan: Melatih dan menjalankan transformer besar adalah intensif sumber berbanding beberapa kaedah lama, berpotensi menghadkan aplikasi masa nyata. Peningkatan "kekeliruan" varian PassVQT disebut tetapi tidak dinilai sepenuhnya—adakah kepelbagaian yang lebih tinggi diterjemahkan kepada tekaan yang lebih berkesan, atau hanya lebih banyak rentetan tidak masuk akal?

4.4. Wawasan Boleh Tindak

Untuk Pasukan Keselamatan: Segera menilai bagaimana dasar kata laluan organisasi anda mungkin terdedah kepada generasi baharu serangan berasaskan AI ini. Dasar yang mewajibkan corak kompleks tetapi boleh diramal (contohnya, "NamaSyarikat2024!") kini lebih terdedah. Galakkan peralihan kepada penggunaan rawak sebenar (pengurus kata laluan) atau frasa laluan.

Untuk Penyelidik & Vendor: Integrasikan anggaran kebarangkalian berasaskan LLM ke dalam meter kekuatan. Penganggar hibrid yang menggabungkan peraturan tradisional (zxcvbn) dengan kebolehjadian PassGPT boleh menjadi lebih kukuh. Bangunkan model pertahanan yang dapat mengesan kata laluan yang berkemungkinan dijana oleh PassGPT, mencipta perlumbaan senjata AI vs. AI dalam keselamatan kata laluan.

Untuk Pembuat Dasar: Danai penyelidikan ke dalam aplikasi pertahanan teknologi ini dan wujudkan rangka kerja etika yang jelas untuk penerbitan alat AI ofensif berkuasa dalam keselamatan siber.

Contoh Kerangka Kerja (Bukan Kod): Pertimbangkan dasar kata laluan institusi kewangan: "12 aksara, 1 huruf besar, 1 huruf kecil, 1 nombor, 1 aksara khas." Alat penggodaman tradisional mungkin menggunakan kekerasan atau peraturan pemutarbalikan. GAN mungkin sukar menjana output yang memenuhi semua kekangan dengan ketat. Penjanaan terpandu PassGPT boleh diarahkan untuk menyampel hanya urutan yang memenuhi dasar tepat ini, meneroka ruang sub kebarangkalian tinggi ruang carian terbatas itu dengan cekap, menjadikannya alat berkuasa untuk kedua-dua pasukan merah menguji dasar ini dan untuk penyerang kotak hitam.

5. Aplikasi & Hala Tuju Masa Depan

Anggaran Kekuatan Dipertingkat: Integrasi skor kebarangkalian PassGPT ke dalam meter kekuatan kata laluan masa nyata untuk laman web dan aplikasi.
Audit Kata Laluan Proaktif: Organisasi boleh menggunakan model PassGPT terpandu untuk secara proaktif menjana dan menguji kata laluan yang mematuhi dasar dalaman, mengenal pasti titik lemah sebelum penyerang melakukannya.
Model Pertahanan Hibrid: Membangunkan model diskriminatif yang dapat membezakan antara kata laluan dipilih manusia dan dijana LLM untuk menandakan kelayakan yang berpotensi dikompromi atau lemah.
Pemodelan Urutan Rentas Domain: Menerapkan seni bina yang sama kepada urutan lain yang relevan dengan keselamatan, seperti cap jari protokol rangkaian, urutan panggilan API perisian hasad, atau corak transaksi penipuan.
Latihan Teragih & Memelihara Privasi: Meneroka teknik untuk melatih model sedemikian pada data kata laluan teragih, dianonimkan tanpa memusatkan kebocoran sensitif.
Penjanaan Kata Laluan Adversarial: Menggunakan penjanaan terpandu untuk mencipta "contoh adversarial"—kata laluan yang kelihatan kuat kepada penganggar tetapi mudah diteka oleh model—untuk menguji tekanan dan menambah baik penganggar tersebut.

6. Rujukan

Rando, J., Perez-Cruz, F., & Hitaj, B. (2023). PassGPT: Password Modeling and (Guided) Generation with Large Language Models. arXiv preprint arXiv:2306.01545.
Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y. (2014). Generative adversarial nets. Advances in neural information processing systems, 27.
Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language models are unsupervised multitask learners. OpenAI blog, 1(8), 9.
Hitaj, B., Gasti, P., Ateniese, G., & Perez-Cruz, F. (2019). PassGAN: A Deep Learning Approach for Password Guessing. In Applied Cryptography and Network Security.
Keskar, N. S., McCann, B., Varshney, L. R., Xiong, C., & Socher, R. (2019). Ctrl: A conditional transformer language model for controllable generation. arXiv preprint arXiv:1909.05858.
Brundage, M., Avin, S., Clark, J., Toner, H., Eckersley, P., Garfinkel, B., ... & Amodei, D. (2018). The malicious use of artificial intelligence: Forecasting, prevention, and mitigation. arXiv preprint arXiv:1802.07228.
Wheeler, D. L. (2016). zxcvbn: Low-budget password strength estimation. In USENIX Security Symposium.