PassGPT: Büyük Dil Modelleri ile Parola Modelleme ve Yönlendirilmiş Üretim

1. Giriş

Kimlik doğrulama teknolojilerindeki ilerlemelere rağmen, parolalar basitlikleri ve kolay uygulanabilirlikleri nedeniyle baskın mekanizma olmaya devam etmektedir. Parola sızıntıları, hem yetkisiz erişime hem de kırma araçlarının geliştirilmesine olanak tanıyarak önemli güvenlik tehditleri oluşturmaktadır. Bu makale, Büyük Dil Modellerinin (LLM) parola modellemesine uygulanmasını araştırmakta, üretim ve güç tahmini için parola sızıntıları üzerinde eğitilmiş bir model olan PassGPT'yi tanıtmaktadır.

Araştırma, PassGPT'nin mevcut Üretici Çekişmeli Ağ (GAN) tabanlı yöntemleri, %20 daha fazla daha önce görülmemiş parolayı tahmin ederek geride bıraktığını göstermekte ve yönlendirilmiş parola üretimi—keyfi kısıtlamalar altında parola oluşturma için yeni bir yetenek—sunmaktadır.

2. Metodoloji & Mimari

PassGPT, parola karakterlerinin sıralı üretimi için uyarlanmış GPT-2 mimarisi üzerine inşa edilmiştir. Bu yaklaşım, parolaları tam birimler olarak üreten GAN'larla tezat oluşturmaktadır.

2.1. PassGPT Model Tasarımı

Model, büyük ölçekli parola sızıntıları üzerinde eğitilmiş otoregresif bir Transformer'dır. Önceki dizi $x_{

2.2. Yönlendirilmiş Parola Üretimi

Önemli bir yenilik, karakter düzeyinde yönlendirilmiş üretimdir. Örnekleme prosedürünü manipüle ederek (örneğin, koşullu olasılıklar veya maskeleme kullanarak), PassGPT belirli semboller içeren, uzunluk gereksinimlerini karşılayan veya belirli alt dizeler içeren gibi özel kısıtlamaları sağlayan parolalar üretebilir—bu, standart GAN'larla başarılamayan bir başarıdır.

2.3. PassVQT İyileştirmesi

PassVQT, Vektör Nicemlenmiş Transformer (VQT) tekniklerini içerir ve gizli yerleştirmeleri temsil etmek için ayrık bir kod kitabı kullanır. Bu, üretilen parolaların karmaşıklığını ve çeşitliliğini artırabilir, ancak hesaplama maliyeti ile gelebilir.

3. Deneysel Sonuçlar

3.1. Parola Tahmin Performansı

Gerçek dünya parola sızıntıları (ör. RockYou) üzerinde yapılan deneyler, PassGPT'nin PassGAN gibi önceki en gelişmiş derin üretici modelleri önemli ölçüde geride bıraktığını göstermektedir. Bir testte, PassGPT, GAN tabanlı yaklaşımlara kıyasla iki kat daha fazla benzersiz, daha önce görülmemiş parola tahmin etti. Ayrıca, eğitim sırasında görülmeyen yeni, ayrılmış veri kümelerine karşı güçlü bir genelleme gösterdi.

Performans Karşılaştırması

PassGPT vs. GAN'lar: Görülmemiş parolaları tahmin etmede %20 daha yüksek başarı oranı.

Genelleme: Eğitim sırasında görülmeyen yeni parola sızıntılarında etkili performans.

3.2. Olasılık Dağılımı Analizi

GAN'ların aksine, PassGPT parolalar üzerinde açık bir olasılık dağılımı sağlar. Analiz, düşük parola olasılığı (yüksek negatif log-olabilirlik) ile zxcvbn gibi tahmin ediciler tarafından ölçülen yüksek güç arasında güçlü bir korelasyon olduğunu göstermektedir. Ancak, PassGPT, geleneksel tahmin ediciler tarafından "güçlü" olarak değerlendirilen parolaların kendi modeli altında nispeten yüksek olasılığa sahip olduğu durumları tespit etmiştir; bu, potansiyel güvenlik açıklarına işaret etmektedir.

Grafik Çıkarımı: Varsayımsal bir dağılım grafiği, x ekseninde parola olasılığını (PassGPT) ve y ekseninde güç puanını (zxcvbn) gösterecek, genel bir negatif eğilimi ve yüksek güçlü parolaların beklenmedik şekilde yüksek olasılığa sahip olduğu dikkate değer aykırı değerleri ortaya çıkaracaktır.

4. Teknik Analiz & Çerçeve

Sektör Analisti Perspektifi: PassGPT yaklaşımının, etkilerinin ve pratik çıkarımlarının eleştirel bir değerlendirmesi.

4.1. Temel Kavrayış

Makalenin temel atılımı, sadece parolalar için başka bir yapay zeka modeli değil; ayırt edici örüntü eşleştirmeden üretici dizi modellemeye bir paradigma kaymasıdır. Hashcat gibi araçlar kurallara ve Markov zincirlerine dayanırken, PassGAN gibi GAN'lar bütünsel çıktılar üretirken, PassGPT parola oluşturmayı dilsel bir eylem olarak ele alır. Bu, GPT-3 gibi Büyük Dil Modellerinin doğal dilin "dilbilgisini" ve "anlambilimini" nasıl yakaladığını yansıtır, ancak burada insan parola oluşturmanın "diline" uygulanır. Gerçek değer önerisi, sağladığı açık, izlenebilir olasılık dağılımıdır—bu, GAN'larda belirgin şekilde eksik olan ve sıklıkla "kara kutu" olarak eleştirilen bir özelliktir (Goodfellow ve diğerleri, 2014). Bu, parola güvenliğini sezgisel tahmin oyunundan olasılıksal akıl yürütmeye taşır.

4.2. Mantıksal Akış

Argüman, zorlayıcı bir mantıkla ilerler: (1) Büyük Dil Modelleri dizileri modelleyerek Doğal Dil İşleme'ye hakimdir; (2) parolalar gizli yapıya sahip karakter dizileridir; (3) bu nedenle, Büyük Dil Modelleri parolaları etkili bir şekilde modellemelidir. Doğrulama sağlamdır: üstün tahmin performansı öncülü kanıtlar. Yönlendirilmiş üretimin tanıtılması, sıralı mimarinin doğal bir uzantısıdır—CTRL gibi modellerde kontrollü metin üretimine benzer (Keskar ve diğerleri, 2019). Olasılık dağılımının analizi, üretici modellemeyi güç tahmininin pratik alanına geri bağlayan kritik bir sonraki adımdır. Modelleme -> üretim -> analiz -> uygulama akışı tutarlı ve etkilidir.

4.3. Güçlü Yönler & Eksiklikler

Güçlü Yönler: Performans kazanımları inkâr edilemez. Yönlendirilmiş üretim yeteneği, sızma testi için (kurala uygun parola adayları üretme) ve muhtemelen kullanıcıların hatırlanabilir ancak karmaşık parolalar oluşturmasına yardımcı olmak için doğrudan uygulamaları olan gerçek bir yeniliktir. Olasılık dağılımı sağlamak, entropi hesaplamasına ve mevcut güvenlik çerçeveleriyle entegrasyona olanak tanıyan büyük bir teorik ve pratik avantajdır.

Eksiklikler & Endişeler: Makale önemli konuları üstünkörü geçmektedir. İlk olarak, etik çift kullanım: Bu güçlü bir kırma aracıdır. "Çevrimdışı tahmin" araştırması için konumlandırılmış olsa da, kötüye kullanım potansiyeli yüksektir ve kod/model yayını, diğer çift kullanımlı yapay zeka araştırmaları çevresindeki tartışmalara benzer şekilde katı etik kurallar gerektirir (Brundage ve diğerleri, 2018). İkinci olarak, veri bağımlılığı: Tüm makine öğrenimi modelleri gibi, PassGPT de yalnızca eğitim verileri kadar iyidir. Yaygın sızıntılarda yeterince temsil edilmeyen kültürlerden veya dillerden gelen parolaları modellemekte başarısız olabilir. Üçüncü olarak, hesaplama maliyeti: Büyük transformer'ları eğitmek ve çalıştırmak, bazı eski yöntemlere kıyasla kaynak yoğundur ve gerçek zamanlı uygulamayı sınırlayabilir. PassVQT varyantının artan "karmaşıklığı"ndan bahsedilmiş ancak kapsamlı bir şekilde değerlendirilmemiştir—daha yüksek çeşitlilik, daha etkili tahmine mi yoksa sadece daha fazla anlamsız dizeye mi dönüşüyor?

4.4. Uygulanabilir Öngörüler

Güvenlik Ekipleri İçin: Kuruluşunuzun parola politikalarının bu yeni nesil yapay zeka destekli saldırılara karşı nasıl savunmasız olabileceğini derhal değerlendirin. Karmaşık ancak tahmin edilebilir kalıplar (ör. "ŞirketAdı2024!") zorunlu kılan politikalar artık daha fazla açığa çıkmıştır. Gerçek rastgelelik (parola yöneticileri) veya parola ifadeleri kullanmaya yönelik bir değişimi savunun.

Araştırmacılar & Satıcılar İçin: Büyük Dil Modeli tabanlı olasılık tahminlerini güç ölçerlerine entegre edin. Geleneksel kuralları (zxcvbn) PassGPT'nin olasılığı ile birleştiren hibrit bir tahmin edici daha sağlam olabilir. PassGPT tarafından üretilmesi muhtemel parolaları tespit edebilen savunma modelleri geliştirin, böylece parola güvenliğinde bir yapay zeka vs. yapay zeka silahlanma yarışı oluşturun.

Politika Yapıcılar İçin: Bu teknolojinin savunma uygulamalarına yönelik araştırmaları finanse edin ve siber güvenlikte güçlü saldırgan yapay zeka araçlarının yayınlanması için net etik çerçeveler oluşturun.

Çerçeve Örneği (Kod Dışı): Bir finans kuruluşunun parola politikasını düşünün: "12 karakter, 1 büyük harf, 1 küçük harf, 1 sayı, 1 özel karakter." Geleneksel bir kırma aracı kaba kuvvet veya bozma kuralları kullanabilir. Bir GAN, tüm kısıtlamaları kesinlikle karşılayan çıktılar üretmekte zorlanabilir. PassGPT'nin yönlendirilmiş üretimi, yalnızca bu kesin politikayı yerine getiren dizileri örneklemek için yönlendirilebilir, böylece bu kısıtlı arama alanının yüksek olasılıklı alt uzayını verimli bir şekilde keşfeder ve bu politikayı test eden kırmızı takımlar ve kara kutu saldırganlar için güçlü bir araç haline gelir.

5. Gelecekteki Uygulamalar & Yönelimler

Gelişmiş Güç Tahmini: PassGPT'nin olasılık puanlarının web siteleri ve uygulamalar için gerçek zamanlı parola güç ölçerlerine entegrasyonu.
Proaktif Parola Denetimi: Kuruluşlar, iç politikalara uyan parolaları proaktif olarak üretmek ve test etmek için yönlendirilmiş PassGPT modellerini kullanarak, saldırganlardan önce zayıf noktaları belirleyebilir.
Hibrit Savunma Modelleri: İnsan seçimi ve Büyük Dil Modeli üretimi parolaları ayırt edebilen, potansiyel olarak ele geçirilmiş veya zayıf kimlik bilgilerini işaretleyebilen ayırt edici modeller geliştirme.
Çapraz Alan Dizi Modellemesi: Aynı mimarinin ağ protokolü parmak izleri, kötü amaçlı yazılım API çağrı dizileri veya sahte işlem kalıpları gibi diğer güvenlikle ilgili dizilere uygulanması.
Federe & Gizliliği Koruyan Eğitim: Hassas sızıntıları merkezileştirmeden, dağıtılmış, anonimleştirilmiş parola verileri üzerinde bu tür modelleri eğitmek için tekniklerin araştırılması.
Çekişmeli Parola Üretimi: Yönlendirilmiş üretimi, tahmin edicilere "güçlü" görünen ancak model tarafından kolayca tahmin edilebilen "çekişmeli örnekler"—parolalar—oluşturmak için kullanarak, bu tahmin edicileri stres testine tabi tutmak ve iyileştirmek.

6. Kaynaklar

Rando, J., Perez-Cruz, F., & Hitaj, B. (2023). PassGPT: Password Modeling and (Guided) Generation with Large Language Models. arXiv preprint arXiv:2306.01545.
Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y. (2014). Generative adversarial nets. Advances in neural information processing systems, 27.
Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language models are unsupervised multitask learners. OpenAI blog, 1(8), 9.
Hitaj, B., Gasti, P., Ateniese, G., & Perez-Cruz, F. (2019). PassGAN: A Deep Learning Approach for Password Guessing. In Applied Cryptography and Network Security.
Keskar, N. S., McCann, B., Varshney, L. R., Xiong, C., & Socher, R. (2019). Ctrl: A conditional transformer language model for controllable generation. arXiv preprint arXiv:1909.05858.
Brundage, M., Avin, S., Clark, J., Toner, H., Eckersley, P., Garfinkel, B., ... & Amodei, D. (2018). The malicious use of artificial intelligence: Forecasting, prevention, and mitigation. arXiv preprint arXiv:1802.07228.
Wheeler, D. L. (2016). zxcvbn: Low-budget password strength estimation. In USENIX Security Symposium.