PassGPT: बड़े भाषा मॉडल के साथ पासवर्ड मॉडलिंग और निर्देशित जनरेशन

1. परिचय

वैकल्पिक प्रमाणीकरण तंत्रों के प्रसार के बावजूद, उनकी सादगी और तैनाती के कारण पासवर्ड प्रमुख विधि बने हुए हैं। यह व्यापकता पासवर्ड लीक को एक गंभीर खतरा वेक्टर बनाती है। मशीन लर्निंग, विशेष रूप से डीप जेनरेटिव मॉडल, गेसिंग हमलों और स्ट्रेंथ एस्टीमेशन दोनों के लिए पासवर्ड लीक का विश्लेषण करने में महत्वपूर्ण रही है। यह पेपर PassGPT का परिचय देता है, एक नवीन दृष्टिकोण जो पासवर्ड मॉडलिंग के लिए बड़े भाषा मॉडल (एलएलएम) का लाभ उठाता है। यह मूल प्रश्न की जांच करता है: मानव-जनित पासवर्ड में जटिल, अक्सर अवचेतन पैटर्न को एलएलएम कितनी प्रभावी ढंग से पकड़ सकते हैं? PassGPT को एक ऑफ़लाइन पासवर्ड-गेसिंग टूल के रूप में स्थापित किया गया है, जो पिछले प्रतिकूल शोध परिदृश्यों के अनुरूप है जहां एक हमलावर के पास हैश किए गए पासवर्ड होते हैं।

2. मूल पद्धति और आर्किटेक्चर

PassGPT डीप जेनरेटिव पासवर्ड मॉडलिंग के प्रतिमान को मौलिक रूप से समग्र जनरेशन से अनुक्रमिक, कैरेक्टर-लेवल भविष्यवाणी की ओर स्थानांतरित करता है।

2.1. PassGPT मॉडल डिज़ाइन

PassGPT GPT-2 ट्रांसफॉर्मर आर्किटेक्चर पर आधारित है। इसे बड़े पैमाने पर पासवर्ड लीक पर सीधे प्रशिक्षित किया जाता है, जो पिछले अनुक्रम को देखते हुए अगले कैरेक्टर $c_i$ पर संभाव्यता वितरण $P(c_i | c_1, c_2, ..., c_{i-1})$ सीखता है। यह ऑटोरेग्रेसिव मॉडलिंग इसे पासवर्ड को टोकन-दर-टोकन जनरेट करने की अनुमति देती है, जटिल आकृति विज्ञान पैटर्न (जैसे "Summer" जैसे सामान्य उपसर्ग, "123!" जैसे प्रत्यय, और लीट-स्पीक प्रतिस्थापन) को पकड़ते हुए।

2.2. निर्देशित पासवर्ड जनरेशन

यह पिछली GAN-आधारित विधियों पर एक प्रमुख नवाचार है। जनरेशन के दौरान मॉडल के वितरण से सैंपलिंग करके, PassGPT मनमाना बाधाएं शामिल कर सकता है। उदाहरण के लिए, एक हमलावर (या एक रक्षक जो नीति अनुपालन का परीक्षण कर रहा है) जनरेशन को इस प्रकार निर्देशित कर सकता है कि वह ऐसे पासवर्ड उत्पन्न करे जो: एक अपरकेस अक्षर अवश्य रखते हों, एक अंक के साथ समाप्त होते हों, या एक विशिष्ट सबस्ट्रिंग शामिल करते हों। यह पासवर्ड स्पेस की एक लक्षित खोज को सक्षम बनाता है जो पहले उन मॉडलों के साथ असंभव था जो पासवर्ड को एकल, अप्रतिबंधित आउटपुट के रूप में जनरेट करते थे।

2.3. PassVQT एन्हांसमेंट

लेखक PassVQT का परिचय देते हैं, जो वेक्टर क्वांटाइज्ड ट्रांसफॉर्मर तकनीकों के साथ संवर्धित एक प्रकार है। यह संशोधन जनरेट किए गए पासवर्ड की परप्लेक्सिटी (अनिश्चितता का एक माप) बढ़ाने का लक्ष्य रखता है, जिससे संभावित रूप से अधिक विविध और कम अनुमानित आउटपुट प्राप्त हो सकते हैं, हालांकि गेसबिलिटी के साथ ट्रेड-ऑफ की सावधानीपूर्वक मूल्यांकन की आवश्यकता है।

3. प्रायोगिक परिणाम और प्रदर्शन

मुख्य प्रदर्शन मीट्रिक

20% अधिक अनदेखे पासवर्ड: PassGPT ने अत्याधुनिक GAN-आधारित मॉडलों (जैसे, PassGAN) की तुलना में 20% अधिक पहले अनदेखे पासवर्ड का अनुमान लगाया।

3.1. पासवर्ड गेसिंग प्रदर्शन

पेपर ऑफ़लाइन गेसिंग हमलों में श्रेष्ठ प्रदर्शन प्रदर्शित करता है। हेल्ड-आउट पासवर्ड डेटासेट पर मूल्यांकन करने पर, PassGPT ने GAN बेसलाइन की तुलना में पहले अनदेखे पासवर्ड पर लगभग दोगुनी हिट रेट हासिल की। यह एक काफी बेहतर सामान्यीकरण क्षमता का संकेत देता है, जो प्रतिकूल नेटवर्क की तुलना में मानव-चुने गए पासवर्ड के अंतर्निहित वितरण को अधिक प्रभावी ढंग से सीखता है।

3.2. स्ट्रेंथ एस्टीमेशन विश्लेषण

एक महत्वपूर्ण निष्कर्ष यह है कि PassGPT द्वारा निर्दिष्ट स्पष्ट संभाव्यता $P(password)$ पासवर्ड की मजबूती से सहसंबद्ध है। यह लगातार मजबूत पासवर्ड को कम संभाव्यता निर्दिष्ट करता है, जो zxcvbn जैसे स्थापित स्ट्रेंथ एस्टीमेटर के अनुरूप है। इसके अलावा, विश्लेषण उन पासवर्ड की पहचान करता है जिन्हें पारंपरिक एस्टीमेटर द्वारा "मजबूत" माना जाता है लेकिन PassGPT द्वारा उच्च संभाव्यता निर्दिष्ट की जाती है—यह ML-भेद्य पासवर्ड की एक नई श्रेणी को उजागर करता है जिन्हें वर्तमान चेकर छोड़ सकते हैं।

4. तकनीकी विवरण और गणितीय ढांचा

PassGPT का मूल ऑटोरेग्रेसिव भाषा मॉडलिंग उद्देश्य है। टोकन (कैरेक्टर या सबवर्ड) के अनुक्रम $x = (x_1, x_2, ..., x_T)$ के रूप में दर्शाए गए पासवर्ड को देखते हुए, मॉडल को संभावना को अधिकतम करने के लिए प्रशिक्षित किया जाता है: $$L = \sum_{t=1}^{T} \log P(x_t | x_{

5. विश्लेषण ढांचा और केस स्टडी

केस स्टडी: नीति-अनुपालन वाले कमजोर पासवर्ड की पहचान
परिदृश्य: एक कंपनी एक पासवर्ड नीति लागू करती है: "कम से कम 12 कैरेक्टर, एक अपरकेस, एक अंक, एक विशेष कैरेक्टर।" इस स्पेस पर एक पारंपरिक ब्रूट-फोर्स हमला विशाल है ($\sim94^{12}$ संभावनाएं)।
PassGPT अनुप्रयोग: निर्देशित जनरेशन का उपयोग करके, एक विश्लेषक इन्हीं बाधाओं के साथ PassGPT से सैंपल ले सकता है। मॉडल, मानवीय प्रवृत्तियों को सीखकर, "Summer2023!Sun", "January01?Rain" जैसे उम्मीदवार जनरेट करेगा, जो नीति का पालन करते हैं लेकिन सामान्य शब्दार्थ पैटर्न के कारण अत्यधिक अनुमानित हैं। यह प्रदर्शित करता है कि कैसे PassGPT सैद्धांतिक रूप से मजबूत नीति-परिभाषित स्पेस के भीतर "कमजोर स्थानों" को कुशलतापूर्वक ढूंढ सकता है, यह कार्य ब्रूट-फोर्स या हैशकैट के मास्क जैसे नियम-आधारित जनरेटर के लिए लगभग असंभव है।

6. भविष्य के अनुप्रयोग और शोध दिशाएं

सक्रिय पासवर्ड स्ट्रेंथ एस्टीमेशन: PassGPT के संभाव्यता स्कोर को रीयल-टाइम पासवर्ड क्रिएशन चेकर में एकीकृत करना ताकि ML-भेद्य पासवर्ड को चिह्नित किया जा सके जो पारंपरिक नियमों को पार कर जाते हैं।
प्रतिकूल सिमुलेशन और रेड टीमिंग: बेहतर रक्षात्मक पासवर्ड नीति डिजाइन के लिए परिष्कृत, संदर्भ-जागरूक हमलावरों के सिमुलेशन के लिए निर्देशित PassGPT का उपयोग करना।
क्रॉस-डोमेन पैटर्न लर्निंग: यह पता लगाना कि क्या पासवर्ड पर प्रशिक्षित एलएलएम विभिन्न सेवाओं में उपयोगकर्ता-विशिष्ट पैटर्न की पहचान कर सकते हैं, जिससे लक्षित हमलों के बारे में चिंताएं बढ़ सकती हैं।
रक्षात्मक प्रशिक्षण डेटा जनरेशन: वास्तविक उपयोगकर्ता डेटा को उजागर किए बिना रक्षात्मक ML मॉडल को प्रशिक्षित करने के लिए बड़े पैमाने पर, यथार्थवादी सिंथेटिक पासवर्ड डेटासेट जनरेट करने के लिए PassGPT का उपयोग करना।
बड़े संदर्भ के साथ एकीकरण: भविष्य के मॉडल संदर्भ डेटा (जैसे, उपयोगकर्ता जनसांख्यिकी, सेवा प्रकार) को शामिल कर सकते हैं ताकि पासवर्ड चुनाव को और भी अधिक सटीक रूप से मॉडल किया जा सके, जैसा कि एलएलएम में व्यक्तिगतकरण के रुझानों से संकेत मिलता है।

7. संदर्भ

Rando, J., Perez-Cruz, F., & Hitaj, B. (2023). PassGPT: Password Modeling and (Guided) Generation with Large Language Models. arXiv preprint arXiv:2306.01545.
Goodfellow, I., et al. (2014). Generative Adversarial Nets. Advances in Neural Information Processing Systems.
Hitaj, B., Gasti, P., Ateniese, G., & Perez-Cruz, F. (2019). PassGAN: A Deep Learning Approach for Password Guessing. Applied Cryptography and Network Security.
Radford, A., et al. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Blog.
Wheeler, D. L. (2016). zxcvbn: Low-Budget Password Strength Estimation. USENIX Security Symposium.
Melicher, W., et al. (2016). Fast, Lean, and Accurate: Modeling Password Guessability Using Neural Networks. USENIX Security Symposium.

8. मूल विश्लेषण और विशेषज्ञ टिप्पणी

मूल अंतर्दृष्टि

PassGPT केवल एक वृद्धिशील सुधार नहीं है; यह एक प्रतिमान परिवर्तन है जो आधुनिक AI के खिलाफ मानव-चुने गए रहस्यों की मौलिक नाजुकता को उजागर करता है। पेपर का सबसे निंदनीय निष्कर्ष यह है कि एलएलएम की बहुत ही अनुक्रमिक, पैटर्न-मिलान करने वाली प्रकृति—जो उन्हें भाषा में इतना अच्छा बनाती है—उन्हें पासवर्ड की अर्ध-संरचित "भाषा" को मॉडल करने में भयानक रूप से प्रभावी बनाती है। यह खतरे को सांख्यिकीय ब्रूट-फोर्सिंग से संज्ञानात्मक मॉडलिंग की ओर ले जाता है।

तार्किक प्रवाह

तर्क प्रभावशाली है: 1) एलएलएम अनुक्रमों में गहरे सांख्यिकीय पैटर्न सीखकर NLP पर हावी हैं। 2) पासवर्ड गहरे, अक्सर अवचेतन, सांख्यिकीय पैटर्न (जैसे, कीबोर्ड वॉक, तारीख प्रारूप, शब्दार्थ संयोजन) के साथ मानव-जनित अनुक्रम हैं। 3) इसलिए, एलएलएम को पासवर्ड मॉडलिंग पर हावी होना चाहिए। परिणाम इसकी क्रूर दक्षता के साथ पुष्टि करते हैं। निर्देशित जनरेशन सुविधा तार्किक किलर ऐप है—यह इस समझ को हथियार बनाती है, जिससे हमलावरों को नीति और मानवीय आलस्य के प्रतिच्छेदन का शल्य चिकित्सा की तरह शोषण करने की अनुमति मिलती है।

शक्तियां और दोष

शक्तियां: GANs पर 20% प्रदर्शन वृद्धि एक ऐसे क्षेत्र में महत्वपूर्ण है जहां लाभ कठिनाई से प्राप्त होते हैं। स्पष्ट संभाव्यता वितरण एक प्रमुख सैद्धांतिक और व्यावहारिक लाभ है, जो जनरेशन और एस्टीमेशन के बीच सेतु का काम करता है। निर्देशित जनरेशन एक वास्तविक नवाचार है।
दोष और प्रश्न: पेपर, अधिकांश प्रतिकूल ML शोध की तरह, रक्षात्मक निहितार्थों पर हल्का है। हम ऐसी नीतियां कैसे बनाएं जो इसके प्रति लचीली हों? प्रशिक्षण डेटा (पासवर्ड लीक) नैतिक रूप से संदिग्ध है। इसके अलावा, जैसा कि CycleGAN पेपर और अन्य जेनरेटिव मॉडल साहित्य में उल्लेख किया गया है, मोड पतन और विविधता सदाबहार मुद्दे हैं; जबकि PassVQT परप्लेक्सिटी को संबोधित करता है, वास्तव में यादृच्छिक पासवर्ड की लंबी पूंछ अभी भी सुरक्षित हो सकती है। तुलना मुख्य रूप से GANs के खिलाफ है; JtR या उन्नत नियमों के साथ हैशकैट जैसे बड़े, अनुकूलित नियम-आधारित सिस्टम के खिलाफ एक बेंचमार्क अधिक पूर्ण चित्र प्रदान करेगा।

कार्रवाई योग्य अंतर्दृष्टि

CISO और रक्षकों के लिए: जटिलता नियमों का युग समाप्त हो गया है। नीतियों को वास्तव में यादृच्छिक पासफ्रेज़ या क्रिप्टोग्राफिक रूप से सुरक्षित मैनेजर द्वारा जनरेट किए गए पासवर्ड के उपयोग को अनिवार्य करना चाहिए। zxcvbn जैसे टूल्स को तुरंत एक "ML गेसबिलिटी" स्कोर के साथ संवर्धित किया जाना चाहिए, जो संभवतः PassGPT जैसे मॉडल से प्राप्त हो। सक्रिय खतरा शिकार में आपके अपने पासवर्ड हैश (उचित प्राधिकरण के साथ) के खिलाफ PassGPT-शैली के हमलों का सिमुलेशन शामिल होना चाहिए।
शोधकर्ताओं के लिए: प्राथमिकता रक्षात्मक होनी चाहिए। अगले पेपर "PassGPT-प्रतिरोधी पासवर्ड क्रिएशन योजनाओं" पर होने चाहिए। लीक किए गए डेटा का उपयोग करने वाले शोध के लिए नैतिक ढांचे की भी एक तत्काल आवश्यकता है, जैसा कि सेंटर फॉर लॉन्ग-टर्म साइबरसिक्योरिटी (CLTC) जैसे संस्थानों द्वारा जोर दिया गया है। अंत में, मानवीय प्रतिक्रिया (RLHF) से सुदृढीकरण सीखने के अनुप्रयोग का पता लगाना ताकि एलएलएम को अनुमानित पैटर्न जनरेट करने से दूर ले जाया जा सके, एक आशाजनक रक्षात्मक प्रतिकार हो सकता है।

संक्षेप में, PassGPT एक जागरण कॉल है। यह प्रदर्शित करता है कि AI की अत्याधुनिक तकनीक, जिसे रचनात्मक और संचार कार्यों के लिए विकसित किया गया है, को सबसे पुराने डिजिटल सुरक्षा तंत्रों में से एक को तोड़ने के लिए स्तब्ध कर देने वाली प्रभावकारिता के साथ पुनः उपयोग में लाया जा सकता है। रक्षा अब केवल मानवीय पूर्वानुमेयता को मात देने पर भरोसा नहीं कर सकती; अब उसे उस AI को भी मात देनी होगी जिसने इसे पूरी तरह से अनुकरण करना सीख लिया है।