SOPG: تولید رمز عبور مبتنی بر جستجوی مرتب‌شده برای شبکه‌های عصبی خودرگرسیو

فهرست مطالب

1. مقدمه

رمزهای عبور همچنان فراگیرترین روش احراز هویت کاربران هستند. در نتیجه، حدس زدن رمز عبور جزء حیاتی تحقیقات امنیت سایبری است که هم آزمون امنیت تهاجمی (شکستن رمز) و هم ارزیابی قدرت دفاعی را پشتیبانی می‌کند. روش‌های سنتی، از شمارش مبتنی بر قاعده گرفته تا مدل‌های آماری مانند زنجیره‌های مارکوف و PCFG، محدودیت‌های ذاتی در کارایی و تنوع دارند. ظهور یادگیری عمیق، به ویژه شبکه‌های عصبی خودرگرسیو، نوید یک تغییر پارادایم را داد. با این حال، یک گلوگاه حیاتی همچنان پابرجا بود: روش استاندارد تولید نمونه‌گیری تصادفی. این امر منجر به رمزهای عبور تکراری و، بدتر از آن، ترتیب تصادفی تولید می‌شود که مهاجمان را مجبور می‌کند از میان فهرست‌های وسیع و ناکارآمد غربالگری کنند. این مقاله SOPG (تولید رمز عبور مرتب‌شده مبتنی بر جستجو) را معرفی می‌کند، روشی نوین که طراحی شده تا مدل‌های حدس زدن رمز عبور خودرگرسیو را وادار کند رمزهای عبور را به ترتیب تقریبی نزولی احتمال تولید کنند و در نتیجه کارایی حمله را به شدت افزایش دهند.

2. پیشینه و کارهای مرتبط

2.1 تکامل حدس زدن رمز عبور

حدس زدن رمز عبور از مراحل متمایزی تکامل یافته است. روش‌های اولیه به حمله‌های واژه‌نامه‌ای و قواعد تغییر دستی (مانند John the Ripper) متکی بودند که اکتشافی و وابسته به تجربه بودند. گسترش نشت‌های رمز عبور در مقیاس بزرگ (مانند RockYou در سال ۲۰۰۹) امکان رویکردهای آماری مبتنی بر داده را فراهم کرد. مدل مارکوف (وایر و همکاران، ۲۰۰۹) و دستور زبان احتمالی مستقل از متن (PCFG) (ما و همکاران، ۲۰۱۴) چارچوبی سیستماتیک‌تر و مبتنی بر احتمال برای تولید ارائه دادند، اگرچه خطر بیش‌برازش داشتند و فاقد ظرفیت مدل‌سازی وابستگی‌های پیچیده و بلندمدت در ساختار رمزهای عبور بودند.

2.2 رویکردهای شبکه عصبی

مدل‌های یادگیری عمیق، به ویژه شبکه‌های مولد تخاصمی (GANs) مانند PassGAN (هیتاج و همکاران، ۲۰۱۷) و مدل‌های خودرگرسیو مانند آن‌هایی که بر اساس معماری‌های LSTM یا GPT هستند، توزیع احتمال رمزهای عبور را مستقیماً از داده‌ها یاد می‌گیرند. آن‌ها می‌توانند رمزهای عبور بسیار متنوع و واقع‌گرایانه تولید کنند. با این حال، آن‌ها معمولاً از نمونه‌گیری تصادفی (مانند نمونه‌گیری چندجمله‌ای) از توزیع یادگرفته‌شده در هر مرحله تولید استفاده می‌کنند. این فرآیند بنیادی نسبت به رتبه‌بندی سراسری احتمالات رمز عبور کامل بی‌تفاوت است که منجر به ناکارآمدی‌هایی می‌شود که SOPG قصد حل آن‌ها را دارد.

بهبود نرخ پوشش

۳۵.۰۶٪

نرخ پوشش دست‌یافته توسط SOPGesGPT که به طور قابل توجهی از روش‌های قبلی بهتر عمل کرده است.

افزایش کارایی در برابر نمونه‌گیری تصادفی

به مراتب کمتر

تعداد رمزهای عبور و استنتاج‌های مورد نیاز SOPG برای رسیدن به همان پوشش.

نرخ تکراری

۰٪

SOPG تضمین می‌کند هیچ رمز عبور تکراری تولید نمی‌شود.

3. روش SOPG

3.1 مفهوم اصلی

SOPG تولید رمز عبور را از یک مسئله نمونه‌گیری تصادفی به یک مسئله جستجوی هدایت‌شده بازتعریف می‌کند. به جای انتخاب تصادفی کاراکتر بعدی، از یک الگوریتم جستجو (احتمالاً یک گونه از جستجوی پرتو یا جستجوی بهترین-اول) برای کاوش در فضای ادامه‌های ممکن رمز عبور استفاده می‌کند و مسیرهایی را اولویت‌دهی می‌کند که به رمزهای عبور کامل با احتمالات تخمینی بالاتر منجر می‌شوند. هدف، خروجی دادن فهرست رمزهای عبور به ترتیبی است که به یک مرتب‌سازی نزولی واقعی بر اساس $P(رمز عبور|مدل)$ نزدیک باشد.

3.2 الگوریتم جستجو

اگرچه چکیده PDF الگوریتم خاص را به تفصیل شرح نمی‌دهد، اما رفتار توصیف‌شده روشی را پیشنهاد می‌کند که یک صف اولویت از پیشوندهای نامزد رمز عبور را حفظ می‌کند. در هر مرحله، امیدوارکننده‌ترین پیشوند (با بالاترین احتمال تجمعی) را با پرس‌وجو از شبکه عصبی برای توزیع کاراکتر بعدی گسترش می‌دهد و نامزدهای جدیدی ایجاد می‌کند. با کاوش سیستماتیک مناطق با احتمال بالای فضای رمز عبور در ابتدا، تولید اولیه محتمل‌ترین رمزهای عبور را تضمین می‌کند و ذاتاً از تکراری‌ها جلوگیری می‌کند.

3.3 مدل SOPGesGPT

نویسندگان روش خود را بر روی یک معماری مبتنی بر GPT پیاده‌سازی کرده و SOPGesGPT را ایجاد کرده‌اند. مدل GPT (مانند یک ترنسفورمر فقط-رمزگشا) بر روی مجموعه داده‌های رمز عبور نشت‌یافته آموزش دیده تا کاراکتر بعدی در یک دنباله را پیش‌بینی کند. سپس SOPG به عنوان روش تولید/استنتاج بر روی این مدل آموزش‌دیده اعمال می‌شود و نمونه‌گیری استاندارد را جایگزین می‌کند.

4. جزئیات فنی و فرمول‌بندی ریاضی

یک مدل خودرگرسیو احتمال یک رمز عبور $\mathbf{x} = (x_1, x_2, ..., x_T)$ را به عنوان حاصلضرب احتمالات شرطی تعریف می‌کند: $$P(\mathbf{x}) = \prod_{t=1}^{T} P(x_t | x_1, ..., x_{t-1})$$ که در آن $x_t$ کاراکتر در موقعیت $t$ است و $T$ طول رمز عبور است. نمونه‌گیری استاندارد $x_t \sim P(\cdot | x_1, ..., x_{t-1})$ را انتخاب می‌کند.

SOPG، از نظر مفهومی، هدفش یافتن و خروجی دادن دنباله‌های $\mathbf{x}$ به ترتیب کاهشی $P(\mathbf{x})$ است. این را می‌توان به عنوان یک مسئله جستجوی کوتاه‌ترین مسیر در یک درخت دید که گره‌ها پیشوندها هستند، هزینه‌های یال مرتبط با $-\log P(x_t | پیشوند)$ هستند و هدف، شمارش مسیرها (رمزهای عبور) به ترتیب افزایش هزینه کل (یعنی کاهش احتمال) است. الگوریتم‌هایی مانند جستجوی هزینه یکنواخت (UCS) یا گونه محدودشده آن، جستجوی پرتو با عرض پرتو بزرگ و هرس پویا، می‌توانند این مرتب‌سازی تقریبی را محقق کنند. نکته کلیدی این است که مرز جستجو بر اساس امتیاز احتمال مسیر فعلی اولویت‌بندی می‌شود.

5. نتایج آزمایشی و تحلیل

5.1 مقایسه با نمونه‌گیری تصادفی

مقاله نتایج قانع‌کننده‌ای را مقایسه‌کننده SOPG با نمونه‌گیری تصادفی استاندارد بر روی همان مدل پایه ارائه می‌دهد. یافته‌های کلیدی:

بدون تکراری: SOPG یک فهرست منحصربه‌فرد تولید می‌کند، در حالی که نمونه‌گیری تصادفی تکرارهای زیادی تولید می‌کند و تلاش محاسباتی را هدر می‌دهد.
کارایی حمله برتر: برای دستیابی به همان نرخ پوشش (درصد رمزهای عبور شکسته‌شده در یک مجموعه آزمون)، SOPG به تعداد بسیار کمتری از استنتاج‌های مدل نیاز دارد و یک فهرست کل بسیار کوچک‌تری تولید می‌کند. این مستقیماً به معنای شکستن سریع‌تر رمز عبور در سناریوهای واقعی است.

5.2 ارزیابی در برابر پیشرفته‌ترین روش‌ها

SOPGesGPT در برابر مدل‌های اصلی حدس زدن رمز عبور ارزیابی شد: OMEN (مارکوف)، FLA، PassGAN (GAN)، VAEPass (VAE) و PassGPT معاصر. در یک آزمون تک‌سایتی:

نرخ پوشش: SOPGesGPT به ۳۵.۰۶٪ دست یافت که از OMEN ۲۵۴٪، از FLA ۲۹۸٪، از PassGAN ۴۲۱٪، از VAEPass ۳۸۰٪ و از PassGPT ۸۱٪ بهتر عمل کرد.
نرخ مؤثر: مقاله همچنین ادعای رهبری در "نرخ مؤثر" را دارد، که احتمالاً معیاری مرتبط با کیفیت یا نرخ برخورد رمزهای عبور تولیدشده در مراحل اولیه است که نقطه قوت اصلی SOPG است.

این نشان می‌دهد که روش تولید (SOPG) به اندازه معماری مدل برای عملکرد حیاتی است.

تفسیر نمودار (فرضی بر اساس متن): یک نمودار خطی مقایسه‌کننده "نرخ پوشش در برابر تعداد رمزهای عبور تولیدشده" منحنی SOPGesGPT را نشان می‌دهد که به شدت بالا می‌رود و زودتر به حالت ثابت می‌رسد، در حالی که منحنی نمونه‌گیری تصادفی کندتر بالا می‌رود و برای رسیدن به همان ارتفاع به تعداد بسیار بیشتری در محور x نیاز دارد. یک نمودار میله‌ای برای "نرخ پوشش نهایی" میله SOPGesGPT را نشان می‌دهد که بر فراز میله‌های OMEN، PassGAN و PassGPT قرار دارد.

6. چارچوب تحلیل و مثال موردی

چارچوب ارزیابی مدل‌های حدس زدن رمز عبور:

معماری مدل و آموزش: شبکه عصبی زیربنایی چیست (GAN، VAE، ترنسفورمر خودرگرسیو)؟ چگونه آموزش دیده است؟
روش تولید: رمزهای عبور چگونه از مدل آموزش‌دیده تولید می‌شوند؟ (مانند نمونه‌گیری تصادفی، جستجوی پرتو، SOPG). این تمرکز کلیدی مقاله است.
مرتب‌سازی و کارایی: آیا روش، رمزهای عبور را به یک ترتیب مفید (احتمال نزولی) تولید می‌کند؟ کارایی محاسباتی/حدسی آن چیست؟
تنوع و تکرار: آیا رمزهای عبور جدید تولید می‌کند یا تکرارهای زیادی دارد؟
عملکرد معیار: نرخ پوشش، نرخ مؤثر و سرعت بر روی مجموعه داده‌های استاندارد (مانند RockYou).

مثال موردی غیرکدی: دو مهاجم، آلیس و باب را در نظر بگیرید که از همان مدل رمز عبور GPT آموزش‌دیده استفاده می‌کنند. آلیس از نمونه‌گیری تصادفی استاندارد استفاده می‌کند. باب از SOPG استفاده می‌کند. برای شکستن یک مجموعه آزمون ۱۰۰۰ رمز عبوری، نرم‌افزار آلیس ممکن است نیاز به تولید ۱۰ میلیون حدس داشته باشد، با ۳۰٪ تکرار، تا ۳۵۰ رمز را بشکند. نرم‌افزار هدایت‌شده باب با SOPG ممکن است تنها ۱ میلیون حدس منحصربه‌فرد را به ترتیب بهینه تولید کند تا همان ۳۵۰ رمز را بشکند. حمله باب ۱۰ برابر کارآمدتر از نظر منابع است و سریع‌تر تکمیل می‌شود.

7. چشم‌انداز کاربرد و جهت‌های آینده

کاربردهای فوری:

آزمایش پیش‌کننده قدرت رمز عبور: تیم‌های امنیتی می‌توانند از مدل‌های تقویت‌شده با SOPG برای حسابرسی کارآمدتر سیاست‌های رمز عبور پیشنهادی با تولید محتمل‌ترین بردارهای حمله در ابتدا استفاده کنند.
بازیابی رمز عبور پزشکی-قانونی: ابزارهای قانونی بازیابی رمز عبور می‌توانند SOPG را ادغام کنند تا نرخ موفقیت را در محدودیت‌های زمانی/محاسباتی افزایش دهند.

جهت‌های تحقیقاتی آینده:

مدل‌های ترکیبی: ترکیب تولید مرتب‌شده SOPG با نقاط قوت معماری‌های دیگر (مانند ادغام دانش معنایی از مدل‌های زبانی بزرگ).
SOPG سازگار/برخط: تغییر استراتژی جستجو در زمان واقعی بر اساس بازخورد نتایج حمله جزئی.
اقدامات متقابل دفاعی: تحقیق در مورد تکنیک‌های جدید هش کردن یا ذخیره‌سازی رمز عبور که به طور خاص در برابر حملات مرتب‌شده و احتمال‌محور مانند SOPG مقاوم هستند.
فراتر از رمزهای عبور: اعمال پارادایم تولید مرتب‌شده به حوزه‌های امنیتی دیگر مانند تولید URLهای فیشینگ محتمل یا گونه‌های بدافزار.

8. مراجع

Weir, M., Aggarwal, S., Medeiros, B., & Glodek, B. (2009). Password Cracking Using Probabilistic Context-Free Grammars. In IEEE Symposium on Security and Privacy.
Ma, J., Yang, W., Luo, M., & Li, N. (2014). A Study of Probabilistic Password Models. In IEEE Symposium on Security and Privacy.
Hitaj, B., Gasti, P., Ateniese, G., & Perez-Cruz, F. (2017). PassGAN: A Deep Learning Approach for Password Guessing. In International Conference on Applied Cryptography and Network Security.
Goodfellow, I., et al. (2014). Generative Adversarial Nets. Advances in Neural Information Processing Systems.
Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Blog.
Melicher, W., et al. (2016). Fast, Lean, and Accurate: Modeling Password Guessability Using Neural Networks. In USENIX Security Symposium.

9. تحلیل اصیل و تفسیر کارشناسی

بینش اصلی: مقاله جین و همکاران یک ضربه جراحی بر یک گلوگاه حیاتی اما نادیده گرفته‌شده در امنیت تهاجمی مبتنی بر هوش مصنوعی وارد می‌کند: استراتژی تولید. برای سال‌ها، این حوزه وسواس مدل‌های معماری داشت—GANs در مقابل VAEs در مقابل ترنسفورمرها—که به شدت از ML جریان اصلی وام گرفته بود، همان‌طور که در مسیر از PassGAN (الهام‌گرفته از GANهای تصویری [4]) تا PassGPT (الهام‌گرفته از LLMهایی مانند GPT-2 [5]) دیده می‌شود. این مقاله به درستی استدلال می‌کند که حتی یک مدل کامل نیز با نمونه‌گیری تصادفی ساده فلج می‌شود. SOPG فقط یک بهبود تدریجی نیست؛ یک بازاندیشی بنیادی از فرآیند استنتاج است که پارادایم را از "تولید تصادفی" به "کاوش هدایت‌شده و بهینه" تغییر می‌دهد. این بینش برای حدس زدن رمز عبور به اندازه جستجوی درخت مونت‌کارلو AlphaGo برای هوش مصنوعی بازی‌ها ارزشمند است—درباره جستجوی هوشمندانه فضای یادگرفته‌شده است.

جریان منطقی و نقاط قوت: منطق بی‌عیب است. ۱) مدل‌های خودرگرسیو یک توزیع احتمال قابل مدیریت بر روی دنباله‌ها ارائه می‌دهند. ۲) نمونه‌گیری تصادفی از این توزیع برای یافتن سریع موارد با احتمال بالا ناکارآمد است. ۳) بنابراین، از یک الگوریتم جستجو (یک مفهوم تثبیت‌شده علوم کامپیوتر) برای شمارش خروجی‌ها بر اساس احتمال استفاده کنید. قدرت در سادگی و تأثیر عمیق آن نهفته است. نتایج حیرت‌آور است: بهبود ۸۱٪ی نسبت به آخرین مدل PassGPT صرفاً از تغییر روش تولید. این بر یک اصل که اغلب در هوش مصنوعی کاربردی فراموش می‌شود تأکید می‌کند: مهندسی استنتاج می‌تواند بازدهی بیشتری نسبت به مقیاس‌بندی مدل داشته باشد. تضمین عدم وجود تکرار، یک پیروزی عملی بزرگ دیگر است که چرخه‌های محاسباتی هدررفته را حذف می‌کند.

نقاط ضعف و سؤالات باز: اختصار مقاله در بخش ارائه‌شده ضعف اصلی آن است. "الگوریتم جستجو" یک جعبه سیاه است. آیا A* است؟ جستجوی پرتو با یک اکتشاف هرس پیچیده؟ سربار محاسباتی خود جستجو مورد بحث قرار نگرفته است. اگرچه تعداد استنتاج‌های مورد نیاز برای یک نرخ پوشش معین را کاهش می‌دهد، اما هر مرحله استنتاج در یک جستجو ممکن است پیچیده‌تر از نمونه‌گیری ساده باشد. یک مبادله بین عمق جستجو، عرض و تأخیر وجود دارد که نیاز به تحلیل دارد. علاوه بر این، ارزیابی یک "آزمون تک‌سایتی" است. SOPG چگونه در مجموعه داده‌های متنوع (شرکتی در مقابل مصرف‌کننده، زبان‌های مختلف) تعمیم می‌یابد؟ استحکام نیاز به تأیید دارد.

بینش‌های قابل اجرا: برای متخصصان امنیت: این مقاله یک زنگ بیدارباش است. برآوردکننده‌های قدرت رمز عبور دفاعی اکنون باید حملات مرتب‌شده و شبیه SOPG را که بسیار قدرتمندتر از حملات سنتی brute-force یا حتی حملات عصبی قدیمی هستند، در نظر بگیرند. سیاست رمز عبور باید تکامل یابد. برای محققان هوش مصنوعی: درس این است که فراتر از تابع زیان نگاه کنید. مکانیزم استنتاج/تولید یک شهروند درجه یک در طراحی سیستم‌های مولد برای امنیت، پزشکی یا طراحی است. این رویکرد می‌تواند برای سایر وظایف امنیتی خودرگرسیو، مانند تولید payloadهای حمله شبکه اعمال شود. برای نویسندگان: گام بعدی متن‌باز کردن الگوریتم، تشریح پیچیدگی آن و اجرای معیارهای در مقیاس بزرگ و بین‌مجموعه‌داده‌ای است. همکاری با سازمان‌هایی مانند مرکز امنیت اینترنت (CIS) یا ارجاع به چارچوب‌های دستورالعمل‌های هویت دیجیتال NIST (SP 800-63B) می‌تواند کار را در استانداردهای دفاعی عملی مستحکم کند. SOPG یک اهرم درخشان است؛ اکنون باید نیروی کامل آن را اندازه‌گیری کنیم و به مدافعان بیاموزیم چگونه در برابر آن مقاومت کنند.