کاهش سوگیری در مدلسازی قدرت رمز عبور دنیای واقعی با استفاده از یادگیری عمیق و فرهنگ‌های لغت پویا

1. مقدمه

رمزهای عبور با وجود نقاط ضعف امنیتی شناخته شده، همچنان مکانیسم اصلی احراز هویت باقی مانده‌اند. کاربران تمایل دارند رمزهای عبوری با الگوهای قابل پیش‌بینی ایجاد کنند که آن‌ها را در برابر حملات حدس‌زنی آسیب‌پذیر می‌سازد. امنیت چنین سیستم‌هایی را نمی‌توان با پارامترهای رمزنگاری سنتی کمّی کرد، بلکه نیازمند مدلسازی دقیق رفتار مهاجم است. این مقاله به شکافی حیاتی می‌پردازد: سوگیری اندازه‌گیری قابل توجهی که زمانی ایجاد می‌شود که محققان از حملات فرهنگ لغت آماده و پیکربندی‌شده ثابت استفاده می‌کنند که قادر به شبیه‌سازی استراتژی‌های پویا و مبتنی بر تخصص مهاجمان دنیای واقعی نیستند.

2. پیشینه و بیان مسئله

شکافنده‌های رمز عبور دنیای واقعی از حملات فرهنگ لغت پرکارآمد و عمل‌گرا همراه با قواعد تغییر شکل (مانند استفاده از ابزارهایی مانند Hashcat یا John the Ripper) استفاده می‌کنند. اثربخشی این حملات به پیکربندی‌های تنظیم‌شده توسط متخصصان وابسته است - جفت‌های خاصی از فهرست کلمات و مجموعه قواعد - که طی سال‌ها تجربه ساخته شده‌اند. تحلیل‌های امنیتی که به پیکربندی‌های پیش‌فرض متکی هستند، قدرت رمز عبور را به شدت بیش‌برآورد می‌کنند و سوگیری اندازه‌گیری‌ای ایجاد می‌کنند که اعتبار نتایج امنیتی را تضعیف می‌کند.

2.1 سوگیری اندازه‌گیری در امنیت رمز عبور

مشکل اصلی، شکاف بین مدل‌های رمز عبور آکادمیک و شیوه‌های شکستن رمز در دنیای واقعی است. مطالعاتی مانند Ur و همکاران (2017) نشان داده‌اند که معیارهای قدرت رمز عبور به شدت به مدل مهاجم مورد استفاده حساس هستند. استفاده از یک مدل ضعیف یا عمومی منجر به بیش‌برآورد امنیت و ایجاد حس امنیت کاذب می‌شود.

2.2 محدودیت‌های حملات فرهنگ لغت سنتی

حملات فرهنگ لغت سنتی ایستا هستند. آن‌ها مجموعه‌ای ثابت از قواعد تغییر شکل (مانند leet speak، افزودن پسوند اعداد) را به یک فهرست کلمات ثابت در ترتیبی از پیش تعیین شده اعمال می‌کنند. آن‌ها فاقد انطباق‌پذیری متخصصان انسانی هستند که می‌توانند:

حملات را بر اساس هدف (مانند نام شرکت، عبارات رایج محلی) سفارشی کنند.
قواعد را بر اساس موفقیت‌های میانی به صورت پویا اولویت‌بندی مجدد کنند.
داده‌های تازه افشاشده را در طول یک حمله ادغام کنند.

3. روش‌شناسی پیشنهادی

نویسندگان رویکردی دوگانه برای خودکارسازی استراتژی‌های حدس‌زنی شبیه به متخصصان پیشنهاد می‌دهند که وابستگی به پیکربندی دستی و دانش دامنه را کاهش می‌دهد.

3.1 شبکه عصبی عمیق برای مدلسازی مهارت مهاجم

یک شبکه عصبی عمیق (DNN) برای مدلسازی توزیع احتمال رمزهای عبور آموزش داده می‌شود. نوآوری کلیدی آموزش این مدل نه تنها بر روی مجموعه‌داده‌های خام رمز عبور، بلکه بر روی دنباله‌ای از قواعد تغییر شکلی است که توسط شکافنده‌های متخصص بر روی کلمات پایه اعمال شده‌اند. این امر به DNN اجازه می‌دهد تا "مهارت" یک مهاجم - یعنی تبدیل‌های محتمل و ترتیب مؤثر آن‌ها - را بیاموزد.

3.2 استراتژی‌های حدس‌زنی پویا

به جای یک مجموعه قواعد ثابت، این حمله از یک استراتژی حدس‌زنی پویا استفاده می‌کند. DNN با اعمال متوالی تبدیل‌هایی که احتمالات آن‌ها بر اساس وضعیت فعلی کلمه و زمینه حمله شرطی شده‌اند، تولید رمزهای عبور کاندید را هدایت می‌کند. این کار توانایی یک متخصص در تطبیق مسیر حمله در زمان واقعی را تقلید می‌کند.

3.3 چارچوب فنی

این سیستم را می‌توان به عنوان یک مولد احتمالی تصور کرد. با توجه به یک کلمه پایه $w_0$ از یک فرهنگ لغت، مدل یک رمز عبور $p$ را از طریق دنباله‌ای از $T$ تبدیل (قواعد تغییر شکل $r_t$) تولید می‌کند. احتمال رمز عبور به صورت زیر مدل می‌شود: $$P(p) = \sum_{w_0, r_{1:T}} P(w_0) \prod_{t=1}^{T} P(r_t | w_0, r_{1:t-1})$$ که در آن $P(r_t | w_0, r_{1:t-1})$ احتمال اعمال قاعده $r_t$ با توجه به کلمه اولیه و تاریخچه قواعد قبلی است که توسط DNN خروجی داده می‌شود. این فرمول‌بندی امکان اعمال قاعده آگاه از زمینه و غیرخطی را فراهم می‌کند.

4. نتایج آزمایش و تحلیل

4.1 مجموعه داده و تنظیمات آزمایش

آزمایش‌ها بر روی چندین مجموعه داده بزرگ رمز عبور دنیای واقعی (مانند RockYou، LinkedIn) انجام شد. مدل پیشنهادی با مدل‌های احتمالاتی رمز عبور پیشرفته (مانند مدل‌های مارکوف، PCFG) و حملات فرهنگ لغت استاندارد با مجموعه قواعد محبوب (مانند best64.rule، d3ad0ne.rule) مقایسه شد.

4.2 مقایسه عملکرد

معیار کلیدی شماره حدس است - تعداد حدس‌های مورد نیاز برای شکستن یک درصد معین از رمزهای عبور. نتایج نشان داد که حمله فرهنگ لغت پویا که توسط DNN پشتیبانی می‌شود:

در تمامی مجموعه‌داده‌ها از حملات فرهنگ لغت ایستا بهتر عمل کرد و رمزهای عبور بیشتری را با حدس‌های کمتری شکست.
به عملکرد حملات تنظیم‌شده توسط متخصصان و خاص هدف نزدیک شد، حتی زمانی که DNN بر روی داده‌های عمومی آموزش دیده بود.
در مقایسه با حملات ایستا، استحکام بیشتری در برابر تغییرات کیفیت فرهنگ لغت اولیه نشان داد.

توضیح نمودار: یک نمودار خطی درصد تجمعی رمزهای عبور شکسته شده (محور Y) را در برابر لگاریتم شماره حدس (محور X) نشان می‌دهد. منحنی روش پیشنهادی به طور قابل توجهی سریع‌تر و بالاتر از منحنی‌های PCFG، مارکوف و حملات فرهنگ لغت ایستا افزایش می‌یابد، به ویژه در رتبه‌های حدس اولیه (مانند اولین 10^9 حدس).

4.3 تحلیل کاهش سوگیری

مقاله کاهش سوگیری اندازه‌گیری را کمّی می‌کند. هنگام ارزیابی قدرت یک سیاست رمز عبور، استفاده از یک حمله ایستا ممکن است به این نتیجه برسد که 50% رمزهای عبور در برابر 10^12 حدس مقاومت می‌کنند. حمله پویای پیشنهادی، که یک مهاجم تواناتر را مدل می‌کند، ممکن است نشان دهد که 50% توسط 10^10 حدس شکسته می‌شوند - یک بیش‌برآورد 100 برابری توسط مدل ایستا. این موضوع اهمیت حیاتی مدلسازی دقیق مهاجم را برای تصمیم‌گیری‌های سیاستی برجسته می‌سازد.

5. مطالعه موردی: مثال چارچوب تحلیل

سناریو: یک تیم امنیتی می‌خواهد تاب‌آوری رمزهای عبور کاربران خود را در برابر یک حمله پیچیده و هدفمند ارزیابی کند.

رویکرد سنتی (مغرضانه): آن‌ها Hashcat را با فهرست کلمات rockyou.txt و مجموعه قواعد best64.rule اجرا می‌کنند. گزارش بیان می‌کند: "80% رمزهای عبور در برابر 1 میلیارد حدس مقاومت می‌کنند."

چارچوب پیشنهادی (کاهش‌یافته سوگیری):

دریافت زمینه: نام شرکت، صنعت و هر داده موجود در مورد جمعیت‌شناسی کاربران (مانند یک نظرسنجی بازاریابی عمومی) به سیستم ارائه می‌شود.
پیکربندی پویا: DNN که از قبل بر روی دنباله‌های شکستن متخصصان آموزش دیده است، یک استراتژی حمله پویا تولید می‌کند. ممکن است قواعدی را اولویت‌دهی کند که نماد بورسی شرکت یا نام محصولات رایج را قبل از پسوندهای عددی عمومی اضافه می‌کنند.
شبیه‌سازی و گزارش‌دهی: حمله پویا شبیه‌سازی می‌شود. گزارش اکنون بیان می‌کند: "با در نظر گرفتن یک مهاجم آگاه از زمینه، 60% رمزهای عبور در عرض 1 میلیارد حدس شکسته خواهند شد. مدل قبلی قدرت را 25 واحد درصد بیش‌برآورد کرده است."

این چارچوب تحلیل را از یک بررسی عمومی به یک ارزیابی آگاه از تهدید تغییر می‌دهد.

6. کاربردهای آینده و جهت‌های پژوهشی

سنجه‌های قدرت رمز عبور پیش‌گیرانه: ادغام این مدل در سنجه‌های ایجاد رمز عبور زمان واقعی می‌تواند بازخورد قدرت را بر اساس یک مدل مهاجم واقع‌بینانه، نه یک مدل ساده‌انگارانه، به کاربران ارائه دهد.
آزمون نفوذ خودکار: تیم‌های قرمز می‌توانند از این فناوری برای تولید خودکار پیکربندی‌های بسیار مؤثر و خاص هدف برای شکستن رمز عبور استفاده کنند و زمان متخصصان را ذخیره کنند.
بهینه‌سازی سیاست رمز عبور: سازمان‌ها می‌توانند تأثیر سیاست‌های مختلف رمز عبور (طول، پیچیدگی) را در برابر این مدل پویا شبیه‌سازی کنند تا سیاست‌هایی طراحی کنند که واقعاً امنیت را بهبود بخشند.
یادگیری فدرال/حفظ حریم خصوصی: کار آینده می‌تواند آموزش DNN بر روی داده‌های نشت رمز عبور توزیع‌شده بدون متمرکز کردن مجموعه‌داده‌های حساس را بررسی کند، مشابه چالش‌های مطرح شده در پژوهش یادگیری فدرال از مؤسساتی مانند Google AI.
ادغام با سایر مدل‌های هوش مصنوعی: ترکیب این رویکرد با مدل‌های مولد (مانند GPT برای زبان طبیعی) می‌تواند حملاتی ایجاد کند که عبارت‌های عبور معنادار را بر اساس اطلاعات خاص هدف جمع‌آوری شده از وب تولید می‌کنند.

7. مراجع

Pasquini, D., Cianfriglia, M., Ateniese, G., & Bernaschi, M. (2021). Reducing Bias in Modeling Real-world Password Strength via Deep Learning and Dynamic Dictionaries. 30th USENIX Security Symposium.
Ur, B., et al. (2017). Do Users' Perceptions of Password Security Match Reality? Proceedings of the 2017 CHI Conference.
Weir, M., Aggarwal, S., Medeiros, B., & Glodek, B. (2010). Password Cracking Using Probabilistic Context-Free Grammars. IEEE Symposium on Security and Privacy.
Melicher, W., et al. (2016). Fast, Lean, and Accurate: Modeling Password Guessability Using Neural Networks. 25th USENIX Security Symposium.
Google AI. (2021). Federated Learning: Collaborative Machine Learning without Centralized Training Data. https://ai.google/research/pubs/pub45756
Goodfellow, I., et al. (2014). Generative Adversarial Nets. Advances in Neural Information Processing Systems. (CycleGAN یک معماری مشتق شده است).

8. تحلیل اصلی و تفسیر کارشناسی

بینش اصلی: این مقاله ضربه‌ای دقیق به یک نقص فراگیر اما اغلب نادیده گرفته شده در پژوهش امنیت سایبری وارد می‌کند: سوگیری "شکاف تخصص". برای سال‌ها، ارزیابی‌های قدرت رمز عبور آکادمیک بر روی شن ساخته شده‌اند - با استفاده از مدل‌های مهاجم ساده‌انگارانه و ایستا که شباهت کمی به متخصصان انسانی انطباق‌پذیر و تقویت‌شده با ابزار در دنیای واقعی دارند. Pasquini و همکاران صرفاً یک الگوریتم بهتر ارائه نمی‌دهند؛ آن‌ها این حوزه را وادار می‌کنند تا با نقطه کور روش‌شناختی خود روبرو شود. پیشرفت واقعی، قالب‌بندی مسئله نه به عنوان "شکستن بهتر رمز عبور" بلکه به عنوان "شبیه‌سازی بهتر مهاجم" است، تغییری ظریف اما حیاتی در دیدگاه که مشابه حرکت از طبقه‌بندهای ساده به شبکه‌های مولد تخاصمی (GANs) در هوش مصنوعی است، جایی که کیفیت مولد با توانایی آن در فریب ممیز تعریف می‌شود.

جریان منطقی: استدلال به طور قانع‌کننده‌ای خطی است. 1) تهدید واقعی = حملات پویای پیکربندی‌شده توسط متخصصان. 2) رویه رایج پژوهشی = حملات ایستا و آماده. 3) بنابراین، یک سوگیری اندازه‌گیری عظیم وجود دارد. 4) راه‌حل: خودکارسازی پیکربندی و انطباق‌پذیری متخصص با استفاده از هوش مصنوعی. استفاده از DNN برای مدلسازی دنباله قواعد ظریف است. این رویکرد تشخیص می‌دهد که دانش متخصص فقط یک کیسه از قواعد نیست، بلکه یک فرآیند احتمالاتی - یک دستور زبان شکستن - است. این با موفقیت مدل‌های دنباله‌ای مانند ترنسفورمرها در پردازش زبان طبیعی همسو است و نشان می‌دهد نویسندگان درس‌هایی از حوزه‌های مجاور هوش مصنوعی را به طور مؤثر به کار می‌گیرند.

نقاط قوت و ضعف: نقطه قوت اصلی تأثیر عملی است. این کار فایده فوری برای آزمون‌کنندگان نفوذ و حسابرسان امنیتی دارد. رویکرد مبتنی بر DNN آن نیز در یادگیری الگوهای پیچیده از روش‌های قدیمی PCFG کارآمدتر است. با این حال، یک نقص قابل توجه در وابستگی به داده آموزش نهفته است. "مهارت" مدل از رفتار مشاهده‌شده متخصصان (دنباله قواعد) آموخته می‌شود. اگر داده آموزش از یک جامعه خاص از شکافنده‌ها (مانند کسانی که از Hashcat به روشی خاص استفاده می‌کنند) آمده باشد، مدل ممکن است سوگیری‌های آن‌ها را به ارث ببرد و استراتژی‌های نوین را از دست بدهد. این شکلی از تقلید است، نه هوش استراتژیک واقعی. علاوه بر این، همانطور که در ادبیات یادگیری فدرال (مانند کار Google AI) اشاره شده است، پیامدهای حریم خصوصی جمع‌آوری چنین داده‌های حساس "رد حمله" برای آموزش بی�اهمیت نیست و به اندازه کافی بررسی نشده است.

بینش‌های قابل اجرا: برای متخصصان صنعت: استفاده از مجموعه قواعد پیش‌فرض برای ارزیابی ریسک را متوقف کنید. مدل‌های پویا و آگاه از زمینه مانند این را در خطوط لوله آزمون امنیتی خود ادغام کنید. برای پژوهشگران: این مقاله یک معیار جدید تعیین می‌کند. مدل‌های رمز عبور آینده باید در برابر مهاجمان انطباق‌پذیر، نه مهاجمان ایستا، اعتبارسنجی شوند. مرز بعدی بستن حلقه است - ایجاد مدافعان هوش مصنوعی که می‌توانند رمزهای عبور یا سیاست‌های مقاوم در برابر این حملات پویای مبتنی بر هوش مصنوعی طراحی کنند، به سمت یک چارچوب هم‌تکاملی تخاصمی مشابه GANs حرکت کنند، جایی که مدل‌های مهاجم و مدافع به طور هماهنگ بهبود می‌یابند. دوران ارزیابی رمزهای عبور در خلأ ایستا به پایان رسیده است، یا باید برسد.