ভাষা নির্বাচন করুন

PassGPT: বড় ভাষা মডেলের সাহায্যে পাসওয়ার্ড মডেলিং ও নির্দেশিত উৎপাদন - বিশ্লেষণ

পাসওয়ার্ড উৎপাদন ও শক্তি অনুমানের জন্য একটি এলএলএম, PassGPT-এর বিশ্লেষণ, যা GAN-কে ছাড়িয়ে গেছে এবং নির্দেশিত পাসওয়ার্ড তৈরির সুযোগ দিয়েছে।
computationalcoin.com | PDF Size: 1.8 MB
রেটিং: 4.5/5
আপনার রেটিং
আপনি ইতিমধ্যে এই ডকুমেন্ট রেট করেছেন
PDF ডকুমেন্ট কভার - PassGPT: বড় ভাষা মডেলের সাহায্যে পাসওয়ার্ড মডেলিং ও নির্দেশিত উৎপাদন - বিশ্লেষণ

1. ভূমিকা

জ্ঞাত দুর্বলতা সত্ত্বেও পাসওয়ার্ড এখনও প্রধান প্রমাণীকরণ পদ্ধতি হিসেবে রয়েছে। এই গবেষণাপত্রটি পাসওয়ার্ড নিরাপত্তার ক্ষেত্রে বড় ভাষা মডেল (এলএলএম)-এর প্রয়োগ অনুসন্ধান করে। লেখকরা PassGPT উপস্থাপন করেছেন, যা পাসওয়ার্ড লিকের উপর প্রশিক্ষিত একটি মডেল, উৎপাদন ও শক্তি অনুমানের জন্য। মূল গবেষণা প্রশ্নটি হল: মানুষের তৈরি পাসওয়ার্ডের অন্তর্নিহিত বৈশিষ্ট্যগুলো এলএলএম কতটা কার্যকরভাবে ধরতে পারে? এই কাজটি অফলাইন পাসওয়ার্ড অনুমান-এর প্রেক্ষাপটে অবস্থান নেয়, যেখানে একজন আক্রমণকারীর কাছে পাসওয়ার্ড হ্যাশ থাকে এবং তার লক্ষ্য হল প্লেইনটেক্সট সংস্করণ উদ্ধার করা।

মূল অবদান:

  • পাসওয়ার্ড মডেলিংয়ের জন্য GPT-2 স্থাপত্যের উপর ভিত্তি করে একটি এলএলএম, PassGPT-এর উন্নয়ন।
  • নির্দেশিত পাসওয়ার্ড উৎপাদন-এর পরিচয়, যা স্বেচ্ছাচারী শর্তের অধীনে নমুনা তৈরি করতে সক্ষম করে।
  • পাসওয়ার্ডের উপর সম্ভাব্যতা বণ্টন এবং শক্তি অনুমানের জন্য এর প্রভাব বিশ্লেষণ।
  • পূর্ববর্তী জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক (GAN)-ভিত্তিক পদ্ধতির চেয়ে উচ্চতর কার্যকারিতা প্রদর্শন।

2. পদ্ধতি ও স্থাপত্য

এই অংশে PassGPT-এর প্রযুক্তিগত ভিত্তি এবং এর নতুন সক্ষমতাগুলোর বিস্তারিত বর্ণনা করা হয়েছে।

2.1. PassGPT মডেল স্থাপত্য

PassGPT ট্রান্সফরমার-ভিত্তিক GPT-2 স্থাপত্যের উপর নির্মিত। GAN-এর মতো নয় যারা পাসওয়ার্ডকে সম্পূর্ণ হিসেবে তৈরি করে, PassGPT পাসওয়ার্ডকে অক্ষর পর্যায়ে অনুক্রমিকভাবে মডেল করে। এই স্বয়ংক্রিয়-প্রতিগমন মডেলিং পূর্ববর্তী অনুক্রম দেওয়া থাকলে পরবর্তী অক্ষরের জন্য একটি সম্ভাব্যতা বণ্টন সংজ্ঞায়িত করে: $P(x_t | x_{

2.2. নির্দেশিত পাসওয়ার্ড উৎপাদন

একটি মূল উদ্ভাবন হল নির্দেশিত পাসওয়ার্ড উৎপাদন। স্যাম্পলিং পদ্ধতিতে হস্তক্ষেপ করে (যেমন, শর্তাধীন সম্ভাব্যতা বা মাস্কিং ব্যবহার করে), PassGPT এমন পাসওয়ার্ড তৈরি করতে পারে যা নির্দিষ্ট শর্ত পূরণ করে, যেমন নির্দিষ্ট অক্ষর ধারণ করা, একটি ন্যূনতম দৈর্ঘ্য পূরণ করা, বা একটি বিশেষ প্যাটার্ন অনুসরণ করা (যেমন, "'A' দিয়ে শুরু হয়ে '9' দিয়ে শেষ")। এই সূক্ষ্ম, অক্ষর-স্তরের নিয়ন্ত্রণ পূর্ববর্তী GAN-ভিত্তিক পদ্ধতির তুলনায় একটি উল্লেখযোগ্য সুবিধা, যেগুলোতে এই সূক্ষ্ম-স্তরের পরিচালনা ক্ষমতা নেই।

উদাহরণ কেস (নন-কোড): একটি নিরাপত্তা দল পরীক্ষা করতে চায় যে তাদের "অবশ্যই একটি সংখ্যা এবং একটি বিশেষ অক্ষর থাকতে হবে" নীতিটি কার্যকর কিনা। নির্দেশিত উৎপাদন ব্যবহার করে, তারা PassGPT-কে নির্দেশ দিতে পারে এই সঠিক নীতি মেনে চলা হাজার হাজার পাসওয়ার্ডের নমুনা তৈরি করতে, তারপর বিশ্লেষণ করতে যে এই নীতি-সম্মত পাসওয়ার্ডগুলোর মধ্যে কতগুলো এখনও দুর্বল এবং সহজেই অনুমানযোগ্য, যা নীতির নিজস্ব সম্ভাব্য ত্রুটি প্রকাশ করে।

2.3. PassVQT উন্নয়ন

লেখকরা PassVQT (ভেক্টর কোয়ান্টাইজেশন সহ PassGPT) উপস্থাপন করেছেন, যা VQ-VAE থেকে কৌশল অন্তর্ভুক্ত করে একটি উন্নত সংস্করণ। এই পরিবর্তনটি উৎপাদিত পাসওয়ার্ডের জটিলতা (perplexity) বাড়ানোর লক্ষ্য রাখে, সম্ভাব্যভাবে সেগুলোকে আরও বৈচিত্র্যময় এবং অন্যান্য মডেল দ্বারা অনুমান করা কঠিন করে তোলে, যদিও বাস্তবতার সাথে বিনিময়-মূল্য সতর্কতার সাথে মূল্যায়নের প্রয়োজন।

3. পরীক্ষামূলক ফলাফল

3.1. পাসওয়ার্ড অনুমান কার্যকারিতা

গবেষণাপত্রটি রিপোর্ট করে যে PassGPT সর্বাধুনিক GAN-ভিত্তিক মডেলের তুলনায় ২০% বেশি পূর্বে অদেখা পাসওয়ার্ড অনুমান করে। কিছু পরীক্ষায়, এটি দুই গুণ বেশি অদেখা পাসওয়ার্ড অনুমান করে। এটি প্রশিক্ষণ ডেটা থেকে নতুন পাসওয়ার্ড সেটে সাধারণীকরণ করার একটি উচ্চতর ক্ষমতা প্রদর্শন করে। অনুক্রমিক উৎপাদন সম্ভবত GAN-এর এক-বারের উৎপাদনের চেয়ে আরও সূক্ষ্ম মার্কোভিয়ান নির্ভরতা ধরতে সক্ষম করে।

চার্ট বর্ণনা: একটি প্রকল্পিত বার চার্টে Y-অক্ষে "অনুমান করা অনন্য পাসওয়ার্ডের সংখ্যা" দেখাবে। "PassGPT" এর বারগুলি "GAN-ভিত্তিক মডেল (যেমন, PassGAN)" এবং "ঐতিহ্যগত মার্কোভ মডেল" এর বারগুলির চেয়ে উল্লেখযোগ্যভাবে লম্বা হবে, যা পাঠ্যে দাবি করা কার্যকারিতার পার্থক্য দৃশ্যত নিশ্চিত করবে।

3.2. সম্ভাব্যতা বণ্টন বিশ্লেষণ

GAN-এর তুলনায় এলএলএম-এর একটি প্রধান সুবিধা হল যেকোনো প্রদত্ত পাসওয়ার্ডের জন্য একটি স্পষ্ট সম্ভাব্যতা প্রদান: $P(\text{password}) = \prod_{t=1}^{T} P(x_t | x_{

4. প্রযুক্তিগত বিশ্লেষণ ও অন্তর্দৃষ্টি

মূল অন্তর্দৃষ্টি: গবেষণাপত্রের মৌলিক সাফল্য হল এই স্বীকৃতি যে পাসওয়ার্ড, তাদের সংক্ষিপ্ততা সত্ত্বেও, সীমাবদ্ধ, মানুষ-উৎপাদিত ভাষার একটি রূপ। এই পুনঃকাঠামোয়ন আধুনিক এলএলএম-এর বিশাল প্যাটার্ন-স্বীকৃতি শক্তি উন্মুক্ত করে, GAN-এর সীমাবদ্ধতার বাইরে চলে যায় যারা পাসওয়ার্ডকে একক, কাঠামো-অজ্ঞাত ব্লব হিসেবে বিবেচনা করে। এলএলএম-এর অনুক্রমিক, সম্ভাব্যতামূলক প্রকৃতি সমস্যার জন্য প্রায় নিখুঁতভাবে উপযুক্ত।

যুক্তিগত প্রবাহ: যুক্তিটি আকর্ষণীয়: ১) এলএলএম অনুক্রম মডেলিংয়ে (প্রাকৃতিক ভাষা) দক্ষ। ২) পাসওয়ার্ড হল অক্ষরের অনুক্রম যাতে অন্তর্নিহিত মানুষের পক্ষপাত রয়েছে। ৩) অতএব, এলএলএম পাসওয়ার্ড মডেলিংয়ে দক্ষ হওয়া উচিত। পরীক্ষাগুলো এই অনুমানকে দৃঢ়ভাবে বৈধতা দেয়, পূর্ববর্তী সর্বোচ্চ স্তরের (GAN) তুলনায় স্পষ্ট পরিমাণগত জয় দেখায়। নির্দেশিত উৎপাদনের পরিচয় হল অনুক্রমিক প্যারাডাইমের একটি যৌক্তিক এবং শক্তিশালী সম্প্রসারণ।

শক্তি ও ত্রুটি: শক্তি অস্বীকারযোগ্য—উচ্চতর কার্যকারিতা এবং নতুন কার্যকারিতা (নির্দেশিত উৎপাদন, স্পষ্ট সম্ভাব্যতা)। তবে, গবেষণাপত্রটি সমালোচনামূলক ত্রুটিগুলো কম গুরুত্ব দেয়। প্রথমত, প্রশিক্ষণ ডেটা নির্ভরতা: PassGPT-এর কার্যকারিতা সম্পূর্ণরূপে যে পাসওয়ার্ড লিকের উপর এটি প্রশিক্ষিত তার গুণমান এবং সাম্প্রতিকতার সাথে যুক্ত, একটি সীমাবদ্ধতা যা চিত্র অনুবাদের জন্য CycleGAN-এর মতো অনুরূপ জেনারেটিভ কাজে স্বীকৃত, যার জন্য জোড়া বা অজোড়া ডেটাসেট প্রয়োজন। MIT কম্পিউটার সায়েন্স অ্যান্ড আর্টিফিশিয়াল ইন্টেলিজেন্স ল্যাবরেটরির মতো প্রতিষ্ঠানের গবেষকদের দ্বারা উল্লিখিত হিসাবে, পুরানো বা অ-প্রতিনিধিত্বমূলক ডেটার সাথে মডেলের কার্যকারিতা হ্রাস পেতে পারে। দ্বিতীয়ত, একটি ট্রান্সফরমার মডেল প্রশিক্ষণ ও চালানোর গণনীয় ব্যয় একটি সাধারণ মার্কোভ মডেলের চেয়ে বহুগুণ বেশি, যা সম্পদ-সীমিত ক্র্যাকিং পরিস্থিতিতে ব্যবহারিক মোতায়েন সীমিত করতে পারে। তৃতীয়ত, যদিও নির্দেশিত উৎপাদন নতুন, আক্রমণকারী বনাম রক্ষাকারীদের জন্য এর বাস্তব-বিশ্বের উপযোগিতা আরও সূক্ষ্ম আলোচনার প্রয়োজন।

কার্যকরী অন্তর্দৃষ্টি: নিরাপত্তা পেশাদারদের জন্য, এটি একটি সতর্কবার্তা। পাসওয়ার্ড নীতি অবশ্যই সরল গঠন নিয়মের বাইরে বিবর্তিত হতে হবে। শক্তি অনুমানকারীদের অবশ্যই PassGPT-এর মতো সম্ভাব্যতামূলক মডেল একীভূত করতে হবে "শক্তিশালী-কিন্তু-পূর্বাভাসযোগ্য" পাসওয়ার্ড ধরার জন্য। গবেষকদের জন্য, পথটি স্পষ্ট: দক্ষতার জন্য হালকা-ওজনের ট্রান্সফরমার বৈকল্পিক (LLaMA স্থাপত্যের মতো উল্লিখিত) অন্বেষণ করুন, এবং এমন প্রতিরক্ষা প্রক্রিয়া অনুসন্ধান করুন যা এলএলএম-উৎপাদিত পাসওয়ার্ড আক্রমণ সনাক্ত বা বিঘ্নিত করতে পারে। AI-চালিত পাসওয়ার্ড ক্র্যাকিংয়ের যুগ GAN থেকে এলএলএম-এ সিদ্ধান্তমূলকভাবে স্থানান্তরিত হয়েছে।

5. ভবিষ্যতের প্রয়োগ ও দিকনির্দেশনা

  • সক্রিয় পাসওয়ার্ড শক্তি পরীক্ষা: সংস্থাগুলি নির্দেশিত PassGPT মডেল ব্যবহার করতে পারে, সাম্প্রতিক লিকের উপর প্রশিক্ষিত, তাদের ব্যবহারকারী পাসওয়ার্ড ডাটাবেস (হ্যাশড আকারে) সক্রিয়ভাবে নিরীক্ষণ করার জন্য উচ্চ-সম্ভাব্য মিল তৈরি করে, একটি লঙ্ঘন ঘটার আগেই ঝুঁকিপূর্ণ অ্যাকাউন্ট চিহ্নিত করে।
  • পরবর্তী প্রজন্মের শক্তি অনুমানকারী: PassGPT-এর সম্ভাব্যতা স্কোর `zxcvbn` বা `dropbox/zxcvbn`-এর মতো লাইব্রেরিতে একীভূত করে হাইব্রিড অনুমানকারী তৈরি করা যেতে পারে যা নিয়ম-ভিত্তিক জটিলতা এবং পরিসংখ্যানগত সম্ভাব্যতা উভয়ই বিবেচনা করে।
  • প্রতিরক্ষার জন্য প্রতিপক্ষীয় প্রশিক্ষণ: PassGPT ব্যবহার করা যেতে পারে বৃহৎ, বাস্তবসম্মত সিন্থেটিক পাসওয়ার্ড ডেটাসেট তৈরি করতে যাতে মেশিন লার্নিং-ভিত্তিক অনুপ্রবেশ সনাক্তকরণ সিস্টেম বা অস্বাভাবিকতা সনাক্তকারীকে আক্রমণের প্যাটার্ন চিনতে প্রশিক্ষণ দেওয়া যায়।
  • ক্রস-মডেল বিশ্লেষণ: ভবিষ্যতের কাজ PassGPT-এর সম্ভাব্যতা বণ্টন পাসওয়ার্ডে প্রয়োগ করা অন্যান্য জেনারেটিভ মডেল (যেমন, ডিফিউশন মডেল) থেকে প্রাপ্ত বণ্টনের সাথে তুলনা করতে পারে, অন্বেষণ করে কোন স্থাপত্য মানুষের পক্ষপাত সবচেয়ে ভালোভাবে ধরে।
  • নৈতিক ও প্রতিরক্ষামূলক ফোকাস: প্রাথমিক গবেষণা দিকনির্দেশনা প্রতিরক্ষামূলক প্রয়োগ-এর দিকে ঘুরানো উচিত, যেমন এমন কৌশল বিকাশ করা যা পাসওয়ার্ড ডেটাসেটকে "বিষাক্ত" করে বা দূষিত এলএলএম প্রশিক্ষণের জন্য কম উপযোগী করে তোলে, বা AI সহকারী তৈরি করা যা ব্যবহারকারীদের সত্যিই এলোমেলো, উচ্চ-এনট্রপি পাসওয়ার্ড তৈরি করতে সাহায্য করে।

6. তথ্যসূত্র

  1. Rando, J., Perez-Cruz, F., & Hitaj, B. (2023). PassGPT: Password Modeling and (Guided) Generation with Large Language Models. arXiv preprint arXiv:2306.01545.
  2. Goodfellow, I., et al. (2014). Generative Adversarial Nets. Advances in Neural Information Processing Systems.
  3. Radford, A., et al. (2019). Language Models are Unsupervised Multitask Learners. (GPT-2).
  4. Hitaj, B., et al. (2017). PassGAN: A Deep Learning Approach for Password Guessing. International Conference on Applied Cryptography and Network Security.
  5. Wheeler, D. L. (2016). zxcvbn: Low-Budget Password Strength Estimation. USENIX Security Symposium.
  6. Zhu, J.-Y., et al. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. IEEE International Conference on Computer Vision (ICCV). (CycleGAN).
  7. Touvron, H., et al. (2023). LLaMA: Open and Efficient Foundation Language Models. arXiv preprint arXiv:2302.13971.
  8. MIT Computer Science & Artificial Intelligence Laboratory (CSAIL). Research on Machine Learning Robustness and Data Dependence.