브라우저 기반 비밀번호 관리자의 비밀번호 생성, 저장 및 자동 완성 보안 평가

1. 서론

비밀번호 기반 인증은 잘 알려진 보안 문제점에도 불구하고 웹 인증의 지배적인 방법으로 남아 있습니다. 사용자는 여러 개의 강력한 비밀번호를 관리하는 데 인지적 부담을 느끼며, 이로 인해 비밀번호 재사용과 약한 비밀번호 생성이 발생합니다. 비밀번호 관리자는 비밀번호를 생성, 저장, 자동 완성하여 이러한 문제를 완화하겠다고 약속합니다. 그러나 그들의 보안성은 선행 연구에서 의문이 제기되어 왔습니다. 본 논문은 13개의 인기 있는 브라우저 기반 비밀번호 관리자를 대상으로 생성, 저장, 자동 완성의 전체 라이프사이클을 검토하는 업데이트된 종합 보안 평가를 제시합니다.

2. 방법론 및 범위

우리는 5개의 브라우저 확장 프로그램(예: LastPass, Dashlane), 6개의 브라우저 내장 관리자(예: Chrome, Firefox), 그리고 비교를 위한 2개의 데스크톱 클라이언트를 포함한 총 13개의 비밀번호 관리자를 평가했습니다. 평가 프레임워크는 1억 4,700만 개의 생성된 비밀번호 무작위성 분석, 저장 보안(암호화, 메타데이터 처리, 기본값) 평가, 그리고 클릭재킹 및 XSS와 같은 공격에 대한 자동 완성 취약점 테스트라는 세 가지 핵심 단계를 다루었습니다.

3. 비밀번호 생성 분석

이 섹션은 비밀번호 관리자의 비밀번호 생성 알고리즘에 대한 첫 번째 대규모 분석을 상세히 설명합니다.

3.1. 무작위성 평가 프레임워크

우리는 빈도 분석, 엔트로피 계산, 정의된 문자 집합(대문자, 소문자, 숫자, 기호)에 대한 균일 분포 테스트를 포함한 무작위성에 대한 통계적 테스트를 사용했습니다.

3.2. 문자 분포 결과

여러 관리자가 비무작위적인 문자 분포를 보였습니다. 예를 들어, 일부는 특정 문자 위치나 집합에 편향성을 보여 생성된 비밀번호의 유효 엔트로피를 이론적 기대치보다 낮추었습니다.

3.3. 추측 공격에 대한 취약성

중요한 발견은 생성된 비밀번호 중 일부—특히 10자 미만의 비밀번호—가 온라인 무차별 대입 공격에 취약하다는 점이었습니다. 현대 하드웨어 성능을 가정할 때, 18자 미만의 비밀번호는 오프라인 공격에 잠재적으로 취약한 것으로 밝혀졌습니다.

4. 비밀번호 저장 보안

Li 등의 선행 연구를 재현 및 확장하여 비밀번호가 로컬 및 클라우드에서 어떻게 암호화되고 저장되는지 평가했습니다.

4.1. 암호화 및 키 관리

대부분의 관리자가 강력한 암호화(예: AES-256)를 사용하지만, 키 유도 함수와 키 저장 메커니즘은 다양했으며, 일부 구현은 다른 것보다 취약했습니다.

4.2. 메타데이터 보호

확인된 치명적인 결함은 민감한 메타데이터(예: 웹사이트 URL, 사용자 이름)를 평문으로 또는 불충분한 보호 상태로 저장한다는 점이었습니다. 이는 비밀번호 자체가 암호화되어 있더라도 프라이버시 위험을 초래합니다.

4.3. 기본 구성 분석

여러 비밀번호 관리자가 자동 자동 완성 활성화 또는 브라우저 재시작 시 마스터 비밀번호를 요구하지 않는 등 불안전한 기본 설정을 가지고 있어 공격 표면을 증가시켰습니다.

5. 자동 완성 메커니즘 취약점

자동 완성은 편리하지만 상당한 공격 벡터를 도입합니다. 우리는 알려진 악용 유형에 대해 테스트했습니다.

5.1. 클릭재킹 및 UI 재구성

여러 관리자가 클릭재킹 공격에 취약한 것으로 나타났습니다. 이 공격에서는 악성 사이트가 합법적인 UI 버튼 위에 보이지 않는 요소를 겹쳐 사용자가 공격자가 제어하는 필드에서 자동 완성을 트리거하도록 속입니다.

5.2. 크로스 사이트 스크립팅(XSS) 위험

웹사이트에 XSS 취약점이 있는 경우, 주입된 스크립트가 잠재적으로 비밀번호 관리자의 DOM 요소와 상호작용하여 자격 증명을 유출할 수 있습니다. 이는 Stock과 Johns의 초기 연구에서 강조된 위험입니다.

5.3. 네트워크 주입 공격

동기화 또는 기능을 위해 클라우드 서비스와 통신하는 관리자는 악성 코드를 주입하거나 인증 토큰을 훔칠 수 있는 중간자 공격에 대한 취약성을 테스트했습니다.

6. 결과 및 비교 분석

전반적으로, 5년 전 평가에 비해 보안이 개선되었지만 중요한 문제는 지속되고 있습니다. 세 가지 범주(생성, 저장, 자동 완성) 모두에서 완벽한 단일 관리자는 없었습니다. 브라우저 내장 관리자는 종종 더 간단하고 안전한 자동 완성 로직을 가지고 있었지만 더 약한 생성 알고리즘을 가지고 있었습니다. 타사 확장 프로그램은 더 많은 기능을 제공했지만 더 큰 복잡성과 공격 표면을 도입했습니다. 우리는 보안에 민감한 사용자가 피해야 할 성능이 저조한 특정 관리자를 식별합니다.

평가된 관리자 수

생성 및 분석된 비밀번호 수

147M+

치명적 결함이 있는 관리자 수

7. 권고사항 및 향후 방향

사용자를 위해: 강력한 보안 실적을 가진 관리자를 선택하고, 사용 가능한 모든 보안 기능(2FA 등)을 활성화하며, 자동 완성 사용에 주의하십시오. 개발자를 위해: 비밀번호 생성을 위해 암호학적으로 안전한 난수 생성기(CSPRNG)를 구현하고, 모든 메타데이터를 암호화하며, 안전한 기본값(예: 항상 마스터 비밀번호 요구)을 채택하고, UI 조작에 대한 자동 완성을 강화하십시오. 연구자를 위해: 자동 완성의 사용성-보안 트레이드오프를 탐구하고, 표준화된 보안 평가 프레임워크를 개발하며, 미래 대비를 위한 포스트-퀀텀 암호화를 조사하십시오.

8. 원본 분석 및 전문가 논평

핵심 통찰: Oesch와 Ruoti의 연구는 냉정한 현실 점검을 제공합니다: 비밀번호 위기를 해결하기 위해 설계된 도구 자체가 취약점의 집합체라는 것입니다. 업계의 편의성과 기능 확장에 대한 초점은 여러 경우에 핵심 보안 약속을 직접적으로 훼손했습니다. 생성된 비밀번호가 약할 수 있다는 발견은 특히 치명적입니다—이는 비밀번호 관리자의 가치 제안의 핵심을 공격합니다.

논리적 흐름: 이 논문은 사용자 여정(생성, 저장 상태, 사용 중)을 따라 공격을 훌륭하게 구조화합니다. Microsoft의 STRIDE와 같은 프레임워크의 위협 모델링을 연상시키는 이 라이프사이클 접근 방식은 취약점이 고립된 것이 아니라 체계적임을 보여줍니다. 생성의 결함은 강력한 저장의 효과를 감소시키고, 자동 완성의 결함은 둘 다 무효화합니다. 이러한 상호 연결성은 특정 시점 감사에서 종종 간과됩니다.

강점과 결함: 이 연구의 강점은 그 포괄성과 과거 작업의 재현으로, 보안 진화에 대한 드문 종단적 관점을 제공한다는 점입니다. 분석을 위한 1억 4,700만 개의 생성된 비밀번호라는 방대한 코퍼스는 칭찬할 만합니다. 그러나 이 분석은 많은 보안 평가에 공통적인 결함을 가지고 있습니다: 대부분 블랙박스 기능 테스트라는 점입니다. 이는 무엇이 고장났는지는 식별하지만, 소프트웨어 공학적 관점에서 왜 그런지에 대한 통찰은 덜 제공합니다—이러한 결함이 급한 마감일, 오해된 사양, 또는 보안 검토 부족 때문이었을까요? 더욱이, NIST 디지털 신원 가이드라인을 참조하지만, 이러한 관리자가 FIPS 140-3 또는 IETF의 비밀번호 인증 키 교환(PAKE) 제안서에 명시된 보안 요구사항과 어떻게 일치(또는 불일치)하는지에 대한 심층 분석은 상당한 무게를 더했을 것입니다.

실행 가능한 통찰: 기업 보안 팀에게 이 논문은 승인된 비밀번호 관리자를 엄격하게 검토하라는 명령입니다. 브랜드 평판에 의존하는 것은 불충분합니다. 조달 체크리스트는 생성 무작위성(예: Dieharder 또는 NIST의 STS와 같은 표준화된 테스트 스위트 사용), 메타데이터 암호화, 공격 시뮬레이션 하의 자동 완성 동작에 대한 특정 테스트를 포함해야 합니다. 개발자에게 교훈은 단순성과 안전한 기본값을 우선시하는 것입니다. 가장 안전한 자동 완성 메커니즘은 가장 간단한 것일 수 있습니다: 캘리포니아 대학교 버클리의 명시적 동의 인터페이스 연구에서 제안한 것처럼 명시적이고 의식적인 사용자 행동을 요구하는 수동 "클릭-투-필" 방식입니다. 미래는 지능적이고 자동적인 채우기를 완벽하게 안전하게 만드는 데 있지 않고, 중요한 보안 결정에 인간을 개입시키는 최소한의 침습적이면서도 최대한 명시적인 사용자 상호작용을 설계하는 데 있습니다.

9. 기술적 세부사항 및 수학적 프레임워크

비밀번호 생성 무작위성 평가는 생성된 비밀번호의 섀넌 엔트로피 $H$ 계산에 의존했습니다:

$H = -\sum_{i=1}^{n} P(x_i) \log_2 P(x_i)$

여기서 $P(x_i)$는 주어진 위치에 문자 $x_i$가 나타날 확률입니다. $C$ 문자 집합에서 진정한 무작위 선택의 경우, 문자당 최대 엔트로피는 $\log_2(C)$입니다. 72자 집합(26 소문자 + 26 대문자 + 10 숫자 + 10 기호)의 경우, 최대 $H_{char} \approx 6.17$ 비트입니다. 따라서 10자 비밀번호는 이론적으로 최대 ~61.7 비트의 엔트로피를 가집니다.

연구에 따르면 일부 관리자 알고리즘의 편향으로 인해 유효 엔트로피가 감소했습니다. 오프라인 공격에 대한 취약성은 추정된 크래킹 속도 $R$(초당 해시 수)와 비밀번호 공간 $N$을 사용하여 평가되었습니다:

$\text{크래킹 시간} \approx \frac{N}{2 \times R}$

고성능 GPU 클러스터 범위 내인 초당 $10^{10}$ 해시의 높은 속도를 가정할 때, ~65 비트 미만의 엔트로피($N = 2^{65}$)를 가진 비밀번호는 동기가 부여된 공격자에게 실행 가능한 시간 내에 크래킹될 수 있습니다.

10. 실험 결과 및 데이터 시각화

주요 차트 1: 문자 분포 편향. 여러 비밀번호 관리자에 걸쳐 문자 유형(대문자, 소문자, 숫자, 기호)의 관찰된 빈도 대 기대 빈도를 비교하는 막대 그래프. 여러 관리자가 기대되는 균일 분포에서 통계적으로 유의미한 편차(p < 0.01)를 보였으며, 특정 위치에서 숫자가 과도하게 나타났습니다.

주요 차트 2: 엔트로피 대 비밀번호 길이. 구성된 다양한 비밀번호 길이(8, 12, 16, 20자)에 대한 관리자별 측정된 엔트로피를 보여주는 산점도. 이 그래프는 대부분의 관리자가 긴 비밀번호에 대해 이론적 엔트로피 선에 접근하지만, 여러 관리자가 짧은 길이(8-12자)에서는 선 아래에 군집하여 더 약한 무작위성을 나타냄을 보여줄 것입니다.

주요 차트 3: 자동 완성 취약점 매트릭스. Y축에 관리자, X축에 취약점 유형(클릭재킹, XSS 유출, 네트워크 주입)을 둔 히트맵. 셀은 녹색(취약하지 않음), 노란색(부분적/가변적 취약), 빨간색(취약)으로 색칠됩니다. 이 시각화는 자동 완성 공격 표면에서 어떤 관리자가 가장 위험한지 명확하게 보여줍니다.

11. 분석 프레임워크: 사례 연구 예시

사례: "관리자 X"의 자동 완성 보안 평가.

1단계 - 기능 매핑: 관리자 X가 자동 완성을 어떻게 트리거하는지 문서화: 자동으로 채우나요? 드롭다운을 표시하나요? 어떤 DOM 속성(id, name, class, placeholder)에 의존하나요?

2단계 - 위협 모델링: STRIDE 모델 적용.

스푸핑: 가짜 로그인 양식이 관리자를 속일 수 있나요? (`id="password"` 변형으로 테스트).
변조: JavaScript가 제출 전에 채워진 데이터를 수정할 수 있나요?
부인: 관리자가 자동 완성 이벤트를 기록하나요?
정보 유출: 숨겨진 iframe 또는 제작된 CSS(opacity:0.001)가 보이지 않는 필드에 채우게 하여 유출시킬 수 있나요?
서비스 거부: 악성 사이트가 자동 완성 기능을 잠글 수 있나요?
권한 상승: 자동 완성이 브라우저 크롬 페이지에서 작동하나요? (작동해서는 안 됨).

3단계 - 테스트 실행: 각 위협 벡터를 체계적으로 시도하는 테스트 하네스 웹페이지 생성. 클릭재킹의 경우 겹치는 투명 요소 생성. XSS의 경우 채워진 필드의 `value` 속성을 읽는 스크립트 시뮬레이션.

4단계 - 분석 및 점수화: 가능성과 영향에 기반하여 각 취약점 평가(예: DREAD 점수화 사용). 집계 점수가 관리자 X의 전체 자동 완성 보안 등급을 결정합니다.

이 구조화된 접근 방식은 임시 테스트를 넘어 포괄적인 커버리지를 보장합니다.

12. 향후 적용 및 연구 방향

1. WebAuthn/패스키와의 통합: 미래는 비밀번호 없는 것입니다. 비밀번호 관리자의 다음 진화는 패스키(W3C 웹 인증 API 기반)의 주요 브로커가 되는 것입니다. FIDO 얼라이언스가 강조한 과제인 기기 간 패스키 개인 키의 안전한 동기화 및 복구에 대한 연구가 필요합니다.

2. 상황 인식, 위험 기반 자동 완성: 이진 채우기/채우지 않기 논리 대신, 향후 관리자는 머신 러닝을 사용하여 페이지 합법성(도메인 연령, SSL 인증서, 평판 점수 확인)과 사용자 상황(일반적인 로그인 시간, 기기)을 평가하여 자동 완성 동작을 조정하고, 고위험 시나리오에서는 추가 인증을 요구할 수 있습니다.

3. 형식 검증 및 보안 하드웨어: 난수 생성기와 핵심 암호화/복호화 루틴과 같은 중요한 구성 요소는 Coq 또는 Tamarin Prover와 같은 도구를 사용하여 형식적으로 검증될 수 있습니다. 고가치 대상에 대한 보안을 높이기 위해 신뢰할 수 있는 플랫폼 모듈(TPM) 또는 보안 엔클레이브와의 통합이 가능합니다.

4. 분산형 및 사용자 중심 아키텍처: 중앙 집중식 클라우드 금고에서 분산형 프로토콜(예: 안전한 다자간 계산 또는 개인 서버 기반)로 이동하면 대규모 공급자 침해 위험을 완화할 수 있습니다. 이는 개인 데이터 포드에 대한 더 넓은 "Solid" 프로젝트 비전과 일치합니다.

13. 참고문헌

Oesch, S., & Ruoti, S. (2020). That Was Then, This Is Now: A Security Evaluation of Password Generation, Storage, and Autofill in Browser-Based Password Managers. USENIX Security Symposium.
Li, Z., He, W., Akhawe, D., & Song, D. (2014). The Emperor’s New Password Manager: Security Analysis of Web-based Password Managers. IEEE Symposium on Security and Privacy.
Stock, B., & Johns, M. (2016). Protecting the Intranet Against "JavaScript Malware" and Related Attacks. IEEE EuroS&P.
National Institute of Standards and Technology (NIST). (2017). Digital Identity Guidelines (SP 800-63B).
FIDO Alliance. (2022). FIDO2: WebAuthn & CTAP Specifications. https://fidoalliance.org/fido2/
Grassi, P., et al. (2017). NIST Special Publication 800-63B: Digital Identity Guidelines - Authentication and Lifecycle Management.
Silver, D., Jana, S., Boneh, D., Chen, E., & Jackson, C. (2014). Password Managers: Attacks and Defenses. USENIX Security Symposium.
Shannon, C. E. (1948). A Mathematical Theory of Communication. The Bell System Technical Journal.