Người Việt Nam chọn mật khẩu như thế nào?

LTS: tác giả bài viết là Dương Ngọc Thái, kỹ sư an ninh mạng đang làm việc ở Mỹ. Anh Thái là một chuyên gia nghiên cứu về an ninh phần mềm. Các phát hiện của Thái có ảnh hưởng sâu rộng đến sự an toàn của Internet, được trích dẫn trong nhiều bài báo khoa học, được đưa vào giảng dạy ở các đại học danh tiếng và đăng tải trên các tờ báo lớn trên thế giới. Anh cũng là tác giả 2 bức thư ngỏ gửi quốc hội VN về luận an ninh mạng. Bài viết đăng trên blog cá nhân của anh. Nếu bạn đặt mật khẩu theo cách trong bài, thì đã đế lúc cần phải thay đổi. Tôi đăng lại toàn văn

Trong số 160 triệu tài khoản VNG bị lộ có gần 75 triệu tài khoản là của những người có thể xác định được chính xác ngoài đời. Gắn với 75 triệu tài khoản này là hơn 22 triệu mật khẩu (vì ý tưởng lớn gặp nhau, người ta hay chọn mật khẩu giống nhau — các bạn có biết là có website hẹn hò chuyên ghép đôi những người chọn cùng mật khẩu?)

Các mật khẩu này được mã hóa với một thuật toán rất dễ bị bẻ gãy (dành cho dân trong nghề: thuật toán MD5, một round duy nhất, không salt gì cả). Tôi tin đây là vụ lộ mật khẩu của người Việt Nam lớn nhất từ xưa đến nay và việc bẻ khóa các mật khẩu này sẽ cung cấp một nguồn thông tin hiếm hoi về cách mà người Việt Nam chọn những bí mật riêng tư nhất của mình. Việc phân tích các mật khẩu sẽ giúp chúng ta biết được mật khẩu nào yếu và từ đó chọn cho mình mật khẩu tốt nhất. Và đương nhiên ai mà không muốn biết thằng Tèo nhà hàng xóm chọn mật khẩu như thế nào?

Tôi sử dụng phần mềm hashcat, với một vài tinh chỉnh nhỏ, không đáng kể. Tôi sử dụng chiếc laptop cùi bắp Macbook Pro đời 2015. Nói chung là tôi không có làm gì đặc biệt, những gì tôi làm ai cũng có thể làm được. Tôi bắt đầu bẻ khóa vào trưa thứ bảy và đến chiều chủ nhật thì dừng lại vì laptop nóng quá tôi sợ nó chết :-). Tôi tìm được hơn 37% mật khẩu của 75 triệu tài khoản kể trên.

Tôi thấy người Việt chọn mật khẩu rất tếu. Có bác nào nhà nuôi lợn nên chọn mật khẩu là lonlonlonlonlonlonlonlonlonlon. Cũng có bác nuôi cú đặt mật khẩu là cucucucucucucucucucu. Đây chắc hẳn là con cú dài nhất nước ta.

Một vài thống kê vui khác:

* anhyeuem là mật khẩu phổ biến thứ 5, có đến hơn 900.000 người chọn mật khẩu này, trong khi chỉ có hơn 90.000 người chọn emyeuanh. Chứng tỏ đàn ông yêu nhiều hơn đàn bà.

* Rất nhiều đàn ông nghĩ họ đẹp trai: có đến 95.749 tài khoản sử dụng từ “deptrai”. Chỉ có vài phụ nữ nghĩ họ đẹp gái: chỉ có 1517 tài khoản sử dụng từ “depgai”.

* Nhưng rất nhiều người nghĩ họ xinh (xinh mà không đẹp nghĩa là sao??): có 106014 tài khoản có từ “xinh” trong mật khẩu (và tôi đã loại trừ các từ như xinhayquenanh).

* Dữ liệu cho thấy có nhiều người dùng ở Sài Gòn hơn các Hà Nội, nhưng chỉ có 10.000 người chọn Sài Gòn làm bí mật, so với 20.000 chọn Hà Nội.

* Có đến 108 “boyhanoi”, nhưng lại không có em “gaiphoco” nào cả. Chỉ có 396 “chandai” nhưng lại có đến 32726 “daigia”.

* Đang đói bụng nên tôi thử tìm xem… Chỉ có 29 người thích ăn nem nướng, nhưng có đến 327 người thích bún chả.

* Có 23 người thích phở tái, nhưng chỉ có 1 người thích phở chín! Số người thích phở bò là 380, gấp đôi số người thích phở gà!

* Số người thích “bunrieu” là 184, chỉ là con số nhỏ so với 1934 người thích “hutieu”.

Ai nghĩ ra cái gì cần tìm thì báo lại cho tôi biết nhé ;-).

Comment của bạn

Website này sử dụng Akismet để hạn chế spam. Tìm hiểu bình luận của bạn được duyệt như thế nào.