Trước những tiêu cực trong thi cử xảy ra ở vài tỉnh phía Bắc, đã có không ít ý kiến được đưa ra nhằm tìm giải pháp triệt để cho hiện tượng gian lận này. Một số chuyên gia trong ngành công nghệ thông tin cho rằng công nghệ blockchain chống gian lận thi cử sẽ hạn chế được vấn đề tiêu cực trong thi cử ở Việt Nam, nhờ đặc tính “dữ liệu được đóng thành các khối (block), được niêm phong bằng việc mã hóa với tem thời gian đồng thời dữ liệu nằm phân tán, giảm phát sinh tiêu cực”. Điều này có khả thi không? Những phân tích sau đây của TS Nguyễn Ngọc Thành và TS Đặng Phạm Thiên Duy, giảng viên khoa Khoa học và Công nghệ Đại học RMIT Việt Nam sẽ phần nào cho độc giả câu trả lời.
TS Nguyễn Ngọc Thành
Blockchain có khả năng chống sửa đổi dữ liệu nên có thể dùng để tránh gian lận trong thi cử. Điều này thoạt nghe có vẻ hợp lý nhưng đi sâu, có nhiều thách thức về mặt công nghệ, quản lý, pháp lý để sử dụng blockchain tại Việt Nam.
Thứ nhất, công nghệ này không phải là miễn phí. Việc sử dụng blockchain đòi hỏi mỗi bài thi sau khi số hóa phải được lưu vào một khối trong blockchain. Và mỗi lần ghi dữ liệu như vậy đều mất phí. Mỗi giao dịch trên Bitcoin hiện có phí là 0,2 USD. Một blockchain khác là Ethereum thì rẻ hơn khoảng 0,01 USD. Nếu tính mỗi thí sinh làm khoảng 5 bài thi, thì số giao dịch cần cập nhật lên hệ thống là một con số khổng lồ. Số tiền phải trả có thể là cả 1 triệu USD nếu dùng Bitcoin.
Thứ hai, blockchain bị giới hạn về mặt dung lượng lưu trữ. Kích thước của mỗi khối được duy trì ở mức rất thấp (khoảng 1MB trong Bitcoin), để tránh bùng nổ dữ liệu cần lưu trữ. Vì vậy, bài thi trên giấy sau khi scan thành file ảnh có kích thước đến vài MB, không thể ghi vào blockchain. Nếu có lưu thì chỉ có thể là file text đã được chuyển đổi từ phần mềm nhận dạng ký tự (OCR) hoặc “mã băm” (hash code – một chuỗi ký tự do các thuật toán mã hóa thông tin tạo ra) của file ảnh hoặc file text bài thi.
Thứ ba, blockchain còn bị giới hạn về tốc độ xử lý. Xét trên hệ thống Bitcoin, thì thời gian trung bình để tính toán “mã băm” cho một khối là khoảng 10 phút và tốc độ giao dịch trung bình là 7 giao dịch/giây. Như vậy, cần đến 8 ngày để cập nhật 5 triệu bài thi trong điều kiện là hệ thống blockchain này được dùng độc quyền cho việc xử lý dữ liệu bài thi tại Việt Nam và ngưng các giao dịch khác trên thế giới!
Ba đặc tính cơ bản của blockchain là minh bạch, an toàn và chống sửa đổi dữ liệu trái phép. Tính minh bạch được đảm bảo vì mọi người đều có thể đọc được lịch sử giao dịch. Tính an toàn được đảm bảo nhờ hệ thống hàng ngàn máy lưu trữ cùng một bản dữ liệu, nếu máy này bị sập thì máy khác vẫn hoạt động. Và cuối cùng, blockchain làm cho quá trình sửa đổi dữ liệu quá khó khăn để ngăn ngừa những ai có ý đồ gian lận.
Nhưng blockchain chỉ thích hợp cho những ứng dụng liên quan tới giao dịch như chuyển tiền, chuyển nhượng bất động sản, hợp đồng mua bán. Blockchain mạnh trong việc ngăn ngừa những gian lận (sửa đổi dữ liệu trái phép) sau thời điểm phát sinh giao dịch chứ không ngăn chặn được những ý định gian lận từ trước khi có giao dịch. Chẳng hạn như việc lưu hồ sơ bệnh án lên blockchain sẽ chống được việc sửa đổi dữ liệu trong trường hợp bệnh nhân có khiếu kiện…
Blockchain có thể không phải là giải pháp tốt nhất chống gian lận thi cử nhưng khả năng ứng dụng của nó trong những lĩnh vực liên quan tới giao dịch là rất lớn. Hiện nay cả thế giới và Việt Nam đang khát nhân lực trong lĩnh vực blockchain. Một lập trình viên blockchain một năm kinh nghiệm có thể nhận mức lương tới 2.000 USD/tháng. Như vậy để thấy rằng ngành công nghệ thông tin luôn đem lại các cơ hội nghề nghiệp rất triển vọng cho tuổi trẻ Việt Nam.
TS Đặng Phạm Thiên Duy
Việc sử dụng blockchain trong chống gian lận thi cử cũng khó thành hiện thực vì nó không tương thích với Luật An ninh mạng Việt Nam. Luật An ninh mạng quy định tất cả các dữ liệu của người dùng Việt Nam phải được lưu trữ trên máy chủ đặt tại nước ta. Nguyên tắc nền tảng của blockchain lại là phân tán dữ liệu. Do đó, mạng lưới này hoạt động dựa trên quy luật được thiết lập tự động bằng phần mềm và không một tổ chức hoặc quốc gia nào có thể chi phối. Nếu sử dụng blockchain dữ liệu của công dân Việt Nam bắt buộc phải được lưu trữ tại các quốc gia khác trong mạng blockchain.
Trong trường hợp Việt Nam muốn xây dựng một mạng blockchain riêng thì sẽ cần một chi phí rất lớn. Nhưng nguyên lý nền tảng của blockchain là phi tập trung hóa dữ liệu nhằm mục đích tối hậu là không cho phép ai có quyền kiểm soát mạng lưới để thay đổi cập nhật trái phép dữ liệu. Nếu Việt Nam có một mạng blockchain riêng thì nó tạo thành một trung tâm dữ liệu tập trung. Ý tưởng này dường như không khác gì hệ thống cơ sở dữ liệu tập trung mà Bộ Giáo dục cũng như các ngân hàng và các cơ quan khác tại Việt Nam đang sử dụng.
Ở Hà Giang, dữ liệu quét thô được gửi về Bộ Giáo dục là dữ liệu chưa bị can thiệp. Nhưng khi chuyển sang khâu chấm bài, thì hơn ngàn file bài làm của thí sinh đã bị sửa đổi. Như vậy, ngay cả việc dùng blockchain để ghi dữ liệu bài thi ở cả hai bước vẫn không phát hiện được gian lận. Còn ở Sơn La, bài thi được sửa chữa ngay cả trước khi được đưa vào máy quét. Nên dữ liệu có được ghi trên blockchain hay không, việc gian lận vẫn có thể diễn ra.
Cũng có một số ý kiến cho rằng, nếu thí sinh được thi trên máy, dữ liệu được ghi trực tiếp lên blockchain thay vì phải đi qua nhiều khâu như hiện nay sẽ ngăn chặn được gian lận. Việc này là hoàn toàn “bất khả thi” trong hoàn cảnh hiện tại. Việc chuẩn bị hơn 1 triệu máy tính cùng một lúc để đáp ứng được yêu cầu thi tốt nghiệp THPT là vô cùng khó. Máy tính có được kết nối mạng hay không? Làm sao kiểm soát được các phần mềm cài sẵn trong máy (TeamViewer, Remote Desktop) khi có đến hơn 1 triệu máy tham gia kỳ thi? Và quan trọng nhất là, việc sử dụng blockchain lại gắn với một hệ thống tập trung hóa dữ liệu như đề thi và đáp án. Như vậy, sức mạnh phân tán của blockchain đã bị vô hiệu hóa bởi hệ thống tập trung này.
Chúng ta không sử dụng blockchain mà chỉ dùng cơ chế chống sửa đổi, đó là cơ chế “mã băm” (hashing) đã được sử dụng rộng rãi trong ngành công nghệ thông tin. Đây được xem là một phát minh vĩ đại của toán học. Với một file đầu vào bất kể dung lượng và nội dung nào, hàm băm sẽ cho ra mỗi chuỗi ký tự có độ dài cố định dài, khoảng 32-128 ký tự (tùy hàm băm). Nếu dữ liệu đầu vào bị thay đổi, thậm chí chỉ sửa một dấu phẩy, thì lập tức tạo mã băm mới khác xa so với mã băm gốc.
Đặc tính tuyệt vời này đã được sử dụng để mã hóa mật khẩu và đặc biệt là dùng để ngăn chặn sửa đổi file gốc. Như vậy, nếu dữ liệu bài thi này phải ghi lên blockchain để chống sửa đổi, ta có thể dùng mã băm để niêm phong bài thi. Nhưng đồng thời, chúng ta phải “niêm phong” mã băm bằng cách dùng cặp khóa phi đối xứng (public/private key) để niêm phong mã băm. Khóa bí mật (private key) sẽ được lưu trong USB và cần phải được bảo vệ nghiêm ngặt, thông thường thông qua xác thực đa phương thức (mã PIN và OTP – mật khẩu sử dụng một lần). Cơ chế này thực chất đã được sử dụng phổ biến ở Việt Nam thông qua ứng dụng như chữ ký điện tử (ở hải quan và thuế) hoặc trong giao dịch ngân hàng trực tuyến.
Ngoài ra, chúng ta cũng có thể sửa lỗi ngay trong quy trình trình chấm thi và công bố kết quả thi. Quy trình hiện nay có lỗ hổng lớn mà trong các cuộc hội thảo gần đây đã được chỉ ra, đó là dữ liệu bài thi được chuyển về Bộ Giáo dục nhưng việc chấm thi lại được tổ chức ở địa phương. Lẽ ra, nếu dữ liệu thi trắc nghiệm đã được quét và chuyển về Bộ thì việc chấm thi nên được thực hiện ở Bộ. Tất nhiên, điều này cũng không hoàn toàn ngăn chặn được gian lận trong công tác chấm bài.