Ứng dụng học tập liên kết trong chấm điểm tín dụng và an ninh tài chính tại Việt Nam

Công nghệ & ngân hàng số 08:08 | 28/03/2026

Bài viết phân tích giải pháp Học tập liên kết như một hạ tầng công nghệ thiết yếu giúp ngành Ngân hàng tối ưu hóa việc chấm điểm tín dụng và phát hiện gian lận, đồng thời đảm bảo tuân thủ nghiêm ngặt Luật Bảo vệ dữ liệu cá nhân năm 2025 và cơ chế thử nghiệm có kiểm soát tại Việt Nam.

Tóm tắt: Trong bối cảnh nền kinh tế số Việt Nam bước vào giai đoạn tăng trưởng bùng nổ, ngành Ngân hàng đang đứng trước một ngã rẽ mang tính lịch sử. Một mặt, sự phát triển của trí tuệ nhân tạo (AI) và dữ liệu lớn (Big Data) mở ra những cơ hội chưa từng có để cá nhân hóa dịch vụ tài chính và mở rộng khả năng tiếp cận tín dụng. Mặt khác, những rủi ro về an ninh mạng ngày càng tinh vi, đi kèm với đó là sự siết chặt của hành lang pháp lý về bảo vệ dữ liệu cá nhân. Bài viết này cung cấp một cái nhìn toàn cảnh, sâu sắc và thực tiễn về Học tập liên kết (Federated Learning - FL) - một công nghệ được xem là chìa khóa để giải quyết bài toán cân bằng giữa khai thác dữ liệu và bảo mật thông tin. Bài viết tập trung phân tích FL dưới góc độ chiến lược kinh doanh, lợi ích thực tiễn và sự tương thích với bối cảnh pháp lý đặc thù của Việt Nam, đặc biệt là dưới tác động của Luật Bảo vệ dữ liệu cá nhân năm 2025 và Nghị định số 94/2025/NĐ-CP ngày 29/4/2025 quy định về Cơ chế thử nghiệm có kiểm soát trong lĩnh vực ngân hàng. Thông qua việc phân tích dữ liệu thị trường, các xu hướng công nghệ tại các ngân hàng thương mại (NHTM) và tình hình gian lận tài chính thực tế, bài viết khẳng định: FL không chỉ là một xu hướng công nghệ nhất thời, mà là hạ tầng thiết yếu cho một hệ sinh thái tài chính bền vững trong thập kỷ tới.

Từ khóa: FL, chấm điểm tín dụng, phát hiện gian lận, bảo vệ dữ liệu cá nhân.

APPLICATION OF FEDERATED LEARNING
IN CREDIT SCORING AND FINANCIAL SECURITY IN VIETNAM

Abstract: As Vietnam’s digital economy enters a phase of explosive growth, the banking sector is standing at a historic crossroads. On the one hand, the rapid advancement of Artificial Intelligence (AI) and Big Data is creating unprecedented opportunities to personalize financial services and expand access to credit. On the other hand, increasingly sophisticated cybersecurity threats are emerging, accompanied by a tightening legal framework on personal data protection. This article provides a comprehensive, in-depth, and practical overview of Federated Learning (FL) - a technology considered key to balancing data utilization with information security. It focuses on analyzing FL from the perspectives of business strategy, practical benefits, and its compatibility with Vietnam’s specific legal context, particularly under the impact of the 2025 law on personal data protection and Decree No. 94/2025/ND-CP dated April 29, 2025, on the controlled regulatory sandbox mechanism in the banking sector. Through an analysis of market data, technological trends among commercial banks, and the current landscape of financial fraud, the article affirms that FL is not merely a passing technological trend, but rather an essential infrastructure for building a sustainable financial ecosystem in the coming decade.

Keywords: FL, credit scoring, fraud detection, personal data protection.

1. Bối cảnh chuyển đổi số và pháp lý tại Việt Nam năm 2025

Đến tháng 12/2025, hệ thống tài chính Việt Nam đã ghi nhận sự chuyển dịch căn bản về hạ tầng dữ liệu. Các NHTM như NHTM cổ phần Ngoại thương Việt Nam (Vietcombank), NHTM cổ phần Kỹ thương Việt Nam (Techcombank), NHTM cổ phần Việt Nam Thịnh Vượng (VPBank) đã cơ bản hoàn tất việc xây dựng kho dữ liệu và nền tảng điện toán đám mây (Techcombank, 2024; Nguyen Thi Thu Trang, 2025). Việc tích hợp AI và học máy (ML) vào quy trình vận hành đã trở thành tiêu chuẩn ngành, cho phép tự động hóa quy trình phê duyệt tín dụng và cá nhân hóa trải nghiệm khách hàng ở quy mô lớn.

Tuy nhiên, năng lực khai thác dữ liệu liên tổ chức (cross-organizational data mining) đang gặp rào cản lớn từ hành lang pháp lý mới. Luật Bảo vệ dữ liệu cá nhân năm 2025 đặt ra các yêu cầu nghiêm ngặt về chủ quyền dữ liệu và sự đồng thuận của chủ thể dữ liệu. Các mô hình chia sẻ dữ liệu tập trung truyền thống (centralized data sharing) tiềm ẩn rủi ro pháp lý cao và nguy cơ vi phạm nguyên tắc "tối thiểu hóa dữ liệu". Trong mô hình học máy tập trung, việc thiếu hụt cái nhìn toàn cảnh về khách hàng dẫn đến hai hệ quả tiêu cực:

(i) Rủi ro tín dụng tiềm ẩn: Các mô hình chấm điểm tín dụng đơn lẻ không thể đánh giá chính xác năng lực tài chính của nhóm khách hàng ít lịch sử tín dụng ("thin-file") như doanh nghiệp nhỏ và vừa, Gen Z... dẫn đến bỏ sót cơ hội kinh doanh hoặc định giá rủi ro sai lệch; và (ii) Lỗ hổng an ninh hệ thống: Hệ thống phát hiện gian lận cục bộ không thể nhận diện các cuộc tấn công phức tạp, phân tán như "vay chồng vay" (loan stacking) hay rửa tiền qua mạng lưới đa ngân hàng, vốn đòi hỏi sự đối chiếu dữ liệu liên tổ chức. Dữ liệu thống kê 11 tháng đầu năm 2025 cho thấy thiệt hại do gian lận tài chính trực tuyến là hơn 6.000 tỉ đồng với những kiểu tấn công kể trên (Tran Binh, 2026).

Mặt khác, Nghị định số 94/2025/NĐ-CP đã tạo ra khung pháp lý cho phép thử nghiệm các giải pháp công nghệ mới như chấm điểm tín dụng và chia sẻ dữ liệu qua giao diện lập trình ứng dụng mở (Open API) (Phong Anh Hoang, 2025). Vậy làm thế nào để giải quyết mâu thuẫn giữa nhu cầu cấp thiết phải hợp tác khai thác dữ liệu (để tuân thủ Nghị định số 94/2025/NĐ-CP và tối ưu kinh doanh) và yêu cầu bắt buộc phải bảo mật tuyệt đối dữ liệu khách hàng (để tuân thủ Luật Bảo vệ dữ liệu cá nhân năm 2025). Các giải pháp kỹ thuật hiện tại như ẩn danh hóa hay giả danh hóa đã được chứng minh là không đủ an toàn trước các kỹ thuật tấn công tái định danh hiện đại (Sondeck, 2025).

Bài viết này đề xuất cách tiếp cận FL như một lời giải công nghệ cho bài toán nêu trên. Khác với các tiếp cận truyền thống, FL cho phép huấn luyện các mô hình AI cộng tác mà không cần di chuyển dữ liệu ra khỏi phạm vi quản lý của từng ngân hàng.

Nghiên cứu tập trung giải quyết ba vấn đề cốt lõi:

(i) Kiến trúc: Xây dựng khung tham chiếu kỹ thuật cho hệ sinh thái FL trong ngân hàng Việt Nam, phân định rõ vai trò của FL theo chiều ngang (Horizontal FL - HFL) trong phát hiện gian lận liên ngân hàng và FL theo chiều dọc (Vertical FL - VFL) trong chấm điểm tín dụng đa nguồn.

(ii) Hiệu quả: Chứng minh tính ưu việt của FL trong việc phát hiện sớm các mẫu hình gian lận mới (như Deepfake, Loan Stacking) dựa trên dữ liệu tổng hợp từ toàn mạng lưới, điều mà một ngân hàng đơn lẻ không thể thực hiện.

(iii) Tuân thủ: Phân tích sự tương thích của mô hình FL với Luật Bảo vệ dữ liệu cá nhân năm 2025, chứng minh cơ chế "trao đổi tri thức, không trao đổi dữ liệu" là chìa khóa để vượt qua rào cản pháp lý.

2. Cơ sở lý luận về FL

Mô hình ML truyền thống (Centralized Machine Learning) hoạt động dựa trên nguyên tắc tập trung tất cả dữ liệu về một bộ dữ liệu chung (dataset) để huấn luyện mô hình. Cách tiếp cận này, dù hiệu quả về mặt kỹ thuật trong quá khứ, đang trở nên lỗi thời và nhiều rủi ro trong bối cảnh mới, đặc biệt do yêu cầu dữ liệu phải rời khỏi nơi lưu trữ an toàn ban đầu.

Trước thách thức đó, FL là phương pháp huấn luyện mô hình ML phân tán (Decentralized Machine Learning), cho phép các bên tham gia hợp tác huấn luyện một mô hình toàn cục mà không cần chia sẻ dữ liệu thô (Hình 1). Cụ thể:

Ứng dụng học tập liên kết trong chấm điểm tín dụng và an ninh tài chính tại Việt Nam

Thay vì gửi dữ liệu thô của khách hàng đi, trung tâm điều phối sẽ gửi một "mô hình sơ khai" đến từng ngân hàng thành viên. Tại đây, mô hình sẽ tự "học" các đặc điểm từ dữ liệu nội bộ (như hành vi chi tiêu, lịch sử trả nợ) ngay trên hạ tầng bảo mật của ngân hàng đó. Thông tin được gửi ra ngoài không phải là dữ liệu cá nhân như tên, số tài khoản, số dư, mà là các tham số mô hình (parameters/weights) - những con số đại diện cho các "bài học" mà mô hình đã rút ra, ví dụ như xu hướng gian lận mới, quy luật

tiêu dùng. Tiếp đó, các tham số này được tập hợp và trộn lại tại máy chủ trung tâm để tạo ra một "trí tuệ tổng hợp" thông minh hơn, sau đó được chia sẻ lại cho tất cả các bên tham gia.

Dựa trên nguyên lý trên, FL cung cấp hai kiến trúc kỹ thuật để giải quyết hai bài toán nghiệp vụ mang tính cấp thiết trong bối cảnh hiện nay: Kiến trúc HFL và kiến trúc VFL (Hình 2).

2.1. Kiến trúc HFL

HFL cung cấp một cơ chế hợp tác mô hình giữa các ngân hàng có cấu trúc đặc trưng dữ liệu tương đồng (cùng không gian đặc trưng nhưng khác tập khách hàng), cho phép các bên cùng huấn luyện một mô hình phát hiện gian lận chung mà không cần chia sẻ dữ liệu giao dịch thô. Trong thiết lập này, mỗi ngân hàng (chẳng hạn, các thành viên trong một mạng lưới thanh toán hoặc hệ thống chuyển mạch thẻ) tiến hành huấn luyện mô hình cục bộ trên dữ liệu giao dịch của mình. Khi một ngân hàng phát hiện và học được một mẫu hành vi gian lận mới, ví dụ như mô hình chiếm đoạt qua mã QR giả mạo, các tham số mô hình sau khi cập nhật sẽ được gửi dưới dạng bản cập nhật đã mã hóa để tổng hợp với các mô hình khác, hình thành mô hình toàn cục phản ánh kiến thức chung về gian lận mới nổi (P. Takkalapally, 2025).

Nhờ cơ chế này, các ngân hàng khác trong mạng lưới, dù chưa từng quan sát kiểu tấn công tương ứng, vẫn có thể nâng cao năng lực phát hiện ngay lập tức thông qua mô hình toàn cục đã được cung cấp tri thức mới, qua đó làm giảm đáng kể độ trễ phát hiện, tỉ lệ bỏ sót gian lận và phụ thuộc vào cảnh báo thủ công. Cách tiếp cận HFL do vậy có thể được xem như một dạng “miễn dịch cộng đồng” ở cấp hệ thống; trong đó, tri thức về gian lận được chia sẻ ở mức mô hình thay vì mức dữ liệu, giúp toàn bộ mạng lưới tài chính tăng sức đề kháng trước các kiểu tấn công tinh vi, đồng thời vẫn bảo đảm tuân thủ các yêu cầu pháp lý về bảo vệ dữ liệu và tối thiểu hóa dữ liệu.

2.2. Kiến trúc VFL

VFL cung cấp một khung hợp tác trong đó ngân hàng (nắm dữ liệu tài chính, tín dụng) và các đối tác dữ liệu như nhà mạng viễn thông hoặc nền tảng thương mại điện tử (nắm dữ liệu hành vi, giao dịch phi tài chính) có thể cùng xây dựng mô hình chấm điểm tín dụng trên tập khách hàng giao nhau mà không bên nào phải chia sẻ trực tiếp danh sách khách hàng hoặc toàn bộ đặc trưng dữ liệu của mình. Trong thiết lập VFL, mỗi bên lưu trữ một phần không gian đặc trưng và tham gia huấn luyện mô hình chung thông qua các giao thức mã hóa, ghép nối thực thể an toàn (privacy‑preserving entity alignment) và suy luận liên bên (split inference), qua đó bảo toàn bí mật kinh doanh và tuân thủ các nguyên tắc tối thiểu hóa, mục đích cụ thể và đồng thuận của chủ thể dữ liệu theo khung bảo vệ dữ liệu cá nhân mới (Zhongyi Wang, 2024; Yizhi Zhou, 2025).

Nhờ kết hợp được cả tín hiệu tài chính và tín hiệu hành vi đa kênh, các mô hình VFL có khả năng phác họa bức tranh “360 độ” về hồ sơ rủi ro của khách hàng, từ đó cải thiện đáng kể độ chính xác dự báo vỡ nợ đối với nhóm khách hàng ít hoặc không có dữ liệu lịch sử tín dụng truyền thống, đồng thời vẫn duy trì được tính bao trùm và công bằng trong tiếp cận tín dụng.

Các nghiên cứu gần đây cho thấy việc đưa các dữ liệu không thuộc lĩnh vực tài chính (như dữ liệu sử dụng dịch vụ viễn thông, dữ liệu mua sắm trực tuyến và hành vi trên môi trường số) vào mô hình chấm điểm tín dụng có thể nâng cao độ chính xác trong việc đánh giá khách hàng, đặc biệt đối với những người ít tiếp cận dịch vụ ngân hàng. Nhờ đó, các ngân hàng có thể mở rộng hoạt động cho vay một cách an toàn đối với những khách hàng có ít hoặc gần như không có lịch sử tín dụng, đồng thời góp phần thực hiện mục tiêu tài chính toàn diện ở cấp quốc gia.

3. Ứng dụng VFL trong chấm điểm tín dụng đa nguồn

Nghị định số 94/2025/NĐ-CP khuyến khích các tổ chức tín dụng thử nghiệm các mô hình đánh giá rủi ro mới, việc khai thác dữ liệu thay thế (alternative data) trở thành xu hướng tất yếu để giải quyết bài toán "thiên kiến chọn mẫu" (sample selection bias) và mở rộng phổ khách hàng. Phần này phân tích kiến trúc VFL như một giải pháp kỹ thuật tối ưu để tổng hợp tri thức từ đa nguồn dữ liệu mà không vi phạm quy định về chia sẻ dữ liệu cá nhân tại Điều 27 Luật Bảo vệ dữ liệu cá nhân năm 2025.

Trong hệ sinh thái tài chính Việt Nam, mô hình VFL thường có hai bên tham gia chính: (i) Guest Party (Bên sở hữu nhãn - Label Owner): Thường là ngân hàng hoặc công ty tài chính, sở hữu dữ liệu lịch sử tín dụng của khách hàng (Nợ xấu/Không nợ xấu) và thông tin định danh khách hàng (KYC); (ii) Host Party (Bên sở hữu đặc trưng - Feature Owner): Là các công ty viễn thông, sàn thương mại điện tử hoặc ví điện tử. Các đơn vị này nắm giữ các biến số hành vi của khách hàng như tần suất nạp thẻ, giá trị giỏ hàng trung bình, mức độ ổn định vị trí địa lý, nhưng thiếu nhãn rủi ro tài chính.

Mục tiêu của VFL là xây dựng một mô hình dự báo thống nhất mà không bên nào phải tiết lộ dữ liệu thô cho bên kia. Tuy nhiên, thách thức kỹ thuật đầu tiên của VFL là xác định tập khách hàng chung để tiến hành huấn luyện mà không làm lộ danh sách khách hàng không trùng khớp - vốn được coi là bí mật kinh doanh và dữ liệu nhạy cảm theo Luật Bảo vệ dữ liệu cá nhân năm 2025.

Nghiên cứu đề xuất áp dụng giao thức Giao điểm tập hợp riêng tư dựa trên mã hóa RSA (hệ mật mã bất đối xứng sử dụng cặp khóa công khai và bí mật để bảo mật dữ liệu). Quy trình được thực hiện theo các bước sau:

(i) Hai bên thống nhất một định danh chung (ID), ví dụ: Số điện thoại hoặc mã căn cước công dân.

(ii) Sử dụng kỹ thuật Blind Signature (Chữ ký mù), ngân hàng và đối tác mã hóa tập ID của mình và trao đổi các bản mã.

(iii) Hệ thống so khớp các bản mã để tìm ra tập giao điểm.

(iv) Hai bên chỉ biết được danh sách các ID nằm trong tập để bắt đầu giai đoạn huấn luyện. Thông tin về các ID thuộc tập và được bảo mật tuyệt đối.

Đối với bài toán chấm điểm tín dụng với dữ liệu dạng bảng, các thuật toán học máy dạng cây quyết định nâng cao, tiêu biểu như SecureBoost được đánh giá là hiệu quả nhất hiện nay. Quy trình huấn luyện trong VFL diễn ra qua các bước lặp được bảo vệ bằng mã hóa đồng hình (kỹ thuật cho phép tính toán trực tiếp trên dữ liệu đang bị khóa - Homomorphic Encryption) (Naresh, 2026), cụ thể:

(i) Tính toán sai số cục bộ: Ngân hàng tính toán sai số và đạo hàm bậc nhất/bậc hai dựa trên nhãn của mình. Các giá trị này được mã hóa bằng khóa công khai (Public Key) của hệ mã hóa đồng hình và gửi sang đối tác.

(ii) Tìm điểm phân chia tối ưu: Đối tác (công ty viễn thông hoặc sàn thương mại điện tử) sử dụng các thông số đã mã hóa nhận được từ ngân hàng để tính toán độ lợi thông tin cho các đặc trưng dữ liệu hành vi của mình như thói quen mua sắm, nạp thẻ. Do tính chất của mã hóa đồng hình, đối tác có thể thực hiện phép cộng trên dữ liệu mã hóa để tổng hợp sai số cho các tập dữ liệu mà không thể giải mã giá trị thực của đạo hàm bậc nhất/bậc hai phía trên.

(iii) Cập nhật mô hình: Chỉ có cấu trúc cây và trọng số các nút lá được cập nhật. Dữ liệu đặc trưng của đối tác không bao giờ rời khỏi máy chủ của họ, và nhãn của ngân hàng không bị tiết lộ cho đối tác.

Hiệu quả trong Phân loại khách hàng "Thin-file"

Ứng dụng VFL cho phép giải quyết triệt để vấn đề "Cold-Start" (Khởi đầu lạnh) trong tín dụng. Các biến số thay thế như tần suất thanh toán cước viễn thông đúng hạn hay tỉ lệ hoàn hàng thấp trên sàn thương mại điện tử có giá trị dự báo cao đối với nhóm khách hàng chưa có lịch sử tín dụng. Các kết quả thực nghiệm quốc tế cho thấy mô hình VFL kết hợp dữ liệu ngân hàng - viễn thông có thể cải thiện độ chính xác (chỉ số KS - Kolmogorov-Smirnov) từ 10 - 15% so với mô hình đơn lẻ, giúp tổ chức tín dụng phân loại chính xác hơn rủi ro của nhóm khách hàng phổ thông, từ đó mở rộng tệp khách hàng phê duyệt mà vẫn kiểm soát được tỉ lệ nợ xấu ở mức an toàn (Paliska, 2025). Đây là cơ sở khoa học quan trọng để các ngân hàng tham gia Cơ chế thử nghiệm có kiểm soát (Sandbox) theo Nghị định số 94/2025/NĐ-CP.

4. Ứng dụng HFL trong mạng lưới phát hiện gian lận liên ngân hàng

HFL là mô hình phù hợp nhất cho bài toán phát hiện gian lận vì các NHTM đều sở hữu cấu trúc dữ liệu giao dịch tương đồng (bao gồm số tài khoản, thời gian, số tiền, địa điểm, thiết bị) nhưng lại có không gian mẫu khách hàng riêng biệt và không trùng lặp (ví dụ: Khách hàng của Vietcombank khác với khách hàng của NHTM cổ phần Tiên Phong (TPBank). Mục tiêu của mạng lưới HFL là huấn luyện một mô hình phát hiện gian lận toàn cục có khả năng nhận diện các mẫu hình tấn công mới dựa trên tri thức tổng hợp từ tất cả các ngân hàng thành viên mà không cần chia sẻ dữ liệu giao dịch chi tiết.

Quy trình vận hành của mạng lưới HFL diễn ra theo chu kỳ lặp như sau:

- Huấn luyện cục bộ (Local Training): Mỗi ngân hàng sử dụng dữ liệu lịch sử gian lận nội bộ để huấn luyện mô hình cục bộ, sử dụng thuật toán học máy nào đó (ví dụ: Deep Neural Network hoặc XGBoost).

- Tổng hợp tham số (Secure Aggregation): Thay vì gửi dữ liệu thô, các ngân hàng chỉ gửi các cập nhật trọng số mô hình (gradients) về máy chủ trung tâm do một đơn vị trung gian uy tín quản lý (như Công ty cổ phần Thanh toán Quốc gia Việt Nam - NAPAS hoặc Trung tâm Thông tin tín dụng Quốc gia Việt Nam - CIC).

- Cập nhật toàn cục: Máy chủ trung tâm sử dụng một số thuật toán như trung bình hóa trọng số - FedAvg (Federated Averaging) hoặc tối ưu hóa tiệm cận - FedProx (Federated Proximal) (P. Takkalapally, 2025) để tổng hợp các trọng số này, tạo ra một mô hình toàn cục mới thông minh hơn.

- Phân phối lại: Mô hình toàn cục được gửi ngược lại cho các ngân hàng để cập nhật hệ thống phòng thủ của mình.

- Giá trị thực tiễn: Nếu Ngân hàng A phát hiện một thủ đoạn gian lận mới (chẳng hạn như tấn công qua mã độc Android giả mạo), mô hình tại A sẽ "học" được đặc trưng này. Thông qua HFL, Ngân hàng B - dù chưa từng gặp thủ đoạn này - sẽ nhận được bản cập nhật mô hình chứa tri thức đó và có khả năng ngăn chặn cuộc tấn công tương tự ngay lập tức. Đây là cơ chế phòng thủ chủ động theo thời gian thực

Ngoài ra, để ngăn chặn nguy cơ rò rỉ thông tin từ chính các tham số mô hình, kỹ thuật mã hóa đồng hình (Naresh, 2026) cũng thường được sử dụng. Kỹ thuật mã hóa này cho phép máy chủ trung tâm thực hiện các phép toán cộng/nhân trực tiếp trên các tham số đã được mã hóa mà không cần giải mã chúng. Điều này đảm bảo rằng ngay cả đơn vị vận hành máy chủ như NAPAS cũng không thể biết được đặc điểm dữ liệu cụ thể của từng ngân hàng thành viên.

5. Thách thức triển khai và khuyến nghị chiến lược

Mặc dù FL mang lại lời giải thuyết phục cho bài toán bảo mật dữ liệu, việc chuyển đổi từ mô hình lý thuyết sang vận hành thực tế tại hệ thống ngân hàng Việt Nam vẫn đối mặt với những rào cản kỹ thuật và vận hành. Phần này tổng hợp các thách thức trọng yếu đồng thời đề xuất lộ trình chiến lược cho các bên liên quan.

5.1. Rào cản kỹ thuật và vận hành

Để hiện thực hóa mạng lưới FL, các tổ chức tài chính cần giải quyết ba nút thắt chính:

Thứ nhất, vấn đề dữ liệu không đồng nhất (Non-IID): Sự chênh lệch lớn về quy mô và đặc điểm khách hàng giữa các ngân hàng (ví dụ: giữa bốn NHTM lớn so với các NHTM cổ phần nhỏ) dẫn đến nguy cơ mô hình toàn cục bị thiên lệch (bias), làm giảm độ chính xác khi áp dụng cục bộ. Vì vậy, cần áp dụng các thuật toán tối ưu hóa thích ứng như FedProx để đảm bảo mô hình hội tụ ổn định ngay cả khi bị phân mảnh dữ liệu.

Thứ hai, chi phí tính toán và truyền thông: Việc áp dụng mã hóa đồng hình (Homomorphic Encryption) để bảo vệ tham số làm tăng gánh nặng tính toán lên gấp nhiều lần, đòi hỏi hạ tầng phần cứng chuyên dụng (AI Accelerators/GPU) tại các điểm nút.

Thứ ba, rủi ro "đầu độc" mô hình (Model Poisoning): Môi trường phân tán tiềm ẩn nguy cơ bị tấn công bởi các thành viên xấu hoặc tin tặc xâm nhập, cố tình gửi các tham số sai lệch để phá hoại hệ thống phòng thủ chung. Điều này đòi hỏi cơ chế kiểm tra tính hợp lệ nghiêm ngặt tại máy chủ trung tâm.

5.2. Khuyến nghị chính sách

Dựa trên bối cảnh pháp lý hiện hành, đặc biệt là Luật Bảo vệ dữ liệu cá nhân năm 2025 và Nghị định số 94/2025/NĐ-CP, nghiên cứu đề xuất một số định hướng chính sách như sau:

Đối với Ngân hàng Nhà nước (NHNN)

Ban hành bộ tiêu chuẩn kỹ thuật thống nhất cho việc triển khai FL, trong đó quy định rõ các thuật toán mã hóa được chấp nhận và cơ chế xác thực thành viên tham gia mạng lưới.

Với vai trò điều phối, NHNN hoặc một đơn vị được ủy quyền như NAPAS, CIC nên đảm nhiệm vai trò là "Host" vận hành máy chủ tổng hợp, đảm bảo tính trung lập và tin cậy cho toàn hệ thống.

Đối với các NHTM

Trước hết, các ngân hàng nên tham gia Sandbox, chủ động đăng ký thử nghiệm các mô hình chấm điểm tín dụng đa nguồn và chia sẻ dữ liệu qua giao diện lập trình mở (Open AI), qua đó được bảo đảm khung pháp lý trong giai đoạn đầu. Đồng thời, các ngân hàng cần ưu tiên Chiến lược "Cloud-First", đầu tư nâng cấp hạ tầng đám mây và tính toán tại biên để sẵn sàng cho yêu cầu xử lý phức tạp của FL. Cùng với đó là tăng cường hợp tác đa ngành, mở rộng liên kết với các công ty công nghệ tài chính (Fintech), viễn thông để làm giàu dữ liệu huấn luyện, chuyển dịch từ cạnh tranh đối đầu sang mô hình "Hợp tác - Cạnh tranh" (Coopetition).

6. Kết luận

FL không chỉ là một giải pháp công nghệ tình thế, mà là nền tảng kiến trúc cho một kỷ nguyên tài chính mới - kỷ nguyên của "AI cộng tác" (Collaborative AI). Bằng cách cho phép khai thác tri thức tập thể mà vẫn tôn trọng tuyệt đối chủ quyền dữ liệu, FL giúp ngành Ngân hàng Việt Nam giải quyết triệt để mâu thuẫn giữa tăng trưởng kinh doanh và tuân thủ pháp luật. Việc triển khai đồng bộ mô hình HFL (cho phát hiện gian lận liên ngân hàng) và VFL (cho chấm điểm tín dụng đa nguồn) sẽ chuyển đổi căn bản ngành tài chính từ trạng thái "cạnh tranh dựa trên sở hữu dữ liệu" sang "hợp tác dựa trên chia sẻ tri thức". Đây là nền tảng tiên quyết để xây dựng một hệ sinh thái tài chính minh bạch, an toàn và toàn diện, giúp giảm thiểu hàng nghìn tỉ đồng thiệt hại do gian lận mỗi năm và hiện thực hóa mục tiêu quốc gia về tài chính toàn diện đến năm 2030.

Tài liệu tham khảo:

1. Luật Bảo vệ dữ liệu cá nhân năm 2025.

2. Naresh, V. A. (2026), Privacy-preserving federated credit risk models: evaluating differential privacy and homomorphic encryption techniques, Scientific Reports. doi:10.1038/s41598-025-34536-9

3. Nghị định số 94/2025/NĐ-CP ngày 29/4/2025 của Chính phủ quy định về Cơ chế thử nghiệm có kiểm soát trong lĩnh vực ngân hàng.

4. Nguyen Thi Thu Trang, T. T. (2025), Big Data Applications in Banking Sector in Vietnam Today, Engineering and Technology Journal, 5249-5254, doi:10.47191/etj/v10i05.53

5. P. Takkalapally, J. K. (2025), Federated Learning for Privacy-Preserving Fraud Detection in Cross-Bank Systems, 3rd International Conference on Intelligent Cyber Physical Systems and Internet of Things (ICoICI) (pages 600-604). Coimbatore: IEEE.

6. Paliska, W. (2025), Scoring the Unscorable: Why Thin-File Borrowers Are Your Next Growth Market,

https://dotdata.com/blog/thin-file-borrowers-are-your-next-growth-market/

7. Phong Anh Hoang, P. K. (2025), Vietnam: New Decree No. 94/2025/ND-CP creating a “Regulatory Sandbox” in the Banking Sector, https://www.dfdl.com/insights/legal-and-tax-updates/vietnam-new-decree-no-94-2025-nd-cp-on-regulatory-sandbox-in-the-banking-sector/

8. Sondeck, L. L. (2025), Practical and ready-to-use methodology to assess the re-identification risk in anonymized datasets. Scientific Reports, 15(1), 23223. doi:10.1038/s41598-025-04907-3

9. Techcombank (2024), Techcombank ushers in a new era of AI-powered banking at its first ever Techcombank Keynote. From https://techcombank.com/: https://techcombank.com/en/information/updates/techcombank-ushers-in-a-new-era-of-ai-powered-banking-at-its-first-ever-techcombank-keynote

10. Tran Binh, T. D. (2026), Online scams inflict losses exceeding VND6 trillion in Vietnam in 2025,

https://en.sggp.org.vn/online-scams-inflict-losses-exceeding-vnd6-trillion-in-vietnam-in-2025-post123051.html

11. Yizhi Zhou, J. W. (2025), Federated Learning with complete service commitment of data heterogeneity, Knowledge-Based Systems, 112937.

12. Zhongyi Wang, J. X. (2024), A novel federated learning approach with knowledge transfer for credit scoring, Decision Support Systems, 114084.

TS. Vũ Trọng Sinh

Học viện Ngân hàng

Tin bài khác

Bảo vệ dữ liệu cá nhân tại các ngân hàng Việt Nam trong kỷ nguyên số

Công nghệ & ngân hàng số

Bài viết này phân tích thực trạng bảo vệ dữ liệu cá nhân trong hệ thống ngân hàng Việt Nam, đồng thời chỉ ra những rủi ro ngày càng gia tăng trong bối cảnh số hóa, từ đó đề xuất các giải pháp đồng bộ về pháp lý, công nghệ, nhân lực và quản lý nhằm xây dựng một hệ sinh thái ngân hàng số an toàn và bền vững.

Nâng cao hiệu quả an ninh mạng thông qua “human firewall” tại các ngân hàng Việt Nam

Công nghệ & ngân hàng số

Trong bối cảnh các mối đe dọa an ninh mạng ngày càng khai thác yếu tố con người, việc xây dựng “human firewall” trở thành trụ cột chiến lược giúp ngành Ngân hàng Việt Nam nâng cao năng lực phòng vệ và thích ứng với môi trường số hóa.

Đánh giá "tính tiền tệ" của Stablecoin và khuyến nghị đối với ổn định tiền tệ, tài chính

Công nghệ & ngân hàng số

Bài viết phân tích “tính tiền tệ” của Stablecoin (tiền mã hóa ổn định), qua đó chỉ ra những giới hạn và hàm ý chính sách nhằm bảo đảm ổn định tiền tệ và tài chính trong kỷ nguyên số.

Phát triển cho vay số toàn diện - Kinh nghiệm quốc tế và bài học cho Việt Nam

Công nghệ & ngân hàng số

Trong bối cảnh chuyển đổi số lan tỏa mạnh mẽ, mô hình cho vay số toàn diện (end-to-end digital lending) đang nổi lên như trụ cột tái cấu trúc hoạt động tín dụng. Từ những kinh nghiệm quốc tế, bài viết gợi mở hướng phát triển mô hình cho vay số toàn diện phù hợp với Việt Nam.

Bảo vệ dữ liệu cá nhân trong dịch vụ ngân hàng số và thanh toán điện tử tại Việt Nam

Công nghệ & ngân hàng số

Bài viết phân tích những thách thức nổi bật trong bảo vệ dữ liệu cá nhân trong ngân hàng số và thanh toán điện tử tại Việt Nam, từ đó đề xuất các giải pháp nhằm tăng cường an toàn thông tin và củng cố niềm tin của khách hàng trong môi trường tài chính số.

Tăng cường quản trị và bảo vệ dữ liệu cá nhân trong hệ thống ngân hàng nhằm kiến tạo niềm tin số

Công nghệ & ngân hàng số

Trong bối cảnh chuyển đổi số, dữ liệu cá nhân ngày càng đóng vai trò quan trọng trong hoạt động ngân hàng, đồng thời đặt ra yêu cầu cao về quản trị và bảo vệ thông tin. Bài viết phân tích vai trò của dữ liệu cá nhân, các rủi ro phát sinh trong ngân hàng số và khung pháp lý hiện hành tại Việt Nam, qua đó đề xuất một số định hướng nhằm tăng cường quản trị dữ liệu, bảo vệ quyền riêng tư của khách hàng và củng cố niềm tin số trong hệ thống ngân hàng.

Phát triển sản phẩm, dịch vụ ngân hàng số đi đôi với bảo vệ dữ liệu cá nhân

Công nghệ & ngân hàng số

An ninh mạng, an ninh dữ liệu và an toàn thông tin là yêu cầu xuyên suốt, không thể tách rời khỏi quá trình chuyển đổi số ngân hàng. Việc phát triển sản phẩm, dịch vụ số phải đi đôi với bảo vệ dữ liệu cá nhân, bảo đảm hoạt động liên tục của các hệ thống thông tin quan trọng và quyền, lợi ích hợp pháp của khách hàng. Vì thế, thời gian qua, công tác đảm bảo an ninh, an toàn trong hoạt động thanh toán và các hệ thống thông tin ứng dụng nghiệp vụ ngân hàng luôn được quan tâm chú trọng. Bên cạnh đó, ngành Ngân hàng thường xuyên phối hợp với các cơ quan chức năng nhằm tăng cường công tác phòng, chống tội phạm công nghệ cao.

Ứng dụng các thuật toán học sâu nâng cao năng lực phòng, chống tội phạm tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam

Công nghệ & ngân hàng số

Bài viết phân tích toàn diện cơ sở lý luận và thực tiễn của việc ứng dụng trí tuệ nhân tạo (AI), học sâu và các công nghệ an ninh tiên tiến, qua đó đánh giá hạ tầng bảo mật và đề xuất các giải pháp chiến lược giai đoạn 2026 - 2030 nhằm chuyển đổi sang hệ sinh thái an ninh chủ động, bảo vệ hiệu quả tài sản, con người và uy tín của hệ thống Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam (Agribank).

Xem thêm

Ấn phẩm in

TCNH số 9 năm 2026

TCNH số 8 năm 2026

TCNH số 7 năm 2026

Multimedia

Infographic Video Longform Emagazine

Đại hội XIV của Đảng - Đại hội của niềm tin và khát vọng phát triển

Pháp luật Liên minh châu Âu về bảo vệ dữ liệu cá nhân trong hoạt động thương mại điện tử

Infographics

Infographic: Các thành viên Chính phủ nhiệm kỳ 2026-2031

Chính sách

Chia sẻ thông tin và giám sát an toàn tài chính tại Việt Nam: Tiếp cận từ Thông tư số 01/2026/TT-NHNN

Bài viết định hình cơ chế chia sẻ thông tin liên thông và linh hoạt, góp phần nâng cao hiệu quả giám sát, tăng cường khả năng cảnh báo sớm rủi ro và thúc đẩy quá trình chuyển đổi số trong hệ thống tài chính - ngân hàng Việt Nam.

Định hướng khung chính sách đầu tư cho phát triển du lịch nông nghiệp tại Việt Nam giai đoạn 2026 - 2030

Bài viết phân tích sự cần thiết và định hướng hoàn thiện khung chính sách đầu tư cho phát triển du lịch nông nghiệp ở Việt Nam giai đoạn 2026 - 2030, trước yêu cầu chuyển đổi xanh, tái cơ cấu nông nghiệp và nâng cao hiệu quả huy động nguồn lực cho phát triển bền vững khu vực nông thôn ngày càng trở nên cấp thiết.

Chính sách tiền tệ Việt Nam qua 75 năm: Từ ổn định kinh tế vĩ mô đến kiến tạo tăng trưởng bền vững

Bài viết phân tích chặng đường 75 năm hình thành và phát triển của chính sách tiền tệ Việt Nam, làm rõ quá trình chuyển đổi từ mô hình ngân hàng một cấp sang hai cấp, vai trò điều hành của Ngân hàng Nhà nước Việt Nam trong ổn định kinh tế vĩ mô, xử lý khủng hoảng và tái cơ cấu hệ thống, đồng thời nhấn mạnh định hướng phát triển trong kỷ nguyên số - xanh nhằm thúc đẩy tăng trưởng nhanh và bền vững.

Khơi thông nguồn vốn đáp ứng nhu cầu phát triển kinh tế xanh tại Việt Nam

Trước yêu cầu cấp thiết về chuyển dịch sang mô hình tăng trưởng bền vững, bài viết phân tích thực trạng huy động vốn cho kinh tế xanh tại Việt Nam, chỉ ra những rào cản chủ yếu và đề xuất các giải pháp nhằm nâng cao hiệu quả sử dụng vốn, góp phần thúc đẩy tăng trưởng kinh tế gắn với bảo vệ môi trường.

Hoàn thiện cơ chế lập, chấp hành và quyết toán ngân sách nhà nước theo hướng minh bạch, trách nhiệm giải trình tại Việt Nam

Bài viết phân tích toàn diện cơ chế lập, chấp hành và quyết toán ngân sách nhà nước (NSNN) tại Việt Nam giai đoạn 2020 - 2025, qua đó chỉ ra những tiến bộ về minh bạch và trách nhiệm giải trình, đồng thời nhận diện các thách thức trong thực thi và đề xuất giải pháp cải cách theo hướng hiện đại, hiệu quả và tiệm cận chuẩn mực quốc tế.

Quốc tế

Thúc đẩy tài chính toàn diện thông qua giáo dục tài chính cá nhân trong kỷ nguyên số: Kinh nghiệm quốc tế và hàm ý cho Việt Nam

Trong kỷ nguyên số, giáo dục tài chính là đòn bẩy chiến lược để thu hẹp khoảng cách năng lực hành vi, thúc đẩy tài chính toàn diện. Bài viết tìm hiểu kinh nghiệm quốc tế về thúc đẩy tài chính toàn diện thông qua giáo dục tài chính cá nhân và đề xuất một số hàm ý cho Việt Nam trong xây dựng lộ trình chính sách đồng bộ, bền vững.

Điều hành khuôn khổ chính sách tích hợp trong bối cảnh toàn cầu hóa: Kinh nghiệm Hàn Quốc và khuyến nghị cho Việt Nam

Bài viết phân tích xu hướng chuyển dịch sang khuôn khổ chính sách tích hợp (Integrated Policy Framework - IPF) trong bối cảnh toàn cầu biến động, qua đó làm rõ kinh nghiệm của Hàn Quốc và đề xuất hàm ý chính sách cho Việt Nam.

Cú sốc giá dầu và phản ứng của ngân hàng trung ương: Tổng quan lý thuyết, bằng chứng lịch sử và hàm ý chính sách

Bài viết phân tích một cách hệ thống mối quan hệ giữa cú sốc giá dầu và phản ứng chính sách của ngân hàng trung ương (NHTW), qua đó nhấn mạnh vai trò của việc nhận diện đúng nguồn gốc cú sốc và tăng cường phối hợp chính sách nhằm nâng cao hiệu quả điều hành chính sách tiền tệ trong bối cảnh biến động năng lượng toàn cầu.

Từ hệ thống thanh toán truyền thống đến tài sản kỹ thuật số: Cách tiếp cận từ Đạo luật về Hiện đại hóa hệ thống thanh toán năm 2025 của Úc

Bài viết phân tích sự chuyển dịch tư duy lập pháp của Úc trong điều chỉnh hệ thống thanh toán số và tài sản kỹ thuật số thông qua Luật sửa đổi Luật Ngân khố về Payments System Modernisation Act 2025 (Đạo luật về Hiện đại hóa hệ thống thanh toán năm 2025) của Úc, làm rõ cách tiếp cận quản lý dựa trên chức năng và rủi ro, cơ chế phối hợp giám sát liên cơ quan và những hàm ý chính sách cho quá trình hoàn thiện pháp luật tại Việt Nam.

Vai trò của các yếu tố phi ngôn ngữ trong hoạt động truyền thông của Cục Dự trữ Liên bang Mỹ và hàm ý đối với thị trường tài chính toàn cầu

Bài viết phân tích bằng chứng thực nghiệm mới về vai trò của các yếu tố phi ngôn ngữ trong truyền thông chính sách tiền tệ của Cục Dự trữ Liên bang Mỹ (Fed), qua đó thảo luận các hàm ý sâu sắc đối với công tác hoạch định và truyền tải chính sách tiền tệ trong bối cảnh toàn cầu hóa và sự bùng nổ của công nghệ thông tin.