Ứng dụng học tập liên kết trong chấm điểm tín dụng và an ninh tài chính tại Việt Nam
Tóm tắt: Trong bối cảnh nền kinh tế số Việt Nam bước vào giai đoạn tăng trưởng bùng nổ, ngành Ngân hàng đang đứng trước một ngã rẽ mang tính lịch sử. Một mặt, sự phát triển của trí tuệ nhân tạo (AI) và dữ liệu lớn (Big Data) mở ra những cơ hội chưa từng có để cá nhân hóa dịch vụ tài chính và mở rộng khả năng tiếp cận tín dụng. Mặt khác, những rủi ro về an ninh mạng ngày càng tinh vi, đi kèm với đó là sự siết chặt của hành lang pháp lý về bảo vệ dữ liệu cá nhân. Bài viết này cung cấp một cái nhìn toàn cảnh, sâu sắc và thực tiễn về Học tập liên kết (Federated Learning - FL) - một công nghệ được xem là chìa khóa để giải quyết bài toán cân bằng giữa khai thác dữ liệu và bảo mật thông tin. Bài viết tập trung phân tích FL dưới góc độ chiến lược kinh doanh, lợi ích thực tiễn và sự tương thích với bối cảnh pháp lý đặc thù của Việt Nam, đặc biệt là dưới tác động của Luật Bảo vệ dữ liệu cá nhân năm 2025 và Nghị định số 94/2025/NĐ-CP ngày 29/4/2025 quy định về Cơ chế thử nghiệm có kiểm soát trong lĩnh vực ngân hàng. Thông qua việc phân tích dữ liệu thị trường, các xu hướng công nghệ tại các ngân hàng thương mại (NHTM) và tình hình gian lận tài chính thực tế, bài viết khẳng định: FL không chỉ là một xu hướng công nghệ nhất thời, mà là hạ tầng thiết yếu cho một hệ sinh thái tài chính bền vững trong thập kỷ tới.
Từ khóa: FL, chấm điểm tín dụng, phát hiện gian lận, bảo vệ dữ liệu cá nhân.
APPLICATION OF FEDERATED LEARNING
IN CREDIT SCORING AND FINANCIAL SECURITY IN VIETNAM
Abstract: As Vietnam’s digital economy enters a phase of explosive growth, the banking sector is standing at a historic crossroads. On the one hand, the rapid advancement of Artificial Intelligence (AI) and Big Data is creating unprecedented opportunities to personalize financial services and expand access to credit. On the other hand, increasingly sophisticated cybersecurity threats are emerging, accompanied by a tightening legal framework on personal data protection. This article provides a comprehensive, in-depth, and practical overview of Federated Learning (FL) - a technology considered key to balancing data utilization with information security. It focuses on analyzing FL from the perspectives of business strategy, practical benefits, and its compatibility with Vietnam’s specific legal context, particularly under the impact of the 2025 law on personal data protection and Decree No. 94/2025/ND-CP dated April 29, 2025, on the controlled regulatory sandbox mechanism in the banking sector. Through an analysis of market data, technological trends among commercial banks, and the current landscape of financial fraud, the article affirms that FL is not merely a passing technological trend, but rather an essential infrastructure for building a sustainable financial ecosystem in the coming decade.
Keywords: FL, credit scoring, fraud detection, personal data protection.
1. Bối cảnh chuyển đổi số và pháp lý tại Việt Nam năm 2025
Đến tháng 12/2025, hệ thống tài chính Việt Nam đã ghi nhận sự chuyển dịch căn bản về hạ tầng dữ liệu. Các NHTM như NHTM cổ phần Ngoại thương Việt Nam (Vietcombank), NHTM cổ phần Kỹ thương Việt Nam (Techcombank), NHTM cổ phần Việt Nam Thịnh Vượng (VPBank) đã cơ bản hoàn tất việc xây dựng kho dữ liệu và nền tảng điện toán đám mây (Techcombank, 2024; Nguyen Thi Thu Trang, 2025). Việc tích hợp AI và học máy (ML) vào quy trình vận hành đã trở thành tiêu chuẩn ngành, cho phép tự động hóa quy trình phê duyệt tín dụng và cá nhân hóa trải nghiệm khách hàng ở quy mô lớn.
Tuy nhiên, năng lực khai thác dữ liệu liên tổ chức (cross-organizational data mining) đang gặp rào cản lớn từ hành lang pháp lý mới. Luật Bảo vệ dữ liệu cá nhân năm 2025 đặt ra các yêu cầu nghiêm ngặt về chủ quyền dữ liệu và sự đồng thuận của chủ thể dữ liệu. Các mô hình chia sẻ dữ liệu tập trung truyền thống (centralized data sharing) tiềm ẩn rủi ro pháp lý cao và nguy cơ vi phạm nguyên tắc "tối thiểu hóa dữ liệu". Trong mô hình học máy tập trung, việc thiếu hụt cái nhìn toàn cảnh về khách hàng dẫn đến hai hệ quả tiêu cực:
(i) Rủi ro tín dụng tiềm ẩn: Các mô hình chấm điểm tín dụng đơn lẻ không thể đánh giá chính xác năng lực tài chính của nhóm khách hàng ít lịch sử tín dụng ("thin-file") như doanh nghiệp nhỏ và vừa, Gen Z... dẫn đến bỏ sót cơ hội kinh doanh hoặc định giá rủi ro sai lệch; và (ii) Lỗ hổng an ninh hệ thống: Hệ thống phát hiện gian lận cục bộ không thể nhận diện các cuộc tấn công phức tạp, phân tán như "vay chồng vay" (loan stacking) hay rửa tiền qua mạng lưới đa ngân hàng, vốn đòi hỏi sự đối chiếu dữ liệu liên tổ chức. Dữ liệu thống kê 11 tháng đầu năm 2025 cho thấy thiệt hại do gian lận tài chính trực tuyến là hơn 6.000 tỉ đồng với những kiểu tấn công kể trên (Tran Binh, 2026).
Mặt khác, Nghị định số 94/2025/NĐ-CP đã tạo ra khung pháp lý cho phép thử nghiệm các giải pháp công nghệ mới như chấm điểm tín dụng và chia sẻ dữ liệu qua giao diện lập trình ứng dụng mở (Open API) (Phong Anh Hoang, 2025). Vậy làm thế nào để giải quyết mâu thuẫn giữa nhu cầu cấp thiết phải hợp tác khai thác dữ liệu (để tuân thủ Nghị định số 94/2025/NĐ-CP và tối ưu kinh doanh) và yêu cầu bắt buộc phải bảo mật tuyệt đối dữ liệu khách hàng (để tuân thủ Luật Bảo vệ dữ liệu cá nhân năm 2025). Các giải pháp kỹ thuật hiện tại như ẩn danh hóa hay giả danh hóa đã được chứng minh là không đủ an toàn trước các kỹ thuật tấn công tái định danh hiện đại (Sondeck, 2025).
Bài viết này đề xuất cách tiếp cận FL như một lời giải công nghệ cho bài toán nêu trên. Khác với các tiếp cận truyền thống, FL cho phép huấn luyện các mô hình AI cộng tác mà không cần di chuyển dữ liệu ra khỏi phạm vi quản lý của từng ngân hàng.
Nghiên cứu tập trung giải quyết ba vấn đề cốt lõi:
(i) Kiến trúc: Xây dựng khung tham chiếu kỹ thuật cho hệ sinh thái FL trong ngân hàng Việt Nam, phân định rõ vai trò của FL theo chiều ngang (Horizontal FL - HFL) trong phát hiện gian lận liên ngân hàng và FL theo chiều dọc (Vertical FL - VFL) trong chấm điểm tín dụng đa nguồn.
(ii) Hiệu quả: Chứng minh tính ưu việt của FL trong việc phát hiện sớm các mẫu hình gian lận mới (như Deepfake, Loan Stacking) dựa trên dữ liệu tổng hợp từ toàn mạng lưới, điều mà một ngân hàng đơn lẻ không thể thực hiện.
(iii) Tuân thủ: Phân tích sự tương thích của mô hình FL với Luật Bảo vệ dữ liệu cá nhân năm 2025, chứng minh cơ chế "trao đổi tri thức, không trao đổi dữ liệu" là chìa khóa để vượt qua rào cản pháp lý.
2. Cơ sở lý luận về FL
Mô hình ML truyền thống (Centralized Machine Learning) hoạt động dựa trên nguyên tắc tập trung tất cả dữ liệu về một bộ dữ liệu chung (dataset) để huấn luyện mô hình. Cách tiếp cận này, dù hiệu quả về mặt kỹ thuật trong quá khứ, đang trở nên lỗi thời và nhiều rủi ro trong bối cảnh mới, đặc biệt do yêu cầu dữ liệu phải rời khỏi nơi lưu trữ an toàn ban đầu.
Trước thách thức đó, FL là phương pháp huấn luyện mô hình ML phân tán (Decentralized Machine Learning), cho phép các bên tham gia hợp tác huấn luyện một mô hình toàn cục mà không cần chia sẻ dữ liệu thô (Hình 1). Cụ thể:
![]() |
Thay vì gửi dữ liệu thô của khách hàng đi, trung tâm điều phối sẽ gửi một "mô hình sơ khai" đến từng ngân hàng thành viên. Tại đây, mô hình sẽ tự "học" các đặc điểm từ dữ liệu nội bộ (như hành vi chi tiêu, lịch sử trả nợ) ngay trên hạ tầng bảo mật của ngân hàng đó. Thông tin được gửi ra ngoài không phải là dữ liệu cá nhân như tên, số tài khoản, số dư, mà là các tham số mô hình (parameters/weights) - những con số đại diện cho các "bài học" mà mô hình đã rút ra, ví dụ như xu hướng gian lận mới, quy luật
tiêu dùng. Tiếp đó, các tham số này được tập hợp và trộn lại tại máy chủ trung tâm để tạo ra một "trí tuệ tổng hợp" thông minh hơn, sau đó được chia sẻ lại cho tất cả các bên tham gia.
Dựa trên nguyên lý trên, FL cung cấp hai kiến trúc kỹ thuật để giải quyết hai bài toán nghiệp vụ mang tính cấp thiết trong bối cảnh hiện nay: Kiến trúc HFL và kiến trúc VFL (Hình 2).
![]() |
2.1. Kiến trúc HFL
HFL cung cấp một cơ chế hợp tác mô hình giữa các ngân hàng có cấu trúc đặc trưng dữ liệu tương đồng (cùng không gian đặc trưng nhưng khác tập khách hàng), cho phép các bên cùng huấn luyện một mô hình phát hiện gian lận chung mà không cần chia sẻ dữ liệu giao dịch thô. Trong thiết lập này, mỗi ngân hàng (chẳng hạn, các thành viên trong một mạng lưới thanh toán hoặc hệ thống chuyển mạch thẻ) tiến hành huấn luyện mô hình cục bộ trên dữ liệu giao dịch của mình. Khi một ngân hàng phát hiện và học được một mẫu hành vi gian lận mới, ví dụ như mô hình chiếm đoạt qua mã QR giả mạo, các tham số mô hình sau khi cập nhật sẽ được gửi dưới dạng bản cập nhật đã mã hóa để tổng hợp với các mô hình khác, hình thành mô hình toàn cục phản ánh kiến thức chung về gian lận mới nổi (P. Takkalapally, 2025).
Nhờ cơ chế này, các ngân hàng khác trong mạng lưới, dù chưa từng quan sát kiểu tấn công tương ứng, vẫn có thể nâng cao năng lực phát hiện ngay lập tức thông qua mô hình toàn cục đã được cung cấp tri thức mới, qua đó làm giảm đáng kể độ trễ phát hiện, tỉ lệ bỏ sót gian lận và phụ thuộc vào cảnh báo thủ công. Cách tiếp cận HFL do vậy có thể được xem như một dạng “miễn dịch cộng đồng” ở cấp hệ thống; trong đó, tri thức về gian lận được chia sẻ ở mức mô hình thay vì mức dữ liệu, giúp toàn bộ mạng lưới tài chính tăng sức đề kháng trước các kiểu tấn công tinh vi, đồng thời vẫn bảo đảm tuân thủ các yêu cầu pháp lý về bảo vệ dữ liệu và tối thiểu hóa dữ liệu.
2.2. Kiến trúc VFL
VFL cung cấp một khung hợp tác trong đó ngân hàng (nắm dữ liệu tài chính, tín dụng) và các đối tác dữ liệu như nhà mạng viễn thông hoặc nền tảng thương mại điện tử (nắm dữ liệu hành vi, giao dịch phi tài chính) có thể cùng xây dựng mô hình chấm điểm tín dụng trên tập khách hàng giao nhau mà không bên nào phải chia sẻ trực tiếp danh sách khách hàng hoặc toàn bộ đặc trưng dữ liệu của mình. Trong thiết lập VFL, mỗi bên lưu trữ một phần không gian đặc trưng và tham gia huấn luyện mô hình chung thông qua các giao thức mã hóa, ghép nối thực thể an toàn (privacy‑preserving entity alignment) và suy luận liên bên (split inference), qua đó bảo toàn bí mật kinh doanh và tuân thủ các nguyên tắc tối thiểu hóa, mục đích cụ thể và đồng thuận của chủ thể dữ liệu theo khung bảo vệ dữ liệu cá nhân mới (Zhongyi Wang, 2024; Yizhi Zhou, 2025).
Nhờ kết hợp được cả tín hiệu tài chính và tín hiệu hành vi đa kênh, các mô hình VFL có khả năng phác họa bức tranh “360 độ” về hồ sơ rủi ro của khách hàng, từ đó cải thiện đáng kể độ chính xác dự báo vỡ nợ đối với nhóm khách hàng ít hoặc không có dữ liệu lịch sử tín dụng truyền thống, đồng thời vẫn duy trì được tính bao trùm và công bằng trong tiếp cận tín dụng.
Các nghiên cứu gần đây cho thấy việc đưa các dữ liệu không thuộc lĩnh vực tài chính (như dữ liệu sử dụng dịch vụ viễn thông, dữ liệu mua sắm trực tuyến và hành vi trên môi trường số) vào mô hình chấm điểm tín dụng có thể nâng cao độ chính xác trong việc đánh giá khách hàng, đặc biệt đối với những người ít tiếp cận dịch vụ ngân hàng. Nhờ đó, các ngân hàng có thể mở rộng hoạt động cho vay một cách an toàn đối với những khách hàng có ít hoặc gần như không có lịch sử tín dụng, đồng thời góp phần thực hiện mục tiêu tài chính toàn diện ở cấp quốc gia.
3. Ứng dụng VFL trong chấm điểm tín dụng đa nguồn
Nghị định số 94/2025/NĐ-CP khuyến khích các tổ chức tín dụng thử nghiệm các mô hình đánh giá rủi ro mới, việc khai thác dữ liệu thay thế (alternative data) trở thành xu hướng tất yếu để giải quyết bài toán "thiên kiến chọn mẫu" (sample selection bias) và mở rộng phổ khách hàng. Phần này phân tích kiến trúc VFL như một giải pháp kỹ thuật tối ưu để tổng hợp tri thức từ đa nguồn dữ liệu mà không vi phạm quy định về chia sẻ dữ liệu cá nhân tại Điều 27 Luật Bảo vệ dữ liệu cá nhân năm 2025.
Trong hệ sinh thái tài chính Việt Nam, mô hình VFL thường có hai bên tham gia chính: (i) Guest Party (Bên sở hữu nhãn - Label Owner): Thường là ngân hàng hoặc công ty tài chính, sở hữu dữ liệu lịch sử tín dụng của khách hàng (Nợ xấu/Không nợ xấu) và thông tin định danh khách hàng (KYC); (ii) Host Party (Bên sở hữu đặc trưng - Feature Owner): Là các công ty viễn thông, sàn thương mại điện tử hoặc ví điện tử. Các đơn vị này nắm giữ các biến số hành vi của khách hàng như tần suất nạp thẻ, giá trị giỏ hàng trung bình, mức độ ổn định vị trí địa lý, nhưng thiếu nhãn rủi ro tài chính.
Mục tiêu của VFL là xây dựng một mô hình dự báo thống nhất mà không bên nào phải tiết lộ dữ liệu thô cho bên kia. Tuy nhiên, thách thức kỹ thuật đầu tiên của VFL là xác định tập khách hàng chung để tiến hành huấn luyện mà không làm lộ danh sách khách hàng không trùng khớp - vốn được coi là bí mật kinh doanh và dữ liệu nhạy cảm theo Luật Bảo vệ dữ liệu cá nhân năm 2025.
Nghiên cứu đề xuất áp dụng giao thức Giao điểm tập hợp riêng tư dựa trên mã hóa RSA (hệ mật mã bất đối xứng sử dụng cặp khóa công khai và bí mật để bảo mật dữ liệu). Quy trình được thực hiện theo các bước sau:
(i) Hai bên thống nhất một định danh chung (ID), ví dụ: Số điện thoại hoặc mã căn cước công dân.
(ii) Sử dụng kỹ thuật Blind Signature (Chữ ký mù), ngân hàng và đối tác mã hóa tập ID của mình và trao đổi các bản mã.
(iii) Hệ thống so khớp các bản mã để tìm ra tập giao điểm.
(iv) Hai bên chỉ biết được danh sách các ID nằm trong tập để bắt đầu giai đoạn huấn luyện. Thông tin về các ID thuộc tập và được bảo mật tuyệt đối.
Đối với bài toán chấm điểm tín dụng với dữ liệu dạng bảng, các thuật toán học máy dạng cây quyết định nâng cao, tiêu biểu như SecureBoost được đánh giá là hiệu quả nhất hiện nay. Quy trình huấn luyện trong VFL diễn ra qua các bước lặp được bảo vệ bằng mã hóa đồng hình (kỹ thuật cho phép tính toán trực tiếp trên dữ liệu đang bị khóa - Homomorphic Encryption) (Naresh, 2026), cụ thể:
(i) Tính toán sai số cục bộ: Ngân hàng tính toán sai số và đạo hàm bậc nhất/bậc hai dựa trên nhãn của mình. Các giá trị này được mã hóa bằng khóa công khai (Public Key) của hệ mã hóa đồng hình và gửi sang đối tác.
(ii) Tìm điểm phân chia tối ưu: Đối tác (công ty viễn thông hoặc sàn thương mại điện tử) sử dụng các thông số đã mã hóa nhận được từ ngân hàng để tính toán độ lợi thông tin cho các đặc trưng dữ liệu hành vi của mình như thói quen mua sắm, nạp thẻ. Do tính chất của mã hóa đồng hình, đối tác có thể thực hiện phép cộng trên dữ liệu mã hóa để tổng hợp sai số cho các tập dữ liệu mà không thể giải mã giá trị thực của đạo hàm bậc nhất/bậc hai phía trên.
(iii) Cập nhật mô hình: Chỉ có cấu trúc cây và trọng số các nút lá được cập nhật. Dữ liệu đặc trưng của đối tác không bao giờ rời khỏi máy chủ của họ, và nhãn của ngân hàng không bị tiết lộ cho đối tác.
Hiệu quả trong Phân loại khách hàng "Thin-file"
Ứng dụng VFL cho phép giải quyết triệt để vấn đề "Cold-Start" (Khởi đầu lạnh) trong tín dụng. Các biến số thay thế như tần suất thanh toán cước viễn thông đúng hạn hay tỉ lệ hoàn hàng thấp trên sàn thương mại điện tử có giá trị dự báo cao đối với nhóm khách hàng chưa có lịch sử tín dụng. Các kết quả thực nghiệm quốc tế cho thấy mô hình VFL kết hợp dữ liệu ngân hàng - viễn thông có thể cải thiện độ chính xác (chỉ số KS - Kolmogorov-Smirnov) từ 10 - 15% so với mô hình đơn lẻ, giúp tổ chức tín dụng phân loại chính xác hơn rủi ro của nhóm khách hàng phổ thông, từ đó mở rộng tệp khách hàng phê duyệt mà vẫn kiểm soát được tỉ lệ nợ xấu ở mức an toàn (Paliska, 2025). Đây là cơ sở khoa học quan trọng để các ngân hàng tham gia Cơ chế thử nghiệm có kiểm soát (Sandbox) theo Nghị định số 94/2025/NĐ-CP.
4. Ứng dụng HFL trong mạng lưới phát hiện gian lận liên ngân hàng
HFL là mô hình phù hợp nhất cho bài toán phát hiện gian lận vì các NHTM đều sở hữu cấu trúc dữ liệu giao dịch tương đồng (bao gồm số tài khoản, thời gian, số tiền, địa điểm, thiết bị) nhưng lại có không gian mẫu khách hàng riêng biệt và không trùng lặp (ví dụ: Khách hàng của Vietcombank khác với khách hàng của NHTM cổ phần Tiên Phong (TPBank). Mục tiêu của mạng lưới HFL là huấn luyện một mô hình phát hiện gian lận toàn cục có khả năng nhận diện các mẫu hình tấn công mới dựa trên tri thức tổng hợp từ tất cả các ngân hàng thành viên mà không cần chia sẻ dữ liệu giao dịch chi tiết.
Quy trình vận hành của mạng lưới HFL diễn ra theo chu kỳ lặp như sau:
- Huấn luyện cục bộ (Local Training): Mỗi ngân hàng sử dụng dữ liệu lịch sử gian lận nội bộ để huấn luyện mô hình cục bộ, sử dụng thuật toán học máy nào đó (ví dụ: Deep Neural Network hoặc XGBoost).
- Tổng hợp tham số (Secure Aggregation): Thay vì gửi dữ liệu thô, các ngân hàng chỉ gửi các cập nhật trọng số mô hình (gradients) về máy chủ trung tâm do một đơn vị trung gian uy tín quản lý (như Công ty cổ phần Thanh toán Quốc gia Việt Nam - NAPAS hoặc Trung tâm Thông tin tín dụng Quốc gia Việt Nam - CIC).
- Cập nhật toàn cục: Máy chủ trung tâm sử dụng một số thuật toán như trung bình hóa trọng số - FedAvg (Federated Averaging) hoặc tối ưu hóa tiệm cận - FedProx (Federated Proximal) (P. Takkalapally, 2025) để tổng hợp các trọng số này, tạo ra một mô hình toàn cục mới thông minh hơn.
- Phân phối lại: Mô hình toàn cục được gửi ngược lại cho các ngân hàng để cập nhật hệ thống phòng thủ của mình.
- Giá trị thực tiễn: Nếu Ngân hàng A phát hiện một thủ đoạn gian lận mới (chẳng hạn như tấn công qua mã độc Android giả mạo), mô hình tại A sẽ "học" được đặc trưng này. Thông qua HFL, Ngân hàng B - dù chưa từng gặp thủ đoạn này - sẽ nhận được bản cập nhật mô hình chứa tri thức đó và có khả năng ngăn chặn cuộc tấn công tương tự ngay lập tức. Đây là cơ chế phòng thủ chủ động theo thời gian thực
Ngoài ra, để ngăn chặn nguy cơ rò rỉ thông tin từ chính các tham số mô hình, kỹ thuật mã hóa đồng hình (Naresh, 2026) cũng thường được sử dụng. Kỹ thuật mã hóa này cho phép máy chủ trung tâm thực hiện các phép toán cộng/nhân trực tiếp trên các tham số đã được mã hóa mà không cần giải mã chúng. Điều này đảm bảo rằng ngay cả đơn vị vận hành máy chủ như NAPAS cũng không thể biết được đặc điểm dữ liệu cụ thể của từng ngân hàng thành viên.
5. Thách thức triển khai và khuyến nghị chiến lược
Mặc dù FL mang lại lời giải thuyết phục cho bài toán bảo mật dữ liệu, việc chuyển đổi từ mô hình lý thuyết sang vận hành thực tế tại hệ thống ngân hàng Việt Nam vẫn đối mặt với những rào cản kỹ thuật và vận hành. Phần này tổng hợp các thách thức trọng yếu đồng thời đề xuất lộ trình chiến lược cho các bên liên quan.
5.1. Rào cản kỹ thuật và vận hành
Để hiện thực hóa mạng lưới FL, các tổ chức tài chính cần giải quyết ba nút thắt chính:
Thứ nhất, vấn đề dữ liệu không đồng nhất (Non-IID): Sự chênh lệch lớn về quy mô và đặc điểm khách hàng giữa các ngân hàng (ví dụ: giữa bốn NHTM lớn so với các NHTM cổ phần nhỏ) dẫn đến nguy cơ mô hình toàn cục bị thiên lệch (bias), làm giảm độ chính xác khi áp dụng cục bộ. Vì vậy, cần áp dụng các thuật toán tối ưu hóa thích ứng như FedProx để đảm bảo mô hình hội tụ ổn định ngay cả khi bị phân mảnh dữ liệu.
Thứ hai, chi phí tính toán và truyền thông: Việc áp dụng mã hóa đồng hình (Homomorphic Encryption) để bảo vệ tham số làm tăng gánh nặng tính toán lên gấp nhiều lần, đòi hỏi hạ tầng phần cứng chuyên dụng (AI Accelerators/GPU) tại các điểm nút.
Thứ ba, rủi ro "đầu độc" mô hình (Model Poisoning): Môi trường phân tán tiềm ẩn nguy cơ bị tấn công bởi các thành viên xấu hoặc tin tặc xâm nhập, cố tình gửi các tham số sai lệch để phá hoại hệ thống phòng thủ chung. Điều này đòi hỏi cơ chế kiểm tra tính hợp lệ nghiêm ngặt tại máy chủ trung tâm.
5.2. Khuyến nghị chính sách
Dựa trên bối cảnh pháp lý hiện hành, đặc biệt là Luật Bảo vệ dữ liệu cá nhân năm 2025 và Nghị định số 94/2025/NĐ-CP, nghiên cứu đề xuất một số định hướng chính sách như sau:
Đối với Ngân hàng Nhà nước (NHNN)
Ban hành bộ tiêu chuẩn kỹ thuật thống nhất cho việc triển khai FL, trong đó quy định rõ các thuật toán mã hóa được chấp nhận và cơ chế xác thực thành viên tham gia mạng lưới.
Với vai trò điều phối, NHNN hoặc một đơn vị được ủy quyền như NAPAS, CIC nên đảm nhiệm vai trò là "Host" vận hành máy chủ tổng hợp, đảm bảo tính trung lập và tin cậy cho toàn hệ thống.
Đối với các NHTM
Trước hết, các ngân hàng nên tham gia Sandbox, chủ động đăng ký thử nghiệm các mô hình chấm điểm tín dụng đa nguồn và chia sẻ dữ liệu qua giao diện lập trình mở (Open AI), qua đó được bảo đảm khung pháp lý trong giai đoạn đầu. Đồng thời, các ngân hàng cần ưu tiên Chiến lược "Cloud-First", đầu tư nâng cấp hạ tầng đám mây và tính toán tại biên để sẵn sàng cho yêu cầu xử lý phức tạp của FL. Cùng với đó là tăng cường hợp tác đa ngành, mở rộng liên kết với các công ty công nghệ tài chính (Fintech), viễn thông để làm giàu dữ liệu huấn luyện, chuyển dịch từ cạnh tranh đối đầu sang mô hình "Hợp tác - Cạnh tranh" (Coopetition).
6. Kết luận
FL không chỉ là một giải pháp công nghệ tình thế, mà là nền tảng kiến trúc cho một kỷ nguyên tài chính mới - kỷ nguyên của "AI cộng tác" (Collaborative AI). Bằng cách cho phép khai thác tri thức tập thể mà vẫn tôn trọng tuyệt đối chủ quyền dữ liệu, FL giúp ngành Ngân hàng Việt Nam giải quyết triệt để mâu thuẫn giữa tăng trưởng kinh doanh và tuân thủ pháp luật. Việc triển khai đồng bộ mô hình HFL (cho phát hiện gian lận liên ngân hàng) và VFL (cho chấm điểm tín dụng đa nguồn) sẽ chuyển đổi căn bản ngành tài chính từ trạng thái "cạnh tranh dựa trên sở hữu dữ liệu" sang "hợp tác dựa trên chia sẻ tri thức". Đây là nền tảng tiên quyết để xây dựng một hệ sinh thái tài chính minh bạch, an toàn và toàn diện, giúp giảm thiểu hàng nghìn tỉ đồng thiệt hại do gian lận mỗi năm và hiện thực hóa mục tiêu quốc gia về tài chính toàn diện đến năm 2030.
Tài liệu tham khảo:
1. Luật Bảo vệ dữ liệu cá nhân năm 2025.
2. Naresh, V. A. (2026), Privacy-preserving federated credit risk models: evaluating differential privacy and homomorphic encryption techniques, Scientific Reports. doi:10.1038/s41598-025-34536-9
3. Nghị định số 94/2025/NĐ-CP ngày 29/4/2025 của Chính phủ quy định về Cơ chế thử nghiệm có kiểm soát trong lĩnh vực ngân hàng.
4. Nguyen Thi Thu Trang, T. T. (2025), Big Data Applications in Banking Sector in Vietnam Today, Engineering and Technology Journal, 5249-5254, doi:10.47191/etj/v10i05.53
5. P. Takkalapally, J. K. (2025), Federated Learning for Privacy-Preserving Fraud Detection in Cross-Bank Systems, 3rd International Conference on Intelligent Cyber Physical Systems and Internet of Things (ICoICI) (pages 600-604). Coimbatore: IEEE.
6. Paliska, W. (2025), Scoring the Unscorable: Why Thin-File Borrowers Are Your Next Growth Market,
https://dotdata.com/blog/thin-file-borrowers-are-your-next-growth-market/
7. Phong Anh Hoang, P. K. (2025), Vietnam: New Decree No. 94/2025/ND-CP creating a “Regulatory Sandbox” in the Banking Sector, https://www.dfdl.com/insights/legal-and-tax-updates/vietnam-new-decree-no-94-2025-nd-cp-on-regulatory-sandbox-in-the-banking-sector/
8. Sondeck, L. L. (2025), Practical and ready-to-use methodology to assess the re-identification risk in anonymized datasets. Scientific Reports, 15(1), 23223. doi:10.1038/s41598-025-04907-3
9. Techcombank (2024), Techcombank ushers in a new era of AI-powered banking at its first ever Techcombank Keynote. From https://techcombank.com/: https://techcombank.com/en/information/updates/techcombank-ushers-in-a-new-era-of-ai-powered-banking-at-its-first-ever-techcombank-keynote
10. Tran Binh, T. D. (2026), Online scams inflict losses exceeding VND6 trillion in Vietnam in 2025,
https://en.sggp.org.vn/online-scams-inflict-losses-exceeding-vnd6-trillion-in-vietnam-in-2025-post123051.html
11. Yizhi Zhou, J. W. (2025), Federated Learning with complete service commitment of data heterogeneity, Knowledge-Based Systems, 112937.
12. Zhongyi Wang, J. X. (2024), A novel federated learning approach with knowledge transfer for credit scoring, Decision Support Systems, 114084.
Tin bài khác
Những xu hướng tái định hình ngành công nghiệp an ninh mạng toàn cầu
Nhận tài sản số để bảo đảm thực hiện nghĩa vụ trả nợ trong hoạt động cấp tín dụng của tổ chức tín dụng
Ứng dụng trí tuệ nhân tạo tác nhân khi ra quyết định tài chính trong ngân hàng hiện đại
Hoàn thiện pháp lý về ứng dụng trí tuệ nhân tạo trong hành trình chuyển đổi số ngân hàng
Chuyển đổi số ngân hàng: Tiếp tục ưu tiên phát triển hạ tầng số, kết nối liên thông dữ liệu
Ứng dụng phân tích dữ liệu và học máy nhằm nâng cao hiệu quả tuân thủ chống rửa tiền trong ngân hàng
Thành công trong chuyển đổi số ngành Ngân hàng năm 2025 - Nền tảng cho phát triển an toàn, bền vững hệ thống tài chính
Cú sốc giá dầu và phản ứng của ngân hàng trung ương: Tổng quan lý thuyết, bằng chứng lịch sử và hàm ý chính sách
Pháp luật về công chứng điện tử đối với hợp đồng thế chấp bất động sản tại tổ chức tín dụng: Bảo đảm tính khả thi trong thực tiễn áp dụng
Hoàn thiện khung pháp lý cho Ngân hàng Chính sách xã hội Việt Nam trong bối cảnh phát triển kinh tế bền vững
Pháp luật về thúc đẩy ESG trong lĩnh vực ngân hàng tại Việt Nam: Thực trạng và kiến nghị hoàn thiện
Nghiên cứu ảnh hưởng của an ninh năng lượng, biến động giá xăng dầu tới lạm phát ở Việt Nam
Cú sốc giá dầu và phản ứng của ngân hàng trung ương: Tổng quan lý thuyết, bằng chứng lịch sử và hàm ý chính sách
Từ hệ thống thanh toán truyền thống đến tài sản kỹ thuật số: Cách tiếp cận từ Đạo luật về Hiện đại hóa hệ thống thanh toán năm 2025 của Úc
Vai trò của các yếu tố phi ngôn ngữ trong hoạt động truyền thông của Cục Dự trữ Liên bang Mỹ và hàm ý đối với thị trường tài chính toàn cầu
Tăng cường quản trị rủi ro trong chính sách tiền tệ tại Ngân hàng Trung ương Canada và một số bài học kinh nghiệm đối với Việt Nam

