
Ứng dụng dữ liệu lớn, học máy trong hoạt động ngân hàng: Thực trạng, thách thức và khuyến nghị
Tóm tắt: Trong kỷ nguyên số, dữ liệu lớn và học máy đang tạo ra những thay đổi sâu sắc trong hoạt động ngân hàng. Bằng phương pháp nghiên cứu định tính thông qua việc lược khảo tài liệu/nghiên cứu có liên quan, phương pháp phân tích tài liệu/nội dung, phân tích theo chủ đề, phân tích tình huống và phỏng vấn sâu chuyên gia; bài viết tổng hợp một cách có hệ thống ứng dụng của dữ liệu lớn và học máy trong hoạt động ngân hàng, đồng thời phân tích thực tiễn từ các ngân hàng trên thế giới để làm rõ tiềm năng, thách thức của việc ứng dụng này, từ đó, đưa ra khuyến nghị cụ thể nhằm hỗ trợ ngân hàng khai thác hiệu quả dữ liệu lớn và học máy, góp phần thúc đẩy sự phát triển bền vững của ngành Ngân hàng trong kỷ nguyên số.
Từ khóa: Dữ liệu lớn, học máy, ngân hàng.
APPLICATION OF BIG DATA, MACHINE LEARNING IN BANKING OPERATIONS: CURRENT STATUS, CHALLENGES AND RECOMMENDATIONS
Abstract: In the digital age, Big Data and Machine Learning are profoundly transforming the banking industry. Employing a qualitative research approach through a comprehensive review of relevant literature and studies, along with content analysis, thematic analysis, case study analysis, and in-depth expert interviews, this article systematically synthesizes the applications of Big Data and Machine Learning in banking operations. Additionally, it analyzes real-world cases from international commercial banks to highlight the potential and challenges associated with such applications. Based on these findings, the article identifies key challenges and proposes several recommendations to assist banks in effectively harnessing Big Data and Machine Learning, thereby contributing to the sustainable development of the banking industry in the digital era.
Keywords: Big Data, Machine Learning, banking.
1. Giới thiệu
Theo Economist (2017), trong kỷ nguyên số, dữ liệu đã vượt qua dầu mỏ để trở thành nguồn tài nguyên quý giá nhất. Sự phát triển vượt bậc của công nghệ thông tin và truyền thông (ICT), cùng với sự bùng nổ của dữ liệu lớn và trí tuệ nhân tạo (AI), đang tạo ra những thay đổi mang tính cách mạng trên nhiều lĩnh vực, đặc biệt là trong ngành Ngân hàng (Hoàng Công Gia Khánh và cộng sự, 2019). Sự hội tụ của những công nghệ này hứa hẹn sẽ tái định hình toàn diện hoạt động ngân hàng, mở ra những cơ hội phát triển mới.
Ở góc độ vận hành, ngân hàng được xem là trung tâm xử lý thông tin, giao dịch tài chính và đang chứng kiến một cuộc cách mạng dữ liệu chưa từng có. Dữ liệu lớn và AI, đặc biệt là học máy, không chỉ đơn thuần là công cụ hỗ trợ mà còn là động lực then chốt định hình tương lai của ngành Ngân hàng. Tại Việt Nam, sự quan tâm đến dữ liệu lớn và học máy trong ngân hàng đang gia tăng nhanh chóng, từ các cá nhân, doanh nghiệp cho đến các cơ quan quản lý (Hoàng Công Gia Khánh và cộng sự, 2019).
Việc ứng dụng dữ liệu lớn, học máy trong hoạt động ngân hàng ngày càng trở nên phổ biến, được thúc đẩy bởi nhu cầu nâng cao trải nghiệm của khách hàng, cải thiện quản lý rủi ro và tối ưu hóa hiệu quả hoạt động. Tuy nhiên, việc ứng dụng dữ liệu lớn và học máy trong hoạt động ngân hàng vẫn còn những thách thức. Những thách thức này sẽ là tác nhân ảnh hưởng đến việc ứng dụng và khai thác lợi ích của dữ liệu lớn và học máy trong ngân hàng. Do đó, việc nghiên cứu về ứng dụng dữ liệu lớn và học máy trong hoạt động ngân hàng là vô cùng cần thiết.
2. Phương pháp nghiên cứu
Nghiên cứu sử dụng phương pháp định tính để đạt được các mục tiêu đề ra. Đầu tiên, nghiên cứu thực hiện việc lược khảo các tài liệu có liên quan với phương pháp phân tích tài liệu/nội dung, phân tích theo chủ đề để rút ra những điểm chính về ứng dụng của dữ liệu lớn và học máy trong hoạt động ngân hàng. Tiếp đến, nghiên cứu thực hiện phân tích tình huống để làm rõ những ứng dụng điển hình về dữ liệu lớn và học máy của một số ngân hàng trên thế giới. Sau đó, nghiên cứu thực hiện phỏng vấn sâu chuyên gia công nghệ thông tin (IT) ngân hàng. Trong nghiên cứu này, tác giả lựa chọn đối tượng để phỏng vấn sâu dựa trên kỹ thuật chọn mẫu có mục đích với một số tiêu chí sau: (1) Có tối thiểu 3 năm kinh nghiệm làm việc trong lĩnh vực IT, chuyển đổi số ngân hàng, (2) Đang là chuyên gia đối với công việc IT, chuyển đổi số tại ngân hàng, (3) Là lãnh đạo/quản lý cấp trung phụ trách IT, chuyển đổi số của ngân hàng. Để nghiên cứu có được những thông tin đầy đủ trong điều kiện nguồn lực có hạn, tác giả sử dụng cỡ mẫu nhỏ với 5 mẫu được xây dựng một cách có chọn lọc dựa trên quy luật bảo đảm tính bão hòa thông tin từ số mẫu (Cormack, 2010; Trần Mai Đông và cộng sự, 2020). Mục đích của việc phỏng vấn sâu là để đúc kết những thách thức và đề xuất khuyến nghị trong việc ứng dụng dữ liệu lớn và học máy của các ngân hàng.
3. Lược khảo các nghiên cứu liên quan
Nghiên cứu của Delgosha và cộng sự (2020) làm rõ vai trò của phân tích dữ liệu lớn (Big Data Analytics - BDA) trong ngành Ngân hàng, đặc biệt là các ứng dụng, động lực chính, thách thức trong việc triển khai BDA. Mặc dù, BDA mang lại nhiều lợi ích tiềm năng, nhưng các ngân hàng vẫn chưa hiểu đầy đủ về các ứng dụng, động lực và thách thức liên quan đến việc triển khai. Nghiên cứu của Delgosha và cộng sự (2020) nhằm thu hẹp khoảng cách này bằng cách cung cấp một cái nhìn toàn diện về BDA trong ngành Ngân hàng.
Nghiên cứu sử dụng phương pháp Delphi bốn giai đoạn, một kỹ thuật được áp dụng rộng rãi để thu thập, tổng hợp ý kiến của các chuyên gia, nhằm xác định và xếp hạng ứng dụng, động lực và thách thức của BDA. Dữ liệu được thu thập thông qua những cuộc phỏng vấn bán cấu trúc với các chuyên gia (25 chuyên gia) trong lĩnh vực số liệu lớn và ngân hàng. Các câu trả lời phỏng vấn đã được phân tích nội dung để xác định ứng dụng, động lực và thách thức chính của BDA.
Nghiên cứu đã xác định 9 ứng dụng BDA quan trọng, 6 động lực và 18 thách thức. Các ứng dụng quan trọng nhất là “phát hiện gian lận” và “phân tích rủi ro tín dụng”. Các động lực chính là “cải thiện quá trình ra quyết định” và “phát triển sản phẩm/dịch vụ mới”.
Hu và cộng sự (2020) nghiên cứu các kỹ thuật học máy có giám sát (Supervised Machine Learning - SML) và ứng dụng của SML trong lĩnh vực ngân hàng, với sự tập trung vào các thuật toán như Bagging (Random Forest), Boosting (Gradient Boosting Machine) và mạng nơ-ron nhân tạo (Neural Networks).
Với sự phát triển mạnh mẽ của khả năng xử lý dữ liệu và các công cụ phần mềm mã nguồn mở, ngành Ngân hàng đã chứng kiến sự gia tăng đáng kể trong việc áp dụng các thuật toán học máy để cải thiện độ chính xác của các mô hình dự đoán. Việc nghiên cứu, ứng dụng các kỹ thuật học máy tiên tiến trở nên cần thiết để cải thiện khả năng quản lý rủi ro và tối ưu hóa các quyết định tài chính.
Thông qua việc so sánh kỹ thuật học máy khác nhau trên các tập dữ liệu ngân hàng thực tế, bao gồm cả những ví dụ từ mô hình rủi ro tín dụng. Nghiên cứu đã phân tích và so sánh kết quả của các mô hình dựa trên tiêu chí như độ chính xác dự đoán, khả năng giải thích. Kết quả nghiên cứu cho thấy, kỹ thuật học máy như rừng ngẫu nhiên (Random Forest) cung cấp độ chính xác dự đoán cao hơn so với các mô hình truyền thống như hồi quy logistic. Đặc biệt, các mô hình học máy có khả năng tự động hóa những bước lựa chọn biến và xử lý dữ liệu, giúp giảm thiểu thời gian, công sức so với phương pháp truyền thống.
Carbo Valverde và cộng sự (2020) nghiên cứu quá trình số hóa khách hàng ngân hàng thông qua việc ứng dụng các thuật toán học máy, đặc biệt tập trung vào việc dự đoán và phân tích các yếu tố quyết định sự chuyển đổi số của khách hàng.
Số hóa đang thay đổi mạnh mẽ ngành Ngân hàng, với việc sử dụng ngân hàng kỹ thuật số (trực tuyến và di động) ngày càng trở nên phổ biến. Tuy nhiên, quá trình số hóa của khách hàng còn khá phức tạp. Nghiên cứu của Carbo Valverde và cộng sự (2020) nhằm mục đích khám phá quá trình này để cung cấp thông tin chi tiết cho các ngân hàng và các nhà hoạch định chính sách.
Nghiên cứu sử dụng lý thuyết về chấp nhận công nghệ (Technology Acceptance Model - TAM) và các lý thuyết liên quan để xây dựng khung nghiên cứu. Nghiên cứu cũng sử dụng các thuật toán học máy tiên tiến như: Random Forests, cây suy luận có điều kiện (Conditional Inference Trees) và rừng nhân quả (Causal Forests) để dự đoán và xác định các yếu tố ảnh hưởng đến quá trình số hóa khách hàng ngân hàng.
Nghiên cứu sử dụng phương pháp học máy để phân tích dữ liệu khảo sát từ 3.005 người tiêu dùng ở Tây Ban Nha. Các thuật toán như Random Forests, Conditional Inference Trees và Causal Forests được sử dụng để dự đoán quá trình số hóa, minh họa quá trình ra quyết định của người tiêu dùng và khám phá mối quan hệ nhân quả.
Kết quả nghiên cứu cho thấy, thuật toán Random Forests có hiệu suất cao nhất, với độ chính xác 88,41% trong việc dự đoán sự chấp nhận và sử dụng ngân hàng trực tuyến của khách hàng. Nghiên cứu chỉ ra rằng, quá trình số hóa bắt đầu với việc sử dụng các dịch vụ thông tin (như kiểm tra số dư tài khoản), sau đó chuyển sang các dịch vụ giao dịch (như chuyển tiền trực tuyến/di động). Sự đa dạng hóa trong việc sử dụng các kênh trực tuyến được giải thích bởi nhận thức về phạm vi dịch vụ có sẵn và nhận thức về an toàn.
Wen và cộng sự (2021) nghiên cứu việc ứng dụng dữ liệu lớn trong Internet vạn vật (IoT) để đánh giá và cảnh báo sớm rủi ro tín dụng trong ngành tài chính.
Sự phát triển của công nghệ dữ liệu lớn và IoT đã mang lại cơ hội cải thiện quá trình đánh giá tín dụng và cảnh báo sớm rủi ro trong ngành tài chính. Nghiên cứu của Wen và cộng sự (2021) nhằm mục đích khai thác tiềm năng này để nâng cao hiệu quả và độ chính xác của các quy trình.
Nghiên cứu sử dụng công nghệ máy tìm kiếm phân tán để thu thập dữ liệu thẻ ngân hàng và giao dịch, sau đó sử dụng thuật toán Spark để tiền xử lý dữ liệu. Phương pháp phân tích MECE (Mutually Exclusive Collectively Exhaustive) được sử dụng để xác định các chỉ số đánh giá rủi ro tín dụng. Thuật toán Random Forest được sử dụng để lựa chọn đặc trưng và một thuật toán quy tắc kết hợp không gian đa cấp được thiết kế để khai thác thông tin rủi ro. Cuối cùng, thuật toán bầy đàn hạt (Particle Swarm Optimization - PSO) được sử dụng để tối ưu hóa tham số của mô hình Random Forests.
Dữ liệu được sử dụng trong nghiên cứu bao gồm 26 chỉ số tài chính, các dữ liệu này được thu thập và xử lý bằng phần mềm thống kê SPSS và các công cụ dữ liệu lớn.
Kết quả nghiên cứu cho thấy, việc áp dụng các phương pháp học máy, đặc biệt là thuật toán Random Forests tối ưu hóa bằng PSO có thể cải thiện đáng kể độ chính xác trong việc đánh giá rủi ro tín dụng. Mô hình này giúp giảm tỉ lệ lỗi loại 1 và loại 2, từ đó hỗ trợ các ngân hàng trong việc quản lý rủi ro hiệu quả hơn.
Petropoulos và cộng sự (2020) nghiên cứu một số phương pháp sử dụng học máy để dự đoán tình trạng mất khả năng thanh toán của các ngân hàng, tập trung vào việc so sánh hiệu quả của các mô hình khác nhau trong việc dự báo phá sản ngân hàng.
Sự ổn định của hệ thống ngân hàng là mối quan tâm hàng đầu của các cơ quan giám sát tài chính. Việc dự báo chính xác tình trạng mất khả năng thanh toán của ngân hàng có thể giúp giảm thiểu rủi ro hệ thống và ngăn chặn các cuộc khủng hoảng tài chính lan rộng. Nghiên cứu của Petropoulos và cộng sự (2020) cung cấp một hệ thống cảnh báo sớm (Early Warning System) hiệu quả hơn để hỗ trợ các cơ quan giám sát.
Nghiên cứu sử dụng dữ liệu về các tổ chức tài chính có trụ sở tại Mỹ, bao gồm các biến số liên quan đến CAMELS (vốn, chất lượng tài sản, quản lý, thu nhập, thanh khoản và độ nhạy cảm với rủi ro thị trường). Các mô hình thống kê truyền thống như Logistic Regression và Linear Discriminant Analysis, cũng như các kỹ thuật học máy tiên tiến như Random Forests, Support Vector Machines (SVM), Neural Networks (NN) và Conditional Random Forests được sử dụng để đạt được mục tiêu nghiên cứu.
Kết quả nghiên cứu cho thấy, mô hình Random Forests có hiệu suất dự đoán cao nhất trong việc phát hiện các ngân hàng có khả năng mất thanh toán, vượt trội so với các mô hình khác như Logistic Regression và Máy Vector hỗ trợ (Support Vector Machine - SVM). Các chỉ số liên quan đến vốn và lợi nhuận (như Leverage Ratio và ROE) là những yếu tố quan trọng nhất trong việc dự đoán rủi ro phá sản của ngân hàng.
Tay và Mourad (2020) nghiên cứu việc tối ưu hóa quy trình nghiệp vụ của nhân viên giao dịch ngân hàng bằng cách sử dụng các chính sách điều khiển thích ứng dựa trên hiệu suất và học máy.
Quy trình hiện tại của các ngân hàng thường dựa trên mô hình kiểm soát truy cập tĩnh, thiếu tính năng cập nhật tự động và thích ứng với hiệu suất thực tế của nhân viên. Điều này dẫn đến sự chậm trễ trong xử lý giao dịch và không tối ưu hóa được hiệu suất làm việc của nhân viên. Việc nghiên cứu, áp dụng các kỹ thuật học máy để tối ưu hóa quá trình này của Tay và Mourad (2020) là cần thiết để cải thiện hiệu quả và sự hài lòng của khách hàng.
Nghiên cứu áp dụng các kỹ thuật học máy, đặc biệt là SVM để đánh giá và dự đoán hiệu suất của nhân viên giao dịch ngân hàng dựa trên lịch sử làm việc và hiệu suất của họ.
Dữ liệu được thu thập từ môi trường ngân hàng thực tế, bao gồm 303.710 giao dịch được thực hiện bởi 47 nhân viên giao dịch trong suốt năm 2019. Các dữ liệu này bao gồm các thông tin về vai trò của nhân viên, số lượng giao dịch, độ phức tạp của giao dịch và tỉ lệ lỗi.
Kết quả cho thấy, mô hình SVM có độ chính xác cao nhất trong việc dự đoán hiệu suất của nhân viên, với độ chính xác đạt 88,07%. Việc áp dụng các chính sách kiểm soát thích ứng đã giúp giảm đáng kể thời gian xử lý giao dịch, tăng cường hiệu suất và sự hài lòng của khách hàng.
González Carrasco và cộng sự (2019) đã tập trung vào vấn đề phát hiện tự động mối quan hệ giữa các giao dịch ngân hàng, một bài toán quan trọng trong bối cảnh dữ liệu lớn và AI đang được ứng dụng ngày càng rộng rãi trong lĩnh vực tài chính - ngân hàng.
Xuất phát từ thực tế các chi nhánh ngân hàng thường xuyên phải ghi nhận giao dịch trên nhiều hệ thống khác nhau, dẫn đến tình trạng một giao dịch có thể được ghi lại nhiều lần với các thuộc tính khác nhau. Việc này gây khó khăn cho công tác kiểm soát và đối chiếu giao dịch, đặc biệt là khi số lượng giao dịch lớn và không thể xử lý thủ công một cách hiệu quả.
González Carrasco và cộng sự (2019) đã sử dụng các thuật toán phân loại như mạng nơ-ron nhân tạo (ANN), SVM và Random Forests để xây dựng một mô hình có khả năng tự động học và nhận dạng các mẫu trong dữ liệu giao dịch, từ đó phát hiện các giao dịch liên quan đến cùng một hoạt động ngân hàng.
Nghiên cứu giới thiệu một khung phân tích mới dựa trên học máy trong môi trường dữ liệu lớn. Khung này bao gồm ba giai đoạn: Tiền xử lý để chuẩn hóa và tổ chức dữ liệu, xử lý học máy để phát hiện mối quan hệ và hậu xử lý để cung cấp thông tin chi tiết cho các phân tích kinh doanh.
Dữ liệu sử dụng trong nghiên cứu bao gồm các ghi nhận giao dịch từ nhiều chi nhánh ngân hàng quốc tế, được lưu trữ trong kho dữ liệu tập trung. Dữ liệu này được xử lý qua các bước chuẩn hóa và chuẩn bị để phục vụ cho quá trình huấn luyện và kiểm tra mô hình học máy.
Kết quả nghiên cứu cho thấy, mô hình đề xuất đã thành công trong việc phát hiện mối quan hệ giữa các giao dịch ngân hàng khác nhau, ngay cả khi dữ liệu không đồng nhất và có khối lượng lớn. Các mô hình học máy áp dụng đã đạt được độ chính xác cao trong phân loại và phát hiện mối quan hệ giữa các giao dịch.
Hung và cộng sự (2020) đã tập trung vào vấn đề ứng dụng phân tích dữ liệu lớn để cải thiện hoạt động tài trợ chuỗi cung ứng và hiệu quả tiếp thị trong ngành Ngân hàng. Trong bối cảnh các ngân hàng sở hữu khối lượng lớn dữ liệu khách hàng, việc tận dụng phân tích dữ liệu lớn để tối ưu hóa mối quan hệ chuỗi cung ứng có thể giúp ngân hàng không chỉ cải thiện các dịch vụ hiện có mà còn phát triển nhiều cơ hội kinh doanh mới.
Hung và cộng sự (2020) sử dụng lý thuyết về phân tích dữ liệu lớn, lý thuyết về chuỗi cung ứng tài chính để nghiên cứu cách ngân hàng có thể phát hiện khách hàng tiềm năng và cải thiện dịch vụ dành cho khách hàng doanh nghiệp hiện tại thông qua các mối quan hệ chuỗi cung ứng.
Phương pháp nghiên cứu được sử dụng là nghiên cứu tình huống, tập trung vào một ngân hàng thương mại lớn ở châu Á. Nghiên cứu phân tích hai loại mối quan hệ chuỗi cung ứng:
(1) Mối quan hệ trong báo cáo tín dụng; (2) Giao dịch chuyển tiền điện tử giữa các công ty trong chuỗi cung ứng. Dựa trên mạng lưới các mối quan hệ này, ngân hàng đã triển khai một chiến dịch tiếp thị nhằm thu hút khách hàng doanh nghiệp vay vốn mới. Dữ liệu được sử dụng trong nghiên cứu bao gồm các báo cáo tín dụng và giao dịch điện tử giữa các công ty trong chuỗi cung ứng của ngân hàng.
Kết quả nghiên cứu cho thấy, việc sử dụng phân tích dữ liệu lớn giúp ngân hàng cải thiện đáng kể hiệu quả của các chiến dịch tiếp thị và quản lý rủi ro. Ngân hàng đã phát hiện ra nhiều khách hàng tiềm năng và cải thiện tỉ lệ phê duyệt các khoản vay thông qua việc phân tích các mối quan hệ trong chuỗi cung ứng. Hơn nữa, kết quả nghiên cứu cũng chỉ ra khách hàng mới và khách hàng sử dụng nhiều sản phẩm của ngân hàng có xu hướng phản hồi tích cực hơn với các chiến dịch tiếp thị.
4. Một số đúc kết về ứng dụng dữ liệu lớn và học máy trong hoạt động ngân hàng
Từ kết quả lược khảo các nghiên cứu đã thực hiện có liên quan, có thể đúc kết một số thông tin chính về ứng dụng dữ liệu lớn và học máy trong lĩnh vực ngân hàng như sau:
Một là, phát hiện gian lận và phân tích rủi ro tín dụng.
Dữ liệu lớn và học máy được sử dụng rộng rãi để phát hiện gian lận và phân tích rủi ro tín dụng, đây được coi là những ứng dụng quan trọng nhất trong lĩnh vực ngân hàng (Delgosha và cộng sự, 2020; Hu và cộng sự, 2020).
Các kỹ thuật như Random Forests và mạng nơ-ron đặc biệt hiệu quả trong việc dự đoán khả năng mất khả năng thanh toán của ngân hàng và rủi ro tín dụng (Wen và cộng sự, 2021; Petropoulos và cộng sự, 2020).
Hai là, trải nghiệm khách hàng và số hóa.
Các mô hình học máy giúp hiểu và nâng cao quy trình số hóa của khách hàng ngân hàng, dự đoán việc sử dụng ngân hàng trực tuyến và cá nhân hóa các dịch vụ kỹ thuật số (González Carrasco và cộng sự, 2019; Carbó Valverde và cộng sự, 2020).
Việc sử dụng các dịch vụ ngân hàng kỹ thuật số thường bắt đầu bằng những dịch vụ dựa trên thông tin và tiến tới dịch vụ giao dịch, chịu ảnh hưởng bởi nhận thức của khách hàng và nhận thức về an toàn (Carbó Valverde và cộng sự, 2020).
Ba là, quản trị chiến lược và ra quyết định.
Phân tích dữ liệu lớn hỗ trợ quản trị chiến lược bằng cách cho thấy những hiểu biết sâu sắc từ khối lượng dữ liệu khổng lồ, từ đó nâng cao khả năng ra quyết định và cho phép phát triển các sản phẩm và dịch vụ mới (Hassani và cộng sự, 2018; Delgosha và cộng sự, 2020).
Phân tích trí tuệ doanh nghiệp (dữ liệu kinh doanh) có thể phát hiện mối quan hệ giữa các hoạt động ngân hàng, ngay cả với dữ liệu không đồng nhất, cải thiện quy trình kinh doanh tổng thể (González Carrasco và cộng sự, 2019).
Bốn là, hiệu quả hoạt động và tối ưu hóa quy trình.
Các kỹ thuật học máy được sử dụng để tối ưu hóa quy trình nghiệp vụ ngân hàng, chẳng hạn như hoạt động giao dịch, bằng cách điều chỉnh linh hoạt chính sách kiểm soát dựa trên các chỉ số hiệu suất (Tay và Mourad, 2020).
Phân tích dữ liệu lớn cải thiện chuỗi cung ứng tài chính và hiệu quả tiếp thị bằng cách phân tích dữ liệu nội bộ và các giao dịch kết nối điện tử (Hung và cộng sự, 2020).
5. Thực tiễn ứng dụng dữ liệu lớn và học máy của một số ngân hàng
Thứ nhất, phát hiện gian lận.
Danske Bank là một ngân hàng lớn tại khu vực Bắc Âu (hoạt động trên phạm vi 16 quốc gia). Vào năm 2016, Danske Bank đối mặt với sự gia tăng các vụ gian lận và cùng với đó là sự tăng lên của giao dịch hợp pháp bị hệ thống phát hiện gian lận và gắn cờ. Điều này làm tăng gánh nặng cho đội ngũ phát hiện gian lận và gây chậm trễ cho các giao dịch hợp pháp (Doug Henschen, 2018).
Danske Bank quyết định nâng cao hệ thống phòng, chống gian lận bằng cách áp dụng công nghệ học máy và học sâu. Họ hợp tác với Teradata Think Big Analytics để phát triển các mô hình học máy phức tạp, nhằm giảm số lượng gian lận giả. Dự án được triển khai với sự tham gia của một nhóm đa ngành gồm hơn 40 người, bao gồm các kỹ sư nền tảng, kỹ sư mạng, kỹ sư dữ liệu, nhà khoa học dữ liệu, chuyên gia thanh toán và gian lận, điều tra viên gian lận, chuyên gia phần cứng, cơ sở hạ tầng từ cả Danske Bank và Teradata Think Big Analytics. Nhóm đã làm việc theo các giai đoạn phát triển và vận hành (DevOps) kéo dài 12 tuần, tập trung vào hai hướng: Khoa học dữ liệu và kỹ thuật dữ liệu (Doug Henschen, 2018).
Kết quả là các mô hình học máy đã giảm 20 - 30% số lượng cảnh báo gian lận giả, đồng thời cải thiện khả năng phát hiện gian lận. Danske Bank cũng đã thử nghiệm các mô hình học sâu dựa trên Tensor Flow, cho thấy tiềm năng cảnh báo gian lận giả và nâng cao khả năng phát hiện gian lận, nhưng các mô hình này chưa được triển khai vào sản xuất (Doug Henschen, 2018).
Việc triển khai hệ thống phân tích nâng cao đã giúp Danske Bank cải thiện đáng kể hiệu quả trong việc điều tra gian lận, giảm thời gian phản hồi và nâng cao trải nghiệm khách hàng. Sự kết hợp giữa công nghệ học máy và học sâu đã tạo ra một nền tảng mạnh mẽ giúp ngân hàng không chỉ phát hiện gian lận mà còn có thể áp dụng vào nhiều trường hợp sử dụng khác (Doug Henschen, 2018).
UnionBank là một ngân hàng lớn tại Philippines đã tích hợp các giải pháp AI vào kho “vũ khí” chống gian lận của mình. Ngân hàng này đã phát triển các mô hình AI để phát hiện gian lận thông qua phân tích mạng (UnionBank, 2024).
Ngân hàng sử dụng AI để phân tích hành vi của người dùng, không chỉ số tiền giao dịch mà còn cả các loại dữ liệu khác như vị trí giao dịch, kiểu chi tiêu và thông tin thiết bị. Điều này cho phép UnionBank xác định các điểm bất thường, từ đó có thể phát hiện hoạt động gian lận.
Ngân hàng Wells Fargo (Mỹ) sử dụng dữ liệu và công nghệ thông minh vào việc tuân thủ và kiểm soát rủi ro, kiểm toán tự động, chẳng hạn như chống rửa tiền, gian lận thẻ tín dụng... Ngoài ra, Ngân hàng Wells Fargo nghiên cứu một module AI có thể phát hiện và liên tục phát hiện khả năng xảy ra các trường hợp gian lận tiềm ẩn. Thông qua Gradient Descent, Boosting và Random Forest, Ngân hàng Wells Fargo đã sử dụng hơn 15 triệu thử nghiệm và hơn 50 biến đặc trưng độc lập để xây dựng mô hình giám sát gian lận, tốt hơn so với các thuật toán dự đoán logic truyền thống (Kai Shi, 2019).
Thứ hai, quyết định tín dụng.
5Point Credit Union (một tổ chức tài chính tại Texas, Mỹ) sử dụng AI để tăng tốc quá trình đưa ra quyết định cho vay. Trong bối cảnh cạnh tranh ngày càng gay gắt với các ngân hàng lớn và công ty Fintech, 5Point Credit Union đã triển khai các mô hình AI để nâng cao khả năng xét duyệt khoản vay, đặc biệt là trong lĩnh vực cho vay ô tô (5Point Credit Union, 2022).
5Point Credit Union đã hợp tác với Zest AI để phát triển một mô hình cho vay dựa trên AI, giúp đánh giá rủi ro tín dụng của người vay nhanh chóng và chính xác hơn. Mô hình này được đào tạo trên số lượng biến gấp 10 lần so với mô hình điểm tín dụng truyền thống như FICO, giúp ngân hàng phát hiện và chấp nhận nhiều người vay hơn mà không gia tăng rủi ro. Việc triển khai mô hình chỉ mất một tháng và hệ thống mới đã tích hợp trơn tru với hệ thống quản lý khoản vay (LOS) của 5Point Credit Union (5Point Credit Union, 2022).
Các mô hình AI của 5Point Credit Union giúp giảm đáng kể sự khác biệt về tỉ lệ chấp nhận vay giữa các nhóm giới tính và sắc tộc khác nhau, đồng thời tăng cường khả năng phát hiện các khoản vay có nguy cơ cao. Kết quả là, 5Point Credit Union có thể duyệt các khoản vay nhanh hơn, cải thiện trải nghiệm của khách hàng và bảo đảm rằng quyết định cho vay được đưa ra một cách công bằng, minh bạch (5Point Credit Union, 2022).
Một trong những thách thức lớn nhất của 5Point Credit Union là làm sao để đưa ra quyết định cho vay nhanh chóng mà không ảnh hưởng đến chất lượng và độ an toàn của khoản vay. Để giải quyết vấn đề này, AI được sử dụng để tự động hóa phần lớn quy trình xét duyệt, giúp nhân viên có thêm thời gian để tập trung vào các tác vụ phức tạp hơn và tạo ra những giá trị thực sự cho khách hàng (5Point Credit Union, 2022).
Thứ ba, cải thiện trải nghiệm khách hàng.
Trước khi AI bùng nổ về mức độ phổ biến, UnionBank đã ứng dụng AI cho một số trường hợp. Họ đã triển khai một nền tảng kho dữ liệu với khả năng AI và học máy để bán chéo các sản phẩm tài chính. Họ đi tiên phong trong việc sử dụng xử lý ngôn ngữ tự nhiên (NLP) để xử lý và phân tích hàng chục nghìn phản hồi của khách hàng. Họ đã tận dụng AI để tự động phát hiện hành vi giao dịch bất thường của khách hàng nhằm gắn cờ các tài khoản mới mở đáng ngờ. UnionBank thậm chí còn thành lập một trung tâm nghiên cứu và phát triển (R&D) về AI, triển khai nhiều giải pháp dựa trên AI để cải thiện các khía cạnh khác nhau trong hoạt động và trải nghiệm khách hàng của UnionBank (UnionBank, 2024).
UnionBank đang xem xét các cải tiến AI trong tương lai, chẳng hạn như sử dụng xác thực giọng nói bằng AI trong các cuộc gọi dịch vụ khách hàng. Điều này giúp loại bỏ nhu cầu sử dụng các phương pháp xác thực truyền thống như trả lời câu hỏi bảo mật hoặc nhập OTP. Cách tiếp cận nhiều lớp này bảo vệ thông tin khách hàng và thúc đẩy sự tin tưởng, một thành phần quan trọng trong bất kỳ mối quan hệ ngân hàng thành công nào (UnionBank, 2024).
Liên quan đến điều này, UnionBank cũng đang khám phá tiềm năng của sinh trắc học dựa trên giọng nói cho các kênh và điểm tiếp xúc khách hàng khác. Công nghệ này hứa hẹn mang lại trải nghiệm thuận tiện và an toàn hơn, tiếp tục hợp lý hóa quy trình cho khách hàng (UnionBank, 2024).
Banco Bilbao Vizcaya Argentaria, thường được gọi là BBVA (một trong những ngân hàng lớn nhất ở Tây Ban Nha và có sự hiện diện toàn cầu) sử dụng dữ liệu lớn để phát triển các công cụ tài chính cá nhân và dịch vụ mới nhằm cải thiện trải nghiệm khách hàng. Chẳng hạn, ngân hàng đã triển khai một công cụ phân loại chi tiêu cá nhân dựa trên phân tích dữ liệu, giúp khách hàng quản lý ngân sách một cách hiệu quả hơn. Công cụ này nhanh chóng trở thành một trong những tính năng được sử dụng nhiều nhất trên trang web của BBVA (Wixom và Someh, 2018).
Ở khía cạnh khác, mạng xã hội mở ra hướng đi mới cho nhiều doanh nghiệp, trong đó có các ngân hàng. Số lượng đăng tải bài viết, thảo luận, lượt thích, chia sẻ, chỉ trích về một sản phẩm, dịch vụ giúp ngân hàng hiểu khách hàng và cải tiến sản phẩm của mình. Công cụ phân tích cảm xúc cho phép thu thập loại dữ liệu trên một cách nhanh chóng, hiệu quả, giúp nhà điều hành có tổng quan về đánh giá của khách hàng. Ngân hàng Barclays (Anh) đã phân tích phản ứng của khách hàng trên mạng xã hội để điều chỉnh ứng dụng Mobile Banking sau khi có phàn nàn về giới hạn độ tuổi nhận và chuyển tiền trên ứng dụng mới (Hoàng Công Gia Khánh và cộng sự, 2019).
Hay Bank Austria (Áo) sử dụng dữ liệu lớn để giữ chân khách hàng. Khi khách hàng có hành vi liên quan đến dừng sử dụng dịch vụ, ngân hàng nhanh chóng tiếp cận để thuyết phục khách hàng tiếp tục sử dụng sản phẩm của mình (Hoàng Công Gia Khánh và cộng sự, 2019).
Ngân hàng Wells Fargo thông qua dữ liệu lớn, AI, học máy tích hợp dữ liệu người dùng, dữ liệu giao dịch từ các nguồn khác nhau. Vì vậy, Ngân hàng Wells Fargo có sự hiểu biết toàn diện và chi tiết hơn về sở thích và nhu cầu của khách hàng, cách khách hàng sử dụng dịch vụ của Ngân hàng. Trên cơ sở này, Ngân hàng Wells Fargo có thể tối ưu hóa tốt hơn thiết kế của cổng thông tin để cung cấp cho khách hàng trải nghiệm cá nhân hóa và hiệu quả hơn (Lauri Giesen, 2019).
Ngân hàng Wells Fargo đã thu thập dữ liệu hành vi của người dùng (lượng truy cập, đường dẫn truy cập, thời gian dùng, mức sử dụng của từng chức năng) từ trang web của họ. Kết hợp với tình hình giao dịch, bán hàng và thu nhập để thực hiện phân tích toàn diện nhằm điều chỉnh website cho phù hợp với hành vi khách hàng (Lauri Giesen, 2019).
Thứ tư, quản trị chiến lược và ra quyết định.
BBVA sử dụng dữ liệu lớn như một công cụ chiến lược quan trọng để đưa ra các quyết định nhằm tối ưu hóa hoạt động. BBVA đã thành lập một trung tâm về khoa học dữ liệu nhằm thúc đẩy văn hóa ra quyết định dựa trên dữ liệu trong toàn bộ tổ chức. Trung tâm này đóng vai trò cốt lõi trong việc tạo ra các giải pháp dựa trên phân tích dữ liệu, từ đó cải thiện quy trình kinh doanh và phát triển sản phẩm, dịch vụ mới. Việc xây dựng một cộng đồng khoa học dữ liệu mạnh mẽ bên trong BBVA đã giúp ngân hàng phát triển các năng lực dữ liệu đột phá, hỗ trợ tối ưu hóa các quyết định chiến lược (Wixom và Someh, 2018).
Ngân hàng Wells Fargo đã thiết lập một chiến lược dữ liệu quy mô toàn ngân hàng để nghiên cứu các tình huống gần đây của ngành Ngân hàng và quyết định những việc cần làm trong tương lai. Thông qua việc xây dựng chiến lược dữ liệu, Ngân hàng Wells Fargo hiểu rõ dữ liệu là gì, dữ liệu ở đâu, họ có thể nhận được giá trị gì ở góc độ kinh doanh, nhu cầu về dữ liệu trong tương lai, phương pháp để lấy dữ liệu (Kai Shi, 2019).
Ngân hàng Wells Fargo tiếp tục hiện đại hóa các hệ thống dữ liệu kế thừa của mình, di chuyển các nền tảng dữ liệu truyền thống như Teradata, Oracle và SAS lên đám mây hoặc kiến trúc dữ liệu mở dựa trên Hadoop, để thống nhất dữ liệu doanh nghiệp (Kai Shi, 2019).
Thứ năm, hiệu quả hoạt động và tối ưu hóa quy trình.
Quontic là một ngân hàng có trụ sở tại New York, Mỹ, đã áp dụng giải pháp tự động hóa tác vụ mới được hỗ trợ bởi học máy trên nền tảng cũ. Trong nỗ lực cải thiện trải nghiệm khách hàng cũng như giải quyết thách thức tiếp cận những người không có hoặc ít có tài khoản ngân hàng, Ngân hàng Quontic đã chứng kiến sự tăng trưởng đáng kể trên nhiều chỉ số từ tháng 10/2018 đến tháng 11/2019 sau khi áp dụng giải pháp này. Cụ thể: Tổng số khách hàng của ngân hàng tăng 210%, số lượng khách hàng cá nhân mới tăng 100%, tiền gửi bán lẻ tăng 261%, tăng trưởng nguồn vốn tăng 15% (Darya Shmat, 2022)
Ngân hàng Greenhill sử dụng hệ thống an ninh mạng hỗ trợ máy học Falcon, do Công ty bảo mật CrowdStrike có trụ sở tại Mỹ phát triển. Nền tảng này dựa trên thuật toán học máy độc quyền trên quy mô đám mây, liên tục phân tích vô số sự kiện trong hệ thống của Ngân hàng Greenhill để xác định các mối đe dọa tiềm ẩn. Nhờ áp dụng Falcon, Ngân hàng Greenhill ước tính giảm 75% cảnh báo sai và tiết kiệm được khoảng 300.000 USD mỗi năm (Nadejda Alkhaldi và Darya Shmat, 2020).
6. Một số thách thức về ứng dụng dữ liệu lớn và học máy trong hoạt động ngân hàng
Để tìm ra những thách thức về ứng dụng dữ liệu lớn và học máy trong lĩnh vực ngân hàng, nghiên cứu sử dụng phương pháp định tính. Theo Lý Thị Minh Châu và cộng sự (2024), có 4 phương pháp thu thập dữ liệu (định tính) chính thể hiện qua quan sát, phỏng vấn cá nhân, phỏng vấn nhóm tập trung, phân tích tài liệu. Nghiên cứu sử dụng phương pháp phân tích tài liệu (phương pháp thu thập thông tin định tính thông qua các tư liệu), phỏng vấn sâu chuyên gia để thu thập dữ liệu định tính phản ánh những thách thức trong việc ứng dụng dữ liệu lớn và học máy trong hoạt động ngân hàng. Kết quả nghiên cứu định tính đã đưa ra một số thách thức như sau:
Một là, bảo mật và quyền riêng tư dữ liệu.
Ngân hàng xử lý một lượng lớn dữ liệu nhạy cảm của khách hàng. Việc bảo đảm tính bảo mật và quyền riêng tư của dữ liệu này là một thách thức lớn. Các vi phạm dữ liệu có thể gây ra hậu quả nghiêm trọng về tài chính và uy tín cho ngân hàng.
Hai là, chất lượng và tính toàn vẹn của dữ liệu.
Dữ liệu lớn trong ngân hàng thường đến từ nhiều nguồn khác nhau, có thể không nhất quán hoặc không đầy đủ. Việc bảo đảm chất lượng và tính toàn vẹn của dữ liệu là rất quan trọng để các mô hình học máy có thể đưa ra dự đoán chính xác.
Ba là, giải thích và minh bạch mô hình.
Nhiều mô hình học máy, đặc biệt là các mô hình học sâu có thể hoạt động như “hộp đen”, khiến cho việc giải thích cách chúng đưa ra quyết định trở nên khó khăn. Điều này có thể gây ra các vấn đề về tuân thủ quy định và trách nhiệm giải trình, đặc biệt là trong các lĩnh vực như cho vay, quản lý rủi ro.
Bốn là, thiếu kỹ năng và năng lực.
Việc triển khai và quản lý các hệ thống dữ liệu lớn và học máy đòi hỏi các kỹ năng chuyên môn mà nhiều ngân hàng có thể còn thiếu. Việc thu hút và giữ chân nhân tài trong lĩnh vực này cũng là một thách thức.
Năm là, quy định và tuân thủ.
Ngành Ngân hàng phải tuân thủ nhiều quy định nghiêm ngặt. Việc sử dụng dữ liệu lớn và học máy phải bảo đảm tuân thủ các quy định này, điều này có thể phức tạp và tốn kém.
Sáu là, cơ sở hạ tầng và công nghệ.
Xây dựng, duy trì cơ sở hạ tầng cần thiết để xử lý, lưu trữ dữ liệu lớn có thể tốn kém và phức tạp. Các ngân hàng cần đầu tư vào phần cứng, phần mềm chuyên môn phù hợp để hỗ trợ các sáng kiến dữ liệu lớn và học máy. Việc tích hợp các giải pháp dữ liệu lớn và học máy vào các hệ thống ngân hàng hiện có thường gặp khó khăn do sự phức tạp và cũ kỹ của các hệ thống này.
7. Một số khuyến nghị
Khai thác có hiệu quả sức mạnh của dữ liệu lớn và học máy sẽ giúp các ngân hàng cải thiện trải nghiệm khách hàng, tối ưu hóa hoạt động, quản lý rủi ro hiệu quả hơn và thúc đẩy đổi mới. Mặc dù dữ liệu lớn và học máy mang lại nhiều lợi ích cho ngân hàng, nhưng bên cạnh đó cũng đặt ra không ít thách thức. Để góp phần giúp các ngân hàng giải quyết những thách thức, bao gồm vấn đề về bảo mật dữ liệu, chất lượng dữ liệu, giải thích mô hình, kỹ năng, quy định và cơ sở hạ tầng để khai thác hết tiềm năng “to lớn” của dữ liệu lớn và học máy, trên cơ sở tham vấn các chuyên gia và kết quả phân tích tài liệu, bài viết đề xuất một số khuyến nghị như sau:
Thứ nhất, tăng cường bảo mật và quyền riêng tư dữ liệu: Ngân hàng cần đầu tư mạnh mẽ vào các công nghệ bảo mật tiên tiến như mã hóa dữ liệu, hệ thống phát hiện xâm nhập, bảo mật dựa trên công nghệ chuỗi khối (Blockchain). Ngoài ra, việc áp dụng các chính sách quản lý quyền truy cập nghiêm ngặt, triển khai những chương trình đào tạo về bảo mật cho nhân viên cũng rất quan trọng.
Thứ hai, cải thiện chất lượng, tính toàn vẹn của dữ liệu: Ngân hàng cần thiết lập quy trình chuẩn hóa và tích hợp dữ liệu từ nhiều nguồn khác nhau, bao gồm việc làm sạch, lọc, chuẩn hóa dữ liệu trước khi đưa vào sử dụng. Sử dụng các công cụ quản lý dữ liệu và tự động hóa quy trình kiểm soát chất lượng dữ liệu là cần thiết.
Thứ ba, tăng cường khả năng giải thích và minh bạch của mô hình: Ngân hàng nên áp dụng các phương pháp học máy có thể giải thích được và bảo đảm rằng các mô hình học máy phức tạp phải có cơ chế giải thích rõ ràng về cách đưa ra quyết định. Điều này giúp bảo đảm tuân thủ quy định và tăng cường niềm tin của khách hàng.
Thứ tư, đầu tư vào đào tạo và phát triển kỹ năng nhân sự: Ngân hàng cần xây dựng chương trình đào tạo nội bộ và hợp tác với các học viện, trường đại học, viện/trung tâm đào tạo và nghiên cứu chuyên sâu để phát triển nguồn nhân lực có kỹ năng về dữ liệu lớn và học máy. Việc liên tục cập nhật kiến thức và kỹ năng cho nhân viên là rất quan trọng để đáp ứng nhu cầu ngày càng cao về công nghệ.
Thứ năm, bảo đảm tuân thủ quy định và quản lý rủi ro: Ngân hàng cần thiết lập một nhóm chuyên trách về tuân thủ quy định liên quan đến dữ liệu và AI, bảo đảm rằng mọi ứng dụng dữ liệu lớn và học máy đều tuân thủ các quy định hiện hành. Sự phối hợp chặt chẽ giữa các phòng, ban như pháp chế, công nghệ thông tin và quản lý rủi ro là cần thiết để giảm thiểu rủi ro pháp lý.
Thứ sáu, nâng cấp cơ sở hạ tầng, công nghệ: Để hỗ trợ sáng kiến về dữ liệu lớn và học máy, ngân hàng cần đầu tư vào cơ sở hạ tầng công nghệ hiện đại, bao gồm các giải pháp lưu trữ đám mây, hệ thống máy tính hiệu năng cao và các nền tảng phân tích dữ liệu tiên tiến.
Thứ bảy, xây dựng một chiến lược dữ liệu tổng thể: Các ngân hàng cần phát triển chiến lược dữ liệu tổng thể, trong đó dữ liệu được coi là một tài sản chiến lược. Chiến lược này cần bao gồm các khía cạnh về quản lý dữ liệu, quyền sở hữu dữ liệu, việc sử dụng dữ liệu để đưa ra các quyết định kinh doanh.
Ngoài ra, cần xây dựng văn hóa dữ liệu, theo đó, các ngân hàng cần thúc đẩy tư duy lấy dữ liệu làm trung tâm, khuyến khích việc sử dụng dữ liệu để ra quyết định và thúc đẩy đổi mới.
Tin bài khác


Kết nối, chia sẻ dữ liệu góp phần phòng, chống tình trạng lừa đảo, chiếm đoạt tài sản trên không gian mạng trong lĩnh vực ngân hàng

Những dự báo về tình hình an ninh mạng năm 2025

Các yếu tố ảnh hưởng đến việc lựa chọn dịch vụ ngân hàng số của khách hàng cá nhân trên địa bàn thành phố Hồ Chí Minh

10 sự kiện công nghệ thông tin Việt Nam nổi bật năm 2024

Dấu ấn công nghệ ngân hàng năm 2024: An ninh, an toàn trong cung cấp và sử dụng dịch vụ ngân hàng trên không gian mạng

Tiên phong đổi mới, sáng tạo, ứng dụng công nghệ mới thúc đẩy hoạt động thanh toán không dùng tiền mặt trong nền kinh tế

Nhân tố quyết định chấp nhận liên tục ví điện tử ở Việt Nam

Vận dụng “Binh pháp Tôn Tử” vào trong hoạt động của ngân hàng trung ương

Bảo đảm an toàn trong việc kết nối và xử lý dữ liệu của khách hàng khi triển khai Open API

Tài chính xanh doanh nghiệp - Giải pháp phát triển bền vững tại Việt Nam

Tác động của Luật Đất đai năm 2024 đối với hoạt động kinh doanh của hệ thống ngân hàng thương mại Việt Nam

Điều hành chính sách tiền tệ tiếp tục góp phần quan trọng vào thành tựu chung của đất nước

Vận dụng “Binh pháp Tôn Tử” vào trong hoạt động của ngân hàng trung ương

Kinh nghiệm quốc tế về thực thi chính sách tài chính ứng phó với biến đổi khí hậu và bài học cho Việt Nam

Những “phép màu” năm mới của nền kinh tế

Nền kinh tế mùa lễ hội: Khi niềm vui và lợi nhuận song hành
