Xử lý dữ liệu là nghiệp vụ lõi trong hệ thống các nghiệp vụ của hoạt động thông tin tín dụng (TTTD), quyết định tính chính xác, đầy đủ, kịp thời của TTTD. Với vai trò là đầu mối trong hoạt động TTTD của Ngân hàng Nhà nước Việt Nam (NHNN), một trong những nhiệm vụ của Trung tâm Thông tin tín dụng Quốc gia Việt Nam (CIC) là tổ chức thực hiện xây dựng, quản lý kho dữ liệu quốc gia về TTTD thu thập từ các tổ chức tín dụng (TCTD), tổ chức khác theo quy định của NHNN và pháp luật hiện hành.
Trong những năm qua, CIC đã thường xuyên tiến hành nâng cấp hệ thống, triển khai ứng dụng công nghệ hiện đại vào các quy trình, nghiệp vụ, trong đó có quy trình thu thập, xử lý dữ liệu và đã đạt được nhiều kết quả tích cực. Tuy nhiên, trước nhu cầu phát triển và mở rộng kho dữ liệu của CIC trong tương lai, năng lực hạ tầng công nghệ thông tin (CNTT) trong xử lý dữ liệu đã xuất hiện những hạn chế nhất định, thiếu khả năng linh hoạt trong việc thiết lập xử lý dữ liệu lớn. Cùng với đó, việc ứng dụng các thành quả của cuộc Cách mạng công nghiệp lần thứ tư (CMCN 4.0) đã tạo ra rất nhiều thay đổi trong hoạt động tài chính - ngân hàng, từ số lượng khách hàng tới hệ thống chỉ tiêu thông tin thu thập. Những thay đổi này yêu cầu hoạt động TTTD cần chủ động ứng dụng công nghệ mới, đặc biệt trong nghiệp vụ xử lý dữ liệu để đáp ứng nhu cầu phát triển của kho dữ liệu TTTD, cũng như sự phát triển của Ngành trong tương lai.
Bài viết nghiên cứu thực trạng, kết quả nghiệp vụ xử lý dữ liệu trong hoạt động TTTD tại CIC, những kết quả đạt được, những tồn tại, khó khăn; từ đó, đưa ra giải pháp ứng dụng công nghệ mới (học máy) để nâng cao hiệu quả của hoạt động này.
1. Thực trạng nghiệp vụ xử lý dữ liệu trong hoạt động TTTD của CIC
CIC là tổ chức sự nghiệp công lập trực thuộc NHNN, thực hiện chức năng đăng ký tín dụng quốc gia; thu nhận, xử lý, lưu trữ, phân tích TTTD; phòng ngừa và hạn chế rủi ro tín dụng; chấm điểm, xếp hạng tín dụng pháp nhân và thể nhân trên lãnh thổ Việt Nam phục vụ yêu cầu quản lý Nhà nước của NHNN; cung ứng sản phẩm dịch vụ TTTD theo quy định của NHNN và pháp luật; hoạt động theo quy định tại Thông tư số 03/2013/TT-NHNN ngày 28/01/2013 của Thống đốc NHNN quy định về hoạt động TTTD, Thông tư số 27/2017/TT-NHNN ngày 31/12/2017 sửa đổi, bổ sung một số điều của Thông tư số 03/2013/TT-NHNN của Thống đốc NHNN quy định về hoạt động TTTD của NHNN Việt Nam.
CIC xây dựng hệ thống CNTT hiện đại trong thu thập, xử lý dữ liệu
Trong thời gian qua, CIC đã chủ động triển khai các dự án hiện đại hóa CNTT, ứng dụng nền tảng CNTT trong hoạt động nghiệp vụ, trong đó có hoạt động thu thập, xử lý dữ liệu. Hệ thống quản lý dữ liệu mới của CIC hiện nay được xây dựng trên nền tảng công nghệ hiện đại trên cơ sở triển khai theo dự án FSMIMS, sử dụng nhiều công cụ, tiện ích của các hãng công nghệ danh tiếng trên thế giới, từ đó cho phép CIC quản lý, tích hợp và mở rộng được các nguồn thông tin đa dạng.
Đồng thời, CIC đã chủ động xây dựng và trình Thống đốc NHNN phê duyệt Kế hoạch ứng dụng CNTT giai đoạn 2018 - 2023. Hiện nay, CIC đang tập trung nghiên cứu, triển khai các cấu phần; áp dụng các công nghệ mới vào hoạt động nghiệp vụ; tổ chức nâng cấp ngay một số ứng dụng phần mềm để nâng cao tính tự động hóa; triển khai xây dựng và thực thi chính sách an toàn thông tin; đa dạng kênh cung cấp thông tin...
Hoạt động thu thập, xử lý dữ liệu được chuyên biệt hóa
Trước đây, hoạt động thu thập, kiểm soát, xử lý dữ liệu do một bộ phận (Phòng Thu thập và xử lý dữ liệu) đảm nhận và thực hiện xuyên suốt. Kể từ năm 2017, để tăng khả năng kiểm soát chéo và đảm bảo tính chính xác, khách quan của nghiệp vụ thu thập, kiểm soát và xử lý dữ liệu, CIC đã chuyên biệt hóa các hoạt động này thành hai bộ phận riêng biệt (Phòng Thu thập và xử lý dữ liệu và Phòng Kiểm soát và quản trị cơ sở dữ liệu).
Các quy trình nghiệp vụ thu thập, xử lý dữ liệu được xây dựng/chỉnh sửa/bổ sung phù hợp với quy định của pháp luật hiện hành
CIC đã tiến hành hệ thống hóa các quy trình nghiệp vụ, xây dựng và ban hành 02 quy trình nghiệp vụ mới liên quan đến hoạt động thu thập, xử lý, kiểm soát dữ liệu phù hợp với các quy định của pháp luật liên quan đến hoạt động TTTD. Đây là cơ sở quan trọng để hoạt động thu thập, xử lý dữ liệu của CIC được kiểm soát chặt chẽ, đảm bảo chất lượng.
Với những hoạt động đó, kết quả CIC đã đạt được là:
Thứ nhất, cơ sở dữ liệu được mở rộng thu thập từ nhiều nguồn: Sau hơn 20 năm xây dựng và phát triển, CIC đã xây dựng được cơ sở dữ liệu TTTD quốc gia với quy mô lớn, lưu trữ TTTD của trên 47 triệu khách hàng vay tích hợp được nhiều nguồn dữ liệu khác nhau, bao gồm 100% TCTD, gần 1.200 quỹ tín dụng nhân dân và 04 tổ chức tài chính vi mô chính thức, khoảng trên 50 tổ chức tự nguyện, các đơn vị ngoài Ngành như Bộ Công an, Bộ Kế hoạch và Đầu tư (KH&ĐT)… Từ chỗ thu thập, cung cấp dữ liệu chủ yếu là thủ công, nền tảng công nghệ lạc hậu, tới nay cơ sở dữ liệu TTTD quốc gia được xây dựng trên nền tảng công nghệ hiện đại, dữ liệu lịch sử được lưu trữ trên 05 năm và thường xuyên bổ sung nhiều thông tin từ các cơ quan quản lý Nhà nước và các tổ chức khác.
Việc nghiên cứu, ứng dụng các giải pháp công nghệ mới vào nghiệp vụ xử lý TTTD là yêu cầu cấp thiết
Hoạt động TTTD của Việt Nam nhận được nhiều đánh giá tích cực từ các tổ chức trong và ngoài nước. Theo báo cáo Môi trường kinh doanh năm 2020 của Nhóm Ngân hàng Thế giới, khả năng “Tiếp cận tín dụng” của Việt Nam xếp hạng 25/190 nước và vùng lãnh thổ, tăng 07 bậc so với 2019, xếp thứ 02 trong khu vực ASEAN sau Brunei và thứ 07 khu vực châu Á. Trong đó, chỉ số chiều sâu TTTD là một điểm sáng, cải thiện từ 4/6 điểm năm 2014 lên 8/8 điểm năm 2020 (cao hơn bình quân khu vực Đông Á - Thái Bình Dương và nhóm các nước thu nhập cao thuộc Tổ chức Hợp tác và Phát triển Kinh tế (OECD) là 4,5 và 6,8/8 điểm). Độ phủ thông tin của CIC tăng từ 39,1% năm 2014 lên 59,4% dân số trưởng thành năm 2020 (cao hơn trung bình của khu vực Đông Á - Thái Bình Dương và nhóm các nước thu nhập cao OECD là 16,6% và 24,4%).
Thứ hai, chất lượng cơ sở dữ liệu TTTD được nâng cao: Trong giai đoạn 2011 - 2021, tỷ lệ cập nhật số liệu thành công tại CIC luôn đạt ở mức cao, từ 95% trở lên, riêng năm 2020 gần như đạt tuyệt đối (99,5 - 99,9%), đặc biệt, các quỹ tín dụng nhân dân, tổ chức tài chính vi mô cũng có tỷ lệ hồ sơ đầy đủ, cập nhật thành công tăng nhanh (trên 90%) trong các năm gần đây. Dữ liệu tại CIC được phân tổ, lưu trữ đảm bảo tối thiểu 05 năm trên nền tảng công nghệ hiện đại, từ đó có thể truy xuất linh hoạt phục vụ cho các hoạt động nghiệp vụ đa dạng của CIC. Bên cạnh đó, tốc độ tăng trưởng hồ sơ khách hàng bình quân hằng năm của cơ sở dữ liệu TTTD quốc gia là khoảng 20%, số lượng báo cáo tín dụng CIC cung cấp tăng trưởng mạnh, từ hơn 6,2 triệu báo cáo năm 2015 lên hơn 42 triệu báo cáo các loại năm 2021, tỷ lệ có thông tin luôn đạt trên 85%; tỷ lệ cung cấp thông tin tự động đạt 85 - 90%; thời gian truy xuất thông tin tự động dưới 10 giây.
Tuy nhiên, trong hoạt động, CIC vẫn có một số tồn tại:
Một là, năng lực hạ tầng CNTT hạn chế trước yêu cầu mở rộng, phát triển của Ngành, của CIC trong tương lai: Trước tốc độ phát triển của số lượng khách hàng, số chỉ tiêu thu thập, các chủ thể mới tham gia hoạt động TTTD… năng lực hạ tầng CNTT của CIC đã bộc lộ một số hạn chế nhất định. Việc cập nhật dữ liệu lớn tại CIC trong thời gian gần đây gặp khá nhiều khó khăn, tốc độ tự động hóa chưa cao, cần số lượng nhân lực lớn, thời gian xử lý lâu, nhiều dữ liệu khó trích xuất thông tin, trong khi yêu cầu TTTD cần xử lý nhanh chóng, hiệu quả, chính xác, tạo ra các sản phẩm TTTD có giá trị cao, phù hợp với nhu cầu và yêu cầu nghiệp vụ ngày một tăng cao của các TCTD, tăng hiệu quả quản trị rủi ro tại các TCTD.
Hai là, việc ứng dụng công nghệ mới trong hoạt động thu thập, xử lý dữ liệu chưa được đẩy mạnh: Việc ứng dụng các công nghệ mới để xử lý dữ liệu đầu vào và tạo lập cung cấp sản phẩm đầu ra tại CIC chưa bắt kịp xu thế thay đổi của CMCN 4.0. CIC chưa nghiên cứu và ứng dụng học máy rộng rãi trong hoạt động thu thập, xử lý TTTD, mới ứng dụng trong mô hình chấm điểm thể nhân 2.0.
Ba là, thiếu nguồn nhân lực chất lượng cao: Nguồn nhân lực chất lượng cao, đặc biệt là đội ngũ chuyên viên CNTT, cán bộ thu thập, xử lý dữ liệu còn thiếu và hạn chế về năng lực, chưa đáp ứng được nhu cầu phát triển nghiệp vụ, hiện đại hóa CNTT
tại CIC.
2. Giải pháp ứng dụng học máy vào xử lý lý dữ liệu trong hoạt động TTTD tại Việt Nam
2.1. Sự cần thiết của việc ứng dụng học máy vào xử lý dữ liệu trong hoạt động TTTD
Học máy được giới thiệu vào cuối những năm 1950, là lĩnh vực nghiên cứu của trí tuệ nhân tạo về các thuật toán và mô hình thống kê mà các hệ thống máy tính sử dụng để thực hiện một nhiệm vụ cụ thể mà không cần phải sử dụng các hướng dẫn rõ ràng, thay vào đó là dựa vào các mẫu và suy luận. Từ đó, cho phép máy tính có thể học được các khái niệm để đưa ra dự đoán hoặc quyết định mà không phải lập trình cụ thể để thực hiện nhiệm vụ. Việc ứng dụng học máy trong nghiệp vụ xử lý dữ liệu TTTD có thể mang lại một số kết quả tích cực sau:
- Tăng cường khả năng thu thập và xử lý dữ liệu TTTD với số lượng dữ liệu lớn một cách nhanh chóng, hiệu quả, chính xác.
- Giúp tăng hiệu quả làm sạch dữ liệu, phát hiện dữ liệu trùng lặp, hợp nhất dữ liệu, cải thiện chất lượng và tính nhất quán của dữ liệu, từ đó góp phần ngăn chặn gian lận, giả mạo thông tin, giảm thiểu thời gian xử lý dữ liệu, tạo ra các sản phẩm TTTD chiều sâu, đạt tiêu chuẩn quốc tế.
- Hạn chế ảnh hưởng của con người trong việc ra quyết định, tăng tính khách quan, chính xác trong quá trình xử lý dữ liệu, đồng thời cho phép khả năng nâng cấp, cải tiến kỹ thuật thường xuyên hơn.
Với thực trạng nguồn dữ liệu thu thập được tại CIC, trong quá trình xử lý dữ liệu TTTD thì nghiệp vụ “đối sánh” và “hợp nhất” thông tin là rất quan trọng. Các dữ liệu liên quan đến lịch sử quan hệ tín dụng, thông tin đảm bảo tiền vay của khách hàng từ nhiều nguồn khác nhau được liên kết với nhau thông qua thông tin định danh khách hàng vay. Để các báo cáo TTTD chính xác, đầy đủ, góp phần tăng tính hiệu quả, minh bạch của hoạt động TTTD thì việc phát hiện sự trùng lặp thông tin giữa các nguồn dữ liệu đầu vào khác nhau với nhau và với cơ sở dữ liệu hiện có là rất cần thiết. Hiện tại, đây là một quá trình bán tự động nên có thể vẫn tiềm ẩn những rủi ro chủ quan cảm tính của chính người làm; mất nhiều thời gian xử lý ở công đoạn này. Ngoài ra, khối lượng TTTD ngày càng lớn, do khách hàng có quan hệ tín dụng với nhiều tổ chức tài chính khác nhau nên thường xảy ra trùng lặp khó phát hiện như sai chính tả, cố tình giả mạo giấy tờ, nhập liệu thông tin sai, do cơ sở dữ liệu chứa thông tin thu thập được có thể không đồng nhất.
Căn cứ việc phân tích những tồn tại của nghiệp vụ xử lý dữ liệu TTTD, những yêu cầu của nghiệp vụ này trong bối cảnh hiện tại cũng như những ưu điểm của giải pháp học máy trong xử lý TTTD, có thể thấy rằng, việc nghiên cứu, ứng dụng các giải pháp công nghệ mới, cụ thể là học máy vào nghiệp vụ xử lý TTTD là yêu cầu cấp thiết.
2.2. Giải pháp ứng dụng học máy vào xử lý dữ liệu trong hoạt động TTTD tại Việt Nam
2.2.1. Nhóm các giải pháp về cơ chế, chính sách
Để thúc đẩy ứng dụng học máy vào xử lý dữ liệu trong hoạt động TTTD tại Việt Nam nói riêng và trong ngành tài chính - ngân hàng nói chung, hoặc rộng hơn là thúc đẩy ứng dụng khoa học công nghệ vào hoạt động đời sống, kinh tế ở Việt Nam, cần có những giải pháp toàn diện, đồng bộ về cơ chế, chính sách từ các cơ quan quản lý Nhà nước. Nhóm tác giả đề xuất một số giải pháp về cơ chế, chính sách như sau:
Thứ nhất, xây dựng, hoàn thiện hệ thống văn bản quy phạm pháp luật liên quan đến ứng dụng trí tuệ nhân tạo, học máy vào hoạt động TTTD.
Trước hết, đề nghị Chính phủ yêu cầu các tổ chức đăng ký kế hoạch thực hiện chiến lược quốc gia về phát triển ứng dụng trí tuệ nhân tạo trong Chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo, học máy đến năm 2030.
Cùng với đó, đề nghị NHNN: Xây dựng và ban hành các quy định kỹ thuật xử lý dữ liệu TTTD, tiêu chuẩn, quy chuẩn ứng dụng trí tuệ nhân tạo, học máy vào hoạt động TTTD; xây dựng, bổ sung quy định đối với các công ty tín dụng về việc ứng dụng công nghệ mới vào trong quy trình thu thập, xử lý, lưu giữ và cung cấp TTTD bao gồm cả các quy định về điều kiện cơ sở hạ tầng CNTT, nhân sự CNTT,… đảm bảo nguyên tắc công bằng, cạnh tranh và tuân thủ quy định của pháp luật.
Thứ hai, xây dựng cơ chế, chính sách, tạo điều kiện thúc đẩy ứng dụng trí tuệ nhân tạo, học máy trong hoạt động TTTD. Giải pháp này hướng tới việc tạo điều kiện thuận lợi cho các đơn vị hoạt động TTTD có thể ứng dụng học máy vào trong hoạt động nghiệp vụ. Đề nghị Chính phủ, các ngành có liên quan tham gia tổ chức và thực hiện các chương trình, dự án hợp tác nghiên cứu khoa học song phương và đa phương về trí tuệ nhân tạo, ứng dụng công nghệ mới. Thúc đẩy phát triển cơ sở, trung tâm hợp tác nghiên cứu học máy, ứng dụng công nghệ mới; các dự án hợp tác chuyển giao công nghệ, khai thác các sáng chế, quyền sở hữu công nghiệp giữa các doanh nghiệp Việt Nam với các doanh nghiệp nước ngoài về học máy, ứng dụng công nghệ mới; các trung tâm, chương trình đào tạo nhân lực học máy, ứng dụng công nghệ mới chất lượng cao.
Thứ ba, xây dựng chỉ số đánh giá mức độ phát triển và ứng dụng khoa học công nghệ của các tổ chức hoạt động TTTD. Việc xây dựng chỉ số đánh giá giúp các tổ chức hoạt động TTTD tại Việt Nam tự xác định, cũng như cơ quan quản lý Nhà nước là NHNN nắm bắt được mức độ phát triển và ứng dụng khoa học công nghệ tại tổ chức, từ đó có giải pháp thực hiện phù hợp, thúc đẩy sự phát triển của tổ chức hoạt động TTTD.
Trên cơ sở nghiên cứu Chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo đến năm 2030, nhằm đảm bảo tính khả thi, phù hợp để đánh giá khách quan, thực chất hiện trạng phát triển và ứng dụng khoa học công nghệ của các đơn vị hoạt động TTTD tại Việt Nam, nhóm tác giả đề xuất chỉ số với các trụ cột và tiêu chí cụ thể như sau:
Quá trình đánh giá được thực hiện như sau:
- Đánh giá từng tiêu chí: Xác định qua khung thang điểm 01 - 05 (thấp, trung bình, khá, tốt, xuất sắc).
- Đánh giá theo từng trụ cột: Xác định bằng tỷ lệ tổng điểm của từng tiêu chí thuộc trụ cột trên tổng điểm tối đa có thể đạt được. Kết quả được xếp loại theo 05 mức từ 01 đến 05 tương ứng với tỷ lệ là 20%, 40%, 60%, 80% và 100%.
- Đánh giá tổng thể: Xếp loại gồm 05 mức từ 01 đến 05 được xác định như sau: Tỷ lệ tổng điểm đạt được trên tổng điểm tối đa tương ứng với tỷ lệ % từ 20% đến 100% và có hiệu chỉnh theo nguyên tắc: Giảm 01 mức nếu có từ 02 trụ cột được xếp loại ở mức thấp hơn 01 mức hoặc có trụ cột được xếp loại ở mức thấp hơn 02 mức.
- Việc đánh giá các đơn vị hoạt động TTTD được thực hiện hằng năm, do đơn vị hoạt động TTTD tự đánh giá hoặc do cơ quan quản lý, đơn vị tư vấn độc lập thực hiện tùy thuộc vào năng lực và mục đích sử dụng kết quả đánh giá.
2.2.2. Nhóm các giải pháp tại các đơn vị hoạt động TTTD
Thứ nhất, chuẩn hóa các quy trình nghiệp vụ, đánh giá khả năng ứng dụng học máy vào các quy trình nghiệp vụ hiện có. Cần phân tích, làm rõ các bước hiện chưa tự động hóa/kết quả tự động hóa để nghiên cứu phương án có thể ứng dụng kỹ thuật công nghệ mới để cải tiến quy trình, hiệu quả xử lý dữ liệu.
Thứ hai, xây dựng chiến lược phát triển tổ chức, lấy việc ứng dụng công nghệ mới (trí tuệ nhân tạo) là trung tâm. Cần có kế hoạch phân bổ tài chính thực hiện các nhiệm vụ ứng dụng học máy vào hoạt động của tổ chức. Xây dựng lộ trình các nhiệm vụ ứng dụng khoa học công nghệ cụ thể cho từng nghiệp vụ, hoạt động; đồng thời có các phương án quản trị việc triển khai hiệu quả các nhiệm vụ này.
Thứ ba, phát triển nguồn nhân lực chất lượng cao về ứng dụng học máy, phân tích dữ liệu; đầu tư nâng cấp cơ sở vật chất, trang thiết bị, công nghệ. Nguồn nhân lực chất lượng cao là một trong những nhân tố quan trọng quyết định thành công và hiệu quả của quá trình ứng dụng học máy vào xử lý dữ liệu trong hoạt động TTTD. Cần tập trung bồi dưỡng nâng cao trình độ của nhân sự quản lý, nhân sự CNTT, nhân sự nghiệp vụ TTTD, nhân sự phân tích kinh doanh - Business Analyst (BA) và chuyên gia về khoa học dữ liệu. Đối với từng nhóm nhân sự, cần có chiến lược phát triển phù hợp với nhiệm vụ, vai trò trong việc triển khai ứng dụng học máy.
Thứ tư, xây dựng cơ sở dữ liệu (CSDL) thử nghiệm triển khai ứng dụng học máy. Kết quả của học máy phụ thuộc nhiều vào chất lượng, kích thước cũng như sự đa dạng dữ liệu của các bộ dữ liệu được sử dụng trong quá trình xây dựng mô hình. Vì vậy, việc xây dựng CSDL TTTD nói chung và CSDL phục vụ cho việc nghiên cứu, phát triển ứng dụng học máy là một trong những nội dung trọng tâm mà các tổ chức hoạt động TTTD cần sớm thực hiện và hoàn thành.
Tại đề xuất này, nhóm tác giả tập trung vào nội dung xây dựng CSDL phục vụ cho việc nghiên cứu, phát triển ứng dụng học máy từ các CSDL hiện có của đơn vị. Căn cứ và yêu cầu bảo mật thông tin dữ liệu cũng như sự khác biệt giữa hệ thống sản xuất (Production) và hệ thống kiểm thử, hệ thống phát triển (Test, Dev), nhóm tác giả đề xuất giải pháp xây dựng CSDL thử nghiệm như sau:
- Dữ liệu tại môi trường kiểm thử, phát triển cần được thống nhất không chỉ trong quá trình thực hiện từng nhiệm vụ riêng biệt mà cho toàn bộ các nhiệm vụ, dự án của đơn vị. Điều này tạo điều kiện thuận lợi cho cán bộ tham gia phát triển, kiểm thử hệ thống, không cần làm quen với dữ liệu mới, đồng thời dễ dàng đối chiếu kết quả giữa các nhiệm vụ, dự án. Hơn thế nữa, việc sử dụng dữ liệu thống nhất giúp các dự án, nhiệm vụ có thể sử dụng chung bộ dữ liệu, tiết kiệm thời gian mã hóa cũng như tài nguyên lưu trữ.
- Đối với các dữ liệu không thực hiện mã hóa theo yêu cầu xây dựng mô hình, kiểm thử cần thực hiện đánh giá kỹ lưỡng và thực hiện ẩn danh đối với những dữ liệu định danh khách hàng để đảm bảo bảo mật thông tin cũng như giữ được sự ổn định, chính xác của tập dữ liệu.
- Áp dụng phân quyền truy cập, sử dụng và khai thác dữ liệu tương ứng với chức năng, nhiệm vụ được giao của từng cá nhân, bộ phận cụ thể. Có biện pháp đảm bảo an toàn, an ninh thông tin phù hợp với quy định.
- Dữ liệu cần được trích xuất đảm bảo tính đa dạng phù hợp với mục đích sử dụng, đáp ứng một số yêu cầu chung như: Đa dạng về TCTD (số lượng, loại hình, quy mô TCTD); đa dạng về địa bàn (phân bổ theo chi nhánh TCTD, địa chỉ khách hàng,…); đa dạng về phân lớp các chỉ tiêu TTTD (quy mô dư nợ, loại vay, loại tài sản đảm bảo,…) nguyên tắc đa dạng dữ liệu cần thực hiện xuyên suốt quá trình bổ sung, cập nhật dữ liệu.
Thứ năm, mở rộng CSDL phù hợp với chiến lược phát triển, nhu cầu ứng dụng học máy trong tương lai. Cùng với sự phát triển của ngành tài chính - ngân hàng, nhu cầu về các sản phẩm - dịch vụ TTTD ngày càng gia tăng, không chỉ bó hẹp trong các chỉ tiêu thu thập được trong phạm vi của các tổ chức trong Ngành mà đòi hỏi mở rộng từ các nguồn dữ liệu ngoài ngành như từ các công ty viễn thông, điện, nước, tài nguyên - môi trường, CSDL quốc gia về dân cư,… Do đó, việc mở rộng thu thập thông tin từ các tổ chức ngoài ngành tài chính - ngân hàng hay bổ sung các chỉ tiêu cần thu thập từ các nguồn dữ liệu sẵn có là yêu cầu bắt buộc đối với các tổ chức hoạt động TTTD.
- Bổ sung thêm tập dữ liệu, đa dạng hóa tập dữ liệu phục vụ quá trình học máy.
- Hỗ trợ cung cấp thông tin đối chiếu, giúp chuẩn hóa, làm sạch dữ liệu, tăng cường độ chính xác của dữ liệu học máy.
Bên cạnh việc bổ sung thông tin từ các tổ chức ngoài Ngành hay các CSDL quốc gia, thì việc mở rộng tiêu chí, loại thông tin thu thập từ các tổ chức trong ngành tài chính - ngân hàng như: Thông tin ảnh giấy tờ cá nhân, các thông tin sinh trắc học… có thể dưới dạng dữ liệu thô hoặc dữ liệu được số hóa cũng giúp các đơn vị hoạt động TTTD mở rộng CSDL hiện có, tạo điều kiện nghiên cứu, ứng dụng học máy vào hoạt động.
Việc mở rộng CSDL cũng không chỉ giới hạn bởi các cách thức, đối tượng nêu trên mà còn có thể được thực hiện giữa chính các đơn vị hoạt động TTTD thông qua quá trình chia sẻ, khai thác các CSDL dùng chung trên nguyên tắc hai bên cùng có lợi và tuân thủ các quy định về an toàn, an ninh thông tin. Hướng sử dụng CSDL dùng chung để phục vụ nghiên cứu, ứng dụng học máy hay các kỹ thuật công nghệ khác có thể áp dụng với các tổ chức, đơn vị đã nêu tùy thuộc vào nhu cầu, mục đích và lợi ích chia sẻ giữa các bên.
Thứ sáu, tổ chức bộ máy phù hợp với nhiệm vụ, chiến lược phát triển mới. Triển khai ứng dụng học máy vào hoạt động TTTD không chỉ tác động đến hoạt động của đơn vị trong giai đoạn triển khai mà còn tác động sâu rộng đến hoạt động của đơn vị sau khi triển khai thành công. Chính điều này đòi hỏi các đơn vị cần có những điều chỉnh về cơ cấu, tổ chức phù hợp với nhiệm vụ và chiến lược phát triển mới.
2.2.3. Nhóm giải pháp khác
Thứ nhất, tăng cường sự tham gia từ hệ sinh thái khởi nghiệp, Fintech. Cùng với sự phát triển của các công ty khởi nghiệp, đặc biệt là các công ty khởi nghiệp CNTT và Fintech thì việc sử dụng các dịch vụ CNTT thuê ngoài đang trở thành xu thế mà các đơn vị hoạt động trong ngành tài chính - ngân hàng hướng tới. Điều này không chỉ giúp tiết kiệm chi phí, nguồn nhân lực cho doanh nghiệp mà còn tận dụng được tối đa tính sáng tạo, công nghệ hiện đại mà các doanh nghiệp Fintech mang lại.
Thực tế cho thấy, để có được sự hợp tác sâu rộng giữa các công ty khởi nghiệp với các doanh nghiệp tài chính - ngân hàng, mà cụ thể là các TCTD thì điểm mấu chốt chính là việc cởi trói cho các quan ngại về tính bảo mật, an toàn thông tin xuất phát từ quy định hiện hành từ chính các TCTD cũng như của cơ quan quản lý Nhà nước. Chính vì vậy, để có thể mở rộng, tăng cường hợp tác giữa các đơn vị hoạt động TTTD và các công ty khởi nghiệp mới, cả hai bên cần nghiên cứu, đưa ra cách thức hợp tác và các sản phẩm, dịch vụ phù hợp với quy định pháp luật và nhu cầu. Một số nội dung cần thực hiện như sau:
- Tiến hành trao đổi, phân tích rõ yêu cầu, mong muốn từ các đơn vị hoạt động TTTD và khả năng cung cấp sản phẩm, dịch vụ từ các doanh nghiệp CNTT: Thông qua các buổi hội thảo, workshop, giới thiệu, demo sản phẩm, dịch vụ sẵn có,…
- Phối hợp, hợp tác để đưa ra các đề xuất, kiến nghị thay đổi quy định là rào cản hợp tác giữa các bên lên cơ quan có thẩm quyền để cho phép triển khai thực hiện dưới dạng Sandbox hoặc sửa đổi quy định nếu đủ điều kiện.
- Xây dựng các sản phẩm, dịch vụ mới cho phép đáp ứng được các quy định hiện tại về an toàn, bảo mật thông tin: Cung cấp giải pháp tại chỗ (On-premises) đối với các nội dung yêu cầu bảo mật thông tin cao; cung cấp các dịch vụ mà dữ liệu trao đổi hai bên đã được mã hóa, không còn thông tin định danh…
Thứ hai, thúc đẩy hợp tác quốc tế trong lĩnh vực học máy, ứng dụng công nghệ mới. Đây là một giải pháp cần sự tham gia của toàn bộ các bên có liên quan đến công tác ứng dụng công nghệ mới vào hoạt động sản xuất kinh doanh nói chung và hoạt động TTTD nói riêng, từ cấp Chính phủ với vai trò dẫn dắt, tạo điều kiện, cơ chế chính sách đến cơ quan chủ quản là NHNN, các đơn vị hoạt động TTTD đến cả các doanh nghiệp CNTT, Fintech, các cá nhân và tổ chức nghiên cứu khoa học có
liên quan.
- Đối với Chính phủ, các ngành có liên quan: Tham gia tổ chức và thực hiện các chương trình, dự án hợp tác nghiên cứu khoa học song phương và đa phương về học máy, ứng dụng công nghệ mới. Thúc đẩy phát triển cơ sở, trung tâm hợp tác nghiên cứu học máy, ứng dụng công nghệ mới; các dự án hợp tác chuyển giao công nghệ, khai thác các sáng chế, quyền sở hữu công nghiệp giữa các doanh nghiệp Việt Nam với các doanh nghiệp nước ngoài về học máy, ứng dụng công nghệ mới; các trung tâm, chương trình đào tạo nhân lực học máy, ứng dụng công nghệ mới chất lượng cao.
- Đối với các tổ chức, cá nhân có liên quan: Trao đổi chuyên gia, người làm công tác nghiên cứu, sinh viên của tổ chức, doanh nghiệp với các tổ chức nghiên cứu, đào tạo, doanh nghiệp về học máy, ứng dụng công nghệ mới nước ngoài. Tham gia các hội, hiệp hội quốc tế và tổ chức khác về học máy, ứng dụng công nghệ mới. Mời các chuyên gia về học máy, ứng dụng công nghệ mới nước ngoài, người Việt Nam ở nước ngoài đến Việt Nam tham gia tư vấn, nghiên cứu, đào tạo về học máy, ứng dụng công nghệ mới.
Tài liệu tham khảo:
1. ThS. Nguyễn Thị Ánh Ngọc, ThS. Nguyễn Thị Diễm (2022), Trí tuệ nhân tạo và các ứng dụng trong lĩnh vực ngân hàng, https://tapchinganhang.gov.vn/tri-tue-nhan-tao-va-cac-ung-dung-trong-linh-vuc-ngan-hang.htm
2. ThS. Dương Tấn Khoa (2019), Fintech trong lĩnh vực ngân hàng tại Việt Nam.
3. Quyết định số 127/QĐ-TTg ngày 26/01/2021 của Thủ tướng Chính phủ ban hành Chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo đến năm 2030.
4. Quyết định số 810/QĐ-NHNN ngày 11/5/2021 của NHNN phê duyệt “Kế hoạch chuyển đổi số ngành Ngân hàng đến năm 2025, định hướng đến năm 2030”.
5. Alex Smola và S.V.N. Wishwanathan (2008), Introduction to Machine Learning.
6. Jing Li, Aixin Sun, Jianglei Han và Chenliang Li (2020), Deep Learning for Named Entity Recognition.
7. Các báo cáo nội bộ của CIC.