1. Giới thiệu
Một nghiên cứu của Ủy ban châu Âu cho thấy lượng dữ liệu được tạo ra dự kiến sẽ tăng từ 33 zettabyte (năm 2018) lên 175 zettabyte (năm 2025). Toàn bộ tiềm năng của dữ liệu hiện vẫn chưa được sử dụng vì 80% dữ liệu công nghiệp vẫn chưa được khai thác. Việc chia sẻ dữ liệu sẽ mở ra những mô hình kinh doanh hoàn toàn mới, bao gồm các khái niệm liên quan như nền kinh tế chia sẻ dữ liệu, tập trung vào chia sẻ dữ liệu B2B (doanh nghiệp với doanh nghiệp) giữa các ngành.
Quản lí dữ liệu và tạo ra chiều sâu của dữ liệu là chưa đủ để đẩy nhanh quá trình chuyển đổi số trong tổ chức, doanh nghiệp. Kết quả cuộc khảo sát Giám đốc Dữ liệu Gartner thường niên lần thứ sáu, những người được khảo sát đã đưa ra kết luận rằng, việc tăng cường chia sẻ dữ thành công đã giúp hoạt động các nhóm phân tích dữ liệu đạt hiệu quả hơn 1,7 lần. Lydia Clougherty Jones - Giám đốc phân tích cấp cao của Gartner cho biết, chia sẻ dữ liệu là cách tối ưu hóa dữ liệu có mức độ liên quan cao hơn, tạo ra dữ liệu và phân tích mạnh mẽ hơn để giải quyết các thách thức kinh doanh và đáp ứng các mục tiêu của doanh nghiệp.
Theo Gillian DieBold (2023), việc chia sẻ dữ liệu mang lại cơ hội cho các tổ chức tăng giá trị của dữ liệu mà họ sở hữu, đồng thời cho phép tiếp cận các nguồn dữ liệu bổ sung mà người khác kiểm soát. Cá nhân và tổ chức có thể sử dụng dữ liệu này để đưa ra các quyết định tốt hơn và thu được hiểu biết sâu sắc hơn, mang lại lợi ích trong nhiều lĩnh vực khác nhau. Tuy nhiên, để khai thác hết tiềm năng của dữ liệu, cá nhân và tổ chức cần có khả năng kết hợp, tăng cường và phân tích thông tin từ nhiều nguồn khác nhau. Trong doanh nghiệp tư nhân, việc chia sẻ dữ liệu giúp tạo ra sự đổi mới với đối tác, giải quyết các vấn đề chung và cung cấp trải nghiệm tốt hơn cho khách hàng. Trong lĩnh vực công, việc chia sẻ dữ liệu cho phép các cơ quan nhà nước đưa ra các quyết định tốt hơn, cung cấp các dịch vụ cá nhân hóa và phát triển chính sách dựa trên bằng chứng và hiểu biết từ dữ liệu được chia sẻ. Trong các tổ chức học thuật, việc chia sẻ dữ liệu phi lợi nhuận có thể thúc đẩy các đột phá khoa học và tạo ra dữ liệu cho lợi ích của cộng đồng. Bên cạnh đó, các tổ chức tài chính có thể tổng hợp dữ liệu của mình để xây dựng cơ chế phát hiện gian lận tốt hơn.
Một loạt các nghiên cứu khác cũng chỉ ra tiềm năng to lớn của việc chia sẻ dữ liệu. Nghiên cứu của D’Hauwers và Walravens (2021) đã chỉ ra rằng việc chia sẻ dữ liệu mang lại cơ hội mới để thúc đẩy đổi mới và điều chỉnh các mô hình kinh doanh. Chia sẻ dữ liệu cho phép các vấn đề kinh doanh được giải quyết theo cách cộng tác. Điều này mang lại không gian để phát triển các sản phẩm mới hoặc nâng cao các sản phẩm hiện có và cải thiện các quy trình nội bộ bằng cách làm phong phú chúng bằng dữ liệu. Cách tích hợp dữ liệu mới này vào các công ty như một nguồn lực mở ra cơ hội phát triển những mô hình kinh doanh mới, quan hệ đối tác và thị trường mới.
2. Chia sẻ dữ liệu
Chia sẻ dữ liệu là hành động cung cấp dữ liệu hoặc quyền truy cập dữ liệu từ chủ sở hữu dữ liệu cho người dùng dữ liệu, thường là pháp nhân thứ ba (trực tiếp hoặc thông qua bên trung gian, cho mục đích xử lí xác định, tùy thuộc vào các quy định kĩ thuật, tài chính, yêu cầu sử dụng hợp pháp) hoặc tổ chức (dựa trên các thỏa thuận tự nguyện).
Chia sẻ dữ liệu là một hoạt động quan trọng trong nghiên cứu khoa học nhằm cho phép thực hiện nhiều phân tích khác nhau và tối đa hóa tiềm năng của dữ liệu nhằm phục vụ những tiến bộ về kiến thức và đổi mới về sức khỏe. Chia sẻ dữ liệu cho phép đạt được các mục đích nghiên cứu ban đầu và tái sử dụng dữ liệu cho những mục đích nghiên cứu khác, bao gồm cả nghiên cứu nhân rộng.
Những bên tham gia chia sẻ dữ liệu có thể là các bên liên quan trong một dự án nghiên cứu duy nhất (chia sẻ dữ liệu dưới dạng cộng tác). Việc chia sẻ cũng có thể diễn ra với các bên liên quan không tham gia vào dự án hợp tác (chia sẻ dữ liệu dưới dạng cung cấp dịch vụ). Điều này bao gồm chia sẻ dữ liệu với/hoặc giữa các công ty tư nhân khác nhau, cũng như từ một công ty tư nhân đến khu vực công và từ một cơ quan khu vực công đến một công ty tư nhân...
Phương pháp tiếp cận chia sẻ dữ liệu cũng rất khác nhau, liên quan đến nhiều loại tác nhân và có những mục tiêu khác nhau. Ví dụ: Hai doanh nghiệp có thể sử dụng thỏa thuận hợp đồng để chia sẻ dữ liệu nhằm tạo điều kiện hợp tác trong một dự án quy mô lớn. Hoặc nhiều cá nhân có thể chia sẻ dữ liệu thông qua một tổ chức độc lập để thu lợi tài chính. (Bảng 1)
Bảng 1: Một số khái niệm liên quan trực tiếp đến hoạt động chia sẻ dữ liệu
3. Những khó khăn và thách thức của chia sẻ dữ liệu
Bất chấp những lợi ích của việc chia sẻ dữ liệu, nhiều tổ chức, doanh nghiệp không chia sẻ dữ liệu vì việc thiết lập quy trình chia sẻ dữ liệu là một quá trình lâu dài, phức tạp và tốn kém, trong khi lợi ích tức thì của nó mang lại dường như chưa chắc chắn. Ví dụ như, vấn đề chia sẻ để cải thiện khả năng phát hiện gian lận: Các tổ chức tài chính có thể tổng hợp dữ liệu để xây dựng cơ chế phát hiện gian lận tốt hơn. Trước khi chia sẻ dữ liệu, họ sẽ đặt câu hỏi: “Liệu lợi ích trong tương lai ít nhất có tốt bằng giá trị mà dữ liệu của họ sẽ mang lại cho người khác hay không?” Sự không chắc chắn trong những tình huống này dẫn đến mặc định là các doanh nghiệp không chia sẻ dữ liệu của mình, làm cho nhiều cơ hội chia sẻ dữ liệu không được khai thác.
Ngoài ra, các công ty phải đối mặt với thách thức là vẫn chưa có cơ sở hạ tầng để trao đổi dữ liệu và cả những thách thức xã hội. Trở ngại đáng kể trong việc thiết lập chia sẻ dữ liệu trong các công ty là lo ngại về việc lộ dữ liệu nhạy cảm, mất quyền kiểm soát dữ liệu hoặc dữ liệu sẽ bị sử dụng sai mục đích. Sự thiếu sự tin tưởng và lo ngại về việc mang lại lợi thế cạnh tranh cho đối thủ bằng cách chia sẻ dữ liệu là trở ngại lớn cho việc chia sẻ dữ liệu giữa các tổ chức hay doanh nghiệp.
Bên cạnh đó, việc dữ liệu có chất lượng kém và thiếu khả năng tương tác cũng hạn chế các doanh nghiệp trong việc sử dụng công nghệ và thuật toán để xử lí và rút, trích thông tin quý giá từ dữ liệu.
Một nguyên do đặc biệt quan trọng khác là sự không chắc chắn về quy định và pháp lí cho việc chia sẻ dữ liệu. Đây là một rào cản lớn, làm suy yếu niềm tin cần thiết cho việc chia sẻ dữ liệu. Từ sự khác nhau giữa các quy định về chia sẻ dữ liệu giữa những quốc gia khác nhau đến sự hoàn thiện quy định chia sẻ dữ liệu trong một quốc gia và quy định chia sẻ dữ liệu tại các tổ chức, doanh nghiệp là một trong những khó khăn rất lớn để tổ chức, doanh nghiệp có thể thúc đẩy hoạt động chia sẻ dữ liệu. Các doanh nghiệp, nếu muốn tham gia vào hệ sinh thái dữ liệu, cần phải tin tưởng rằng thông tin bí mật của họ là dữ liệu thương mại được bảo vệ và có độ chắc chắn cao hơn khi nói đến sở hữu trí tuệ, quyền riêng tư, cạnh tranh, nội địa hóa dữ liệu và các quy tắc trách nhiệm pháp lí.
4. Mô hình chia sẻ dữ liệu và khuyến nghị
Các mô hình chia sẻ dữ liệu khác nhau dựa trên người đóng góp dữ liệu, quyền truy cập, lưu trữ và lợi ích từ việc chia sẻ. Người đóng góp có thể là cá nhân, doanh nghiệp, tổ chức chính phủ, phi lợi nhuận hoặc nghiên cứu. Tương tự, những người này cũng có thể là người nhận dữ liệu theo thỏa thuận. Ví dụ, một cơ quan nhà nước có thể chia sẻ dữ liệu sức khỏe với các công ty dược phẩm đang nghiên cứu các loại thuốc mới. Hoặc một công ty dược phẩm có thể chia sẻ dữ liệu về việc phân phối vaccine với chính phủ hoặc nhà nghiên cứu y tế công cộng. Thỏa thuận có thể là một chiều hoặc hai chiều, tùy thuộc vào mục đích cụ thể. Các mô hình chia sẻ dữ liệu khác nhau dựa trên người nhận và lưu trữ dữ liệu, điều này là điểm khác biệt quan trọng giữa chúng.
Một số mô hình chia sẻ dữ liệu
Chia sẻ dữ liệu đối tác (Data - sharing partnerships (DSP))
Dữ liệu được chia sẻ giữa các tổ chức và cá nhân thông qua các thỏa thuận đối tác, bao gồm các tổ chức học thuật, nghiên cứu, đối tác trong ngành, người tiêu dùng và cơ quan nhà nước, nhằm mục đích tiến hành nghiên cứu, hợp tác trên các sản phẩm mới và cải thiện ra quyết định dựa trên dữ liệu. Mục đích là để hợp tác trong nghiên cứu, phát triển sản phẩm mới và cải thiện quyết định dựa trên dữ liệu. Thỏa thuận chia sẻ dữ liệu thường đòi hỏi sự rõ ràng trong việc xác định quyền truy cập, sử dụng và sở hữu tài sản trí tuệ, tùy thuộc vào loại dữ liệu và tính chất của sự hợp tác. Ví dụ, trong lĩnh vực chăm sóc sức khỏe, sự hợp tác giữa bệnh viện, tổ chức nghiên cứu và nhà cung cấp dịch vụ y tế có thể tận dụng phân tích dữ liệu và trí tuệ nhân tạo (AI) để cải thiện kết quả cho bệnh nhân.
Các DSP mang lại nhiều lợi ích cho tất cả các bên liên quan. Đối với nhà nghiên cứu, việc hợp tác này cung cấp quyền truy cập vào tập dữ liệu lớn hơn, giúp có những hiểu biết sâu sắc và khắc phục được nhược điểm của việc sử dụng một tập dữ liệu duy nhất, quá nhỏ hoặc thiếu thông tin liên quan cần thiết. Trong các lĩnh vực nhạy cảm như chăm sóc sức khỏe, các mối quan hệ đối tác nghiên cứu không chỉ bảo vệ tính bảo mật của thông tin bệnh nhân mà còn cho phép các tổ chức hợp tác và tổng hợp thông tin chi tiết. Điều này cũng giúp giảm thiểu sự trùng lặp dữ liệu, tiết kiệm thời gian và chi phí cho nhà nghiên cứu.
Tuy nhiên, mô hình chia sẻ dữ liệu này cũng gặp phải một số hạn chế. Ví dụ, khi các tổ chức cạnh tranh hợp tác chia sẻ dữ liệu, thường xuất hiện lo ngại về sở hữu trí tuệ và cạnh tranh. Tương tự, những hợp tác như vậy có thể liên quan đến bộ dữ liệu với chất lượng và tiêu chuẩn khác nhau. Những thách thức này cần được giải quyết trước khi tiến hành bất kì hoạt động chia sẻ nào.
Khuyến nghị: Tạo điều kiện thuận lợi DSP với các hợp đồng mẫu. DSP là mô hình chia sẻ dữ liệu cơ bản nhất và cần được các nhà hoạch định chính sách hỗ trợ. Khi nói đến quan hệ đối tác chia sẻ dữ liệu, các tổ chức thường buộc phải thực hiện quy trình đàm phán và hợp đồng lại từ đầu mỗi khi có cơ hội cộng tác mới. Các nhà hoạch định chính sách nên giảm bớt rào cản này và tạo điều kiện thuận lợi hơn cho các mối quan hệ đối tác chia sẻ dữ liệu bằng cách phát triển mẫu hợp đồng mà các tổ chức có thể áp dụng và tùy chỉnh (ví dụ: Loại dữ liệu, điều khoản lưu giữ, quyền sở hữu trí tuệ...). Một số quốc gia như Singapore đã cung cấp loại hình này hướng dẫn cho các mô hình DSP và nhờ đó đã thúc đẩy nghiên cứu và đổi mới.
Cộng đồng dữ liệu (Data Consortia - DC)
Mô hình DC cho phép tổ chức tổng hợp dữ liệu của họ vì lợi ích cộng đồng. Khác với mô hình DSP, mô hình này tạo ra các thỏa thuận chia sẻ dữ liệu có tính tương tác để giải quyết các vấn đề cụ thể và liên tục chia sẻ thông tin. Ví dụ, các thị trấn dọc theo bờ sông có thể tạo ra một cộng đồng chia sẻ dữ liệu về vi khuẩn trong nước, hoặc các bệnh viện có thể hình thành một tập đoàn chia sẻ dữ liệu về căn bệnh hiếm. Ngân hàng có thể cùng chia sẻ thông tin về những cuộc tấn công mạng và các chợ trực tuyến có thể hình thành DC để chia sẻ thông tin về người bán.
Các DC đã đóng vai trò quan trọng trong việc điền vào các khoảng trống dữ liệu. Tuy nhiên, trước khi đạt được quy mô đủ lớn và xảy ra hiệu ứng mạnh mẽ của việc chia sẻ dữ liệu, một số tổ chức có thể tốt hơn khi giữ dữ liệu của họ để sử dụng nội bộ. Điều này đòi hỏi các tập đoàn phải cân nhắc kĩ lưỡng trước khi tham gia chia sẻ dữ liệu trong giai đoạn ban đầu của quá trình.
Khuyến nghị: Khảo sát và xác định cơ hội cho các tập đoàn dữ liệu liên ngành. Các cơ quan quản lí nên tạo danh sách những tập đoàn dữ liệu hiện có trong các lĩnh vực cụ thể và khuyến khích việc thành lập các DC liên ngành mới cho những lĩnh vực quan trọng. Các DC có thể cung cấp cho các nhà hoạch định chính sách quyền truy cập vào phạm vi dữ liệu rộng lớn và đa dạng hơn, bao gồm cả từ các cơ quan khác và khu vực tư nhân.
Ủy thác dữ liệu (Data Trusts - DT)
DT là cách quản lí, bảo vệ và chia sẻ dữ liệu thay mặt cho cá nhân và tổ chức. Mặc dù có nhiều định nghĩa khác nhau nhưng cơ chế chia sẻ dữ liệu này thường bao gồm việc ủy quyền quản lí dữ liệu cho một bên thứ ba độc lập, gọi là người được ủy thác. Điều này giúp tận dụng giá trị của dữ liệu cho lợi ích của cộng đồng.
Mô hình DT là một xu hướng mới đang được thử nghiệm trên toàn cầu, đặc biệt là ở Anh trong lĩnh vực chăm sóc sức khỏe. Ví dụ, Biobank của Anh quản lí dữ liệu gen của hơn 500.000 người để sử dụng trong nghiên cứu, với mục tiêu cải thiện sức khỏe cộng đồng. Dịch vụ Y tế quốc gia ở Anh (NHS) cũng đang phát triển Nền tảng Dữ liệu Liên kết NHS để tổng hợp dữ liệu sức khỏe từ nhiều nguồn khác nhau. Mô hình này mang lại lợi ích xã hội từ dữ liệu và tạo điều kiện thuận lợi cho tính minh bạch và trách nhiệm trong việc sử dụng dữ liệu.
Tuy nhiên, mô hình DT đối diện với những thách thức riêng. Tính nhạy cảm của dữ liệu và sự phản đối từ cộng đồng có thể làm trì hoãn hoặc hủy bỏ các dự án. Việc triển khai cũng đòi hỏi nhiều nguồn lực về tài chính, kĩ thuật và nhân lực, đồng thời có thể mâu thuẫn với luật bảo vệ dữ liệu.
Khuyến nghị: Thực hiện DT theo ngành cụ thể. Các lĩnh vực như chăm sóc sức khỏe, giao thông, giáo dục và môi trường có thể hưởng lợi lớn từ việc thành lập các quỹ DT theo ngành. Những quỹ này có thể tổng hợp và quản lí dữ liệu từ nhiều bên liên quan, từ đó hỗ trợ nghiên cứu, cải thiện dịch vụ và thúc đẩy hiệu quả xã hội.
Hợp tác xã dữ liệu (Data Cooperatives - DCO)
DCO là một phương thức quản lí dữ liệu từ dưới lên, trong đó các cá nhân tự nguyện tổng hợp dữ liệu của mình để chia sẻ với các công ty tư nhân và tổ chức khác. DCO thiết lập quy tắc chia sẻ dữ liệu nhằm mang lại lợi ích cho nhóm và kiếm tiền từ dữ liệu tập thể. Ví dụ, Hợp tác xã Driver’s Seat thu thập dữ liệu trên điện thoại di động của người lao động để tối ưu hóa thu nhập và bán thông tin này cho chính quyền địa phương.
Một thách thức cho DCO là tính kinh tế không phải lúc nào cũng hiệu quả. Giá trị mỗi người đóng góp dữ liệu có thể nhỏ và hợp tác xã cần sự tham gia rộng rãi để thành công. Họ phải cân nhắc cẩn thận về cách trả thù lao cho thành viên để đảm bảo sự hợp tác bền vững. Mặc dù hợp tác dữ liệu còn mới và có các hạn chế, nhưng tương tự như các liên đoàn lao động, nó cung cấp một cơ chế quan trọng để thương lượng tập thể về lợi ích của dữ liệu.
Khuyến nghị: Khám phá DCO ở những khu vực diễn ra các hợp tác xã phi dữ liệu và thương lượng tập thể. DCO hữu ích khi các cá nhân không muốn chia sẻ dữ liệu của họ với bên thứ ba vì lo ngại về việc sử dụng dữ liệu đó cho lợi ích cá nhân hoặc doanh nghiệp khác. Thông qua việc thành lập các DCO, những người giữ dữ liệu có quyền đàm phán về việc chia sẻ dữ liệu theo các điều khoản mà họ mong muốn, giúp vượt qua sự miễn cưỡng trong việc thu thập và chia sẻ dữ liệu. Các cơ quan quản lí có thể hỗ trợ các hình thức hợp tác này trong các lĩnh vực tương ứng.
Phân tích dữ liệu liên kết (Federated Data Analytics - FDA)
FDA cho phép xử lí dữ liệu mà không cần chia sẻ hoặc lưu trữ dữ liệu trực tiếp. Dữ liệu được phân tích ở các vị trí khác nhau và kết quả tổng hợp được chuyển đến một vị trí tập trung. Ví dụ, một công ty có thể phân tích dữ liệu trên thiết bị của khách hàng mà không cần chuyển dữ liệu đến công ty. Phương pháp này gọi là học liên kết, cho phép thu thập thông tin chi tiết mà không cần chia sẻ dữ liệu gốc. Điều này giúp giảm nỗi lo về quyền riêng tư và thông tin độc quyền.
FDA mở ra cơ hội truy cập vào số lượng lớn dữ liệu mà không cần tiết lộ thông tin cá nhân cụ thể. Điều này đặc biệt hữu ích trong lĩnh vực y tế, nơi dữ liệu bệnh nhân phải tuân thủ các quy định về quyền riêng tư nghiêm ngặt. Phương pháp này cho phép phân tích dữ liệu mà không cần tiết lộ thông tin nhạy cảm, đồng thời giữ cho từng nhà cung cấp dữ liệu giữ quyền kiểm soát. Đây là công cụ quan trọng trong việc nghiên cứu y sinh và thử nghiệm lâm sàng, đặc biệt trong việc nghiên cứu các bệnh hiếm. Các mạng dữ liệu y tế liên kết cũng có thể hỗ trợ phân tích quy mô lớn, vượt qua các rào cản tổ chức và biên giới.
Tuy nhiên, phân tích liên kết đối mặt với nhược điểm về chi phí, khả năng mở rộng, sự phản đối từ các bên liên quan và thiếu sự sẵn sàng về kĩ thuật. Chi phí tính toán có thể cao và việc mở rộng gặp hạn chế, đặc biệt trong lĩnh vực chăm sóc sức khỏe. Một số tổ chức không sẵn sàng hoặc không có kĩ năng để triển khai phân tích liên kết. Để thành công, cần một nền tảng mở rộng và giao diện lập trình ứng dụng (API) tiên tiến.
Khuyến nghị: Tiếp tục tài trợ cho phân tích liên kết. Các nhà quản lí cần nhìn nhận rõ vai trò của FDA và các công nghệ bảo vệ quyền riêng tư khác. Các điều chỉnh chính sách về mô hình chia sẻ dữ liệu phân tích liên kết là cần thiết, có thể là một lựa chọn kĩ thuật trong những trường hợp chia sẻ dữ liệu gặp rào cản.
Các thỏa thuận hợp tác nghiên cứu và phát triển (Cooperative Research and Development Agreements - CRADA)
CRADA là một loại hợp tác giữa chính phủ và tư nhân, nơi các tổ chức nghiên cứu của chính phủ chia sẻ dữ liệu với các đối tác tư nhân để thúc đẩy việc thương mại hóa dự án nghiên cứu và phát triển (R&D). Trong CRADA, chính phủ cung cấp các tài nguyên như nhân sự, dịch vụ, cơ sở vật chất, dữ liệu và sở hữu trí tuệ cho đối tác mà không cung cấp kinh phí. Các đối tác từ khu vực tư nhân có thể cung cấp cả dịch vụ và tài chính cho R&D. CRADA cho phép các đối tác tư nhân đề xuất bằng sáng chế và giữ quyền sở hữu trí tuệ trong khi chính phủ giữ lại quyền cấp giấy phép sử dụng cho bất kì sản phẩm thương mại nào phát sinh từ dự án.
CRADA mang lại một số lợi ích đáng kể. Đầu tiên, chúng không ảnh hưởng đến ngân sách nhà nước vì chúng tận dụng cơ sở hạ tầng hiện có, tạo điều kiện cho sự hợp tác giữa chính phủ và tư nhân trở nên hiệu quả hơn. CRADA cũng bảo vệ quyền sở hữu trí tuệ và cho phép đối tác kiếm tiền từ các giải pháp, mang lại những ưu đãi cho họ. Ở mức cao hơn, các thỏa thuận này giúp mở rộng và nâng cao chuyên môn hiện có của chính phủ, ngành công nghiệp và giới học thuật, đồng thời góp phần nâng cao khả năng cạnh tranh quốc gia và thúc đẩy đổi mới.
CRADA, dưới tính chất tập trung và hợp đồng, yêu cầu việc ủy quyền và thương lượng cẩn thận về các vấn đề pháp lí và quyền sở hữu trí tuệ. Thỏa thuận này giữa nhà nước và khu vực tư nhân cho phép chia sẻ dữ liệu và tài nguyên nhưng không bao gồm kinh phí. Các đối tác tư nhân có thể là tập đoàn, tổ chức phi lợi nhuận, trường đại học, chính phủ, địa phương đóng góp dịch vụ và có thể tài trợ cho R&D. CRADA cung cấp cho đối tác quyền sở hữu trí tuệ và bảo vệ sở hữu trí tuệ, trong khi chính phủ được cấp giấy phép cho các sản phẩm thương mại hóa. Tuy nhiên, việc thực hiện CRADA có thể phức tạp với một số tổ chức nghiên cứu không thích hoặc không thể tham gia vào hợp tác này.
Khuyến nghị: Nhiều cơ quan chính phủ đã sử dụng CRADA, đặc biệt là trong lĩnh vực vật lí và y tế. Các cơ quan liên bang nên tiếp tục quảng bá và cấp phép cho chúng do lợi ích mà thỏa thuận chia sẻ dữ liệu này mang lại.
5. Phát triển chính sách quản lí và chia sẻ dữ liệu
Các nhà nghiên cứu y tế và sản xuất dữ liệu khác không muốn chia sẻ dữ liệu của họ trừ khi tin tưởng vào chất lượng và độ tin cậy của dữ liệu đó, cũng như sự phù hợp của việc sử dụng dữ liệu đó với các giá trị và mục tiêu của tổ chức. Việc thiết lập các chính sách chia sẻ và quản lí dữ liệu trong tổ chức, phòng, ban hoặc nhóm là bước quan trọng đầu tiên để khuyến khích các nhà nghiên cứu và chuyên gia y tế chia sẻ dữ liệu một cách rộng rãi hơn. Các yếu tố của chính sách này bao gồm mục tiêu phù hợp với mục tiêu của tổ chức, các quy trình quản lí dữ liệu, mô hình chia sẻ dữ liệu, thủ tục yêu cầu, mô hình đồng ý và cơ chế thu hồi chi phí. Một chính sách chia sẻ dữ liệu giúp tối đa hóa việc sử dụng dữ liệu và bảo vệ lợi ích của tổ chức và các thành viên của nó. Trong một nghiên cứu đã đề xuất các khuyến nghị dựa trên kinh nghiệm thu thập và quản lí dữ liệu cho các thử nghiệm lâm sàng lớn ở các quốc gia có thu nhập thấp và trung bình, tạo điều kiện thuận lợi cho việc chia sẻ tập dữ liệu với người dùng thứ cấp và đồng thời cung cấp giáo dục về quản lí dữ liệu và tiến hành nghiên cứu thực nghiệm về chia sẻ dữ liệu.
Mặc dù chia sẻ dữ liệu là vấn đề cần thiết đối với các tổ chức, doanh nghiệp nhưng cũng đầy khó khăn và thách thức. Việc tạo ra một cơ sở tin cậy và phương thức chia sẻ dữ liệu minh bạch là rất quan trọng. Các sáng kiến như việc phát triển một khuôn khổ an toàn và đáng tin cậy để chia sẻ dữ liệu đã được đề xuất. Ngoài ra, việc xây dựng các khung pháp lí mới như đạo luật về dữ liệu hoặc các quy định chung về bảo vệ dữ liệu cũng là một cách hiệu quả. Dự báo của Ủy ban châu Âu cho thấy rằng các khung pháp lí như vậy không chỉ cần thiết vì mục đích an toàn mà còn có thể tạo ra GDP bổ sung 270 tỉ EUR trong EU vào năm 2028.
Các yếu tố của chính sách quản lí và chia sẻ dữ liệu
Mục đích
Chính sách quản lí và chia sẻ dữ liệu cần phù hợp với mục tiêu của tổ chức. Ví dụ, tổ chức muốn cải thiện việc điều trị bệnh sốt rét cần có chính sách hỗ trợ chia sẻ dữ liệu để thúc đẩy mục tiêu này. Điều này giúp nhà nghiên cứu lập kế hoạch chia sẻ dữ liệu một cách hiệu quả và an toàn, đồng thời tạo động lực nội bộ mạnh mẽ. Chính sách cần cụ thể, phù hợp với nguyên tắc đạo đức và yêu cầu pháp lí để bảo vệ nhà nghiên cứu và người tham gia. Tham vấn chuyên sâu và liên kết với các bên liên quan trong và ngoài tổ chức là quan trọng. Xác định phạm vi và danh mục dữ liệu cần thu thập, kết hợp với xem xét các chính sách của nhà tài trợ, cũng như các yêu cầu về đạo đức và quy định cũng là điều cần thiết.
Quản lí dữ liệu cho chia sẻ dữ liệu
Để chia sẻ dữ liệu hiệu quả, điều quan trọng là đảm bảo tính chính xác và đáng tin cậy của dữ liệu và kết quả, cùng bảo vệ quyền và tính toàn vẹn của người tham gia. Quản lí dữ liệu tốt đảm bảo tạo ra các bộ dữ liệu chất lượng và đáng tin cậy, từ thiết kế nghiên cứu đến lưu trữ dữ liệu.
Chính sách quản lí và chia sẻ dữ liệu cần đề ra các yêu cầu liên quan đến quy trình thu thập, quản lí, lưu trữ và chia sẻ dữ liệu, cùng cung cấp hướng dẫn về kế hoạch chia sẻ và quản lí dữ liệu cho nghiên cứu. Kế hoạch này cần chi tiết các thủ tục cho từng nghiên cứu cụ thể và thường được yêu cầu bởi các nhà tài trợ nghiên cứu y sinh. Việc xem xét chia sẻ dữ liệu từ đầu dự án đảm bảo việc phân bổ đủ nguồn lực cho hoạt động quản lí dữ liệu, bao gồm cả chi phí cho phần cứng, phần mềm, nhân viên, đào tạo và lưu trữ dữ liệu. Chính sách cũng cần xác định yêu cầu thể chế cho các kho dữ liệu và hướng dẫn về việc hoàn thành biểu mẫu báo cáo và từ điển dữ liệu.
Để quản lí và chia sẻ dữ liệu, tổ chức cần đầu tư vào việc xây dựng năng lực quản lí dữ liệu qua việc đào tạo nhân viên và nhà nghiên cứu về dữ liệu, cũng như cung cấp cơ sở hạ tầng công nghệ cần thiết như máy chủ và mạng. Các nhóm nghiên cứu cần hiểu cách xử lí và chuyển đổi dữ liệu thành định dạng có thể chia sẻ và cách lưu trữ dữ liệu an toàn trong suốt thời gian nghiên cứu. Điều này đòi hỏi hiểu biết về mã hóa dữ liệu, bảo mật thông tin và kiến thức về các công cụ và phần mềm quản lí dữ liệu.
Các mô hình chia sẻ
Các phương thức cung cấp dữ liệu cho người dùng thứ cấp, bao gồm: (1) Truy cập trực tuyến mở, như tệp bổ sung cho bài báo; (2) Lưu trữ ngoài kho không đánh giá từng trường hợp, như Figshare; (3) Quản lí quyền truy cập thông qua đơn đăng kí tới DAC - một ủy ban đánh giá yêu cầu truy cập. Có nhiều loại DAC khác nhau, bao gồm DAC tổ chức, DAC độc lập và DAC dành riêng cho các tập đoàn nghiên cứu.
Các mô hình chia sẻ dữ liệu sẽ phụ thuộc vào loại dữ liệu, quy định hiện hành và mô hình chấp thuận. Đối với mô hình truy cập được quản lí, cần xác định rõ vai trò, trách nhiệm và tư cách của các thành viên DAC. Cơ quan cần quyết định cơ chế cho quy trình đăng kí và tiêu chí đánh giá đơn đăng kí, bao gồm mục đích sử dụng dữ liệu, đối tượng đăng kí, lợi ích dự kiến từ việc chia sẻ và các nguy cơ tiềm ẩn.
Tiêu chí truy cập dữ liệu
Chính sách chia sẻ dữ liệu cần cung cấp hướng dẫn về thời điểm áp dụng các điều kiện truy cập cụ thể, tuân theo yêu cầu của nhà tài trợ và các quy định khác. Điều này có thể bao gồm yêu cầu công nhận, lời cảm ơn hoặc trích dẫn tiêu chuẩn. Trong một số trường hợp, việc hợp tác có thể là cần thiết, đặc biệt khi việc giải thích dữ liệu đòi hỏi kinh nghiệm và sự hiểu biết sâu sắc về bối cảnh. Thêm vào đó, có thể có các quy định về thời gian tiếp cận độc quyền, yêu cầu chia sẻ lợi ích, điều khoản tiếp cận ưu đãi (ví dụ: Đối với những người nghiên cứu và cộng tác viên ở các quốc gia có thu nhập thấp và trung bình) và thời gian cấm vận. Cuối cùng, chính sách cần xác định thời điểm kí các thỏa thuận truy cập dữ liệu chính thức và bên nào có trách nhiệm kí kết các thỏa thuận này.
Mô hình chấp thuận cho người tham gia
Ngoài ra, cần xem xét các loại mô hình chấp thuận/đồng ý khác nhau, bao gồm không có sự đồng ý, sự đồng ý cụ thể và sự đồng ý rộng rãi. Mỗi mô hình chấp thuận đều có những ưu và nhược điểm, cũng như các vấn đề pháp lí và thực tiễn riêng. Sự đồng ý rộng rãi»đã được đề xuất là một cơ chế cho phép sử dụng dữ liệu trong các nghiên cứu tương lai với một số hạn chế. Tuy nhiên, từ kinh nghiệm của các nhà nghiên cứu ở các quốc gia có thu nhập thấp và trung bình (LMIC), những người tham gia thường chưa thực sự hiểu đầy đủ thông tin trong các nghiên cứu cơ bản. Nghiên cứu gần đây của nhóm tác giả chỉ ra rằng, việc cung cấp thông tin và nhận sự đồng ý rộng rãi để chia sẻ dữ liệu ngoài sự đồng ý cho nghiên cứu chính sẽ tạo ra một lớp phức tạp khác trong quy trình đồng ý. Đối với mô hình chấp thuận được lựa chọn, cần tuân thủ các yêu cầu, mẫu chấp thuận, tài liệu đăng kí đạo đức và đào tạo cần thiết để đảm bảo sự đồng ý của nhân viên. Đối với các nghiên cứu đa trung tâm, sự tham gia của các cộng tác viên là cần thiết để đảm bảo rằng các thỏa thuận nghiên cứu lâm sàng bao gồm các điều khoản về chia sẻ và đồng ý dữ liệu.
Lập ngân sách và thu hồi chi phí
Việc chia sẻ dữ liệu không nhằm tạo ra lợi nhuận cho các nhà nghiên cứu chính, mà nhằm mục đích chia sẻ các chi phí thực tế giữa người dùng chính và người dùng thứ cấp. Các chi phí cần xem xét có thể bao gồm thời gian dành cho việc quản lí và chia sẻ dữ liệu, thời gian của các thành viên trong ủy ban xem xét yêu cầu dữ liệu, cũng như chi phí hành chính chung. Chi phí này có thể được chia sẻ giữa người dùng chính và người dùng thứ cấp, bao gồm chi phí phần cứng, phần mềm, lưu trữ dữ liệu và nhân viên (bao gồm cả đào tạo), đặc biệt là đối với các bộ dữ liệu cũ. Chính sách chia sẻ dữ liệu cần phải cung cấp mô tả về phí dữ liệu (nếu có) và cách tính phí dữ liệu.
6. Một số kiến nghị thúc đẩy hoạt động chia sẻ dữ liệu
Thiết lập cơ chế dựa trên sự tin cậy
Nếu không thể xây dựng sự tin cậy trong quá trình chia sẻ dữ liệu thì sẽ không thể đạt được giá trị kinh doanh từ dữ liệu thu thập. Việc phát triển các cơ chế dựa trên độ tin cậy nhằm thiết lập mức độ tin cậy cao đối với nguồn dữ liệu và riêng biệt về độ tin cậy của dữ liệu là rất quan trọng. Điều này cho phép điều chỉnh việc sử dụng dữ liệu để phù hợp với mục tiêu của tổ chức.
Một điểm quan trọng là phải tin tưởng vào chất lượng của dữ liệu đã thu thập, sử dụng và chia sẻ để phù hợp với bối cảnh và yêu cầu của tổ chức. Các tổ chức cần tin tưởng vào nguồn dữ liệu của mình để có thể dựa vào (và chuyển cho người khác) các quyền thích hợp và có thể thực thi được để sử dụng, tái sử dụng, chia sẻ và phân phối lại dữ liệu.
Thúc đẩy văn hóa chia sẻ dữ liệu - không phải văn hóa “sở hữu” dữ liệu - bằng cách xác định các tác động về mặt cảm xúc và những thành kiến cố hữu cản trở việc chia sẻ dữ liệu.
Áp dụng các công nghệ tin cậy kĩ thuật số, như hợp đồng thông minh Blockchain để thu thập dữ liệu một cách an toàn cũng như chuyển giao và chia sẻ tài sản có giá trị tiền tệ hoặc phi tiền tệ một cách hiệu quả là một phương tiện quan trọng.
Nói chung, cần sử dụng dữ liệu và danh mục dữ liệu nâng cao để tổng hợp dữ liệu của tổ chức, cá nhân và thực hiện các đánh giá để xác định độ tin cậy của nguồn dữ liệu. Từ năm 2021, các tổ chức đã cung cấp cho người dùng quyền truy cập vào danh mục dữ liệu được chuẩn bị nội bộ và bên ngoài được tuyển chọn với giá trị kinh doanh cao hơn 100% từ các khoản đầu tư vào phân tích so với những tổ chức không làm như vậy.
Chuẩn bị môi trường để chia sẻ dữ liệu
Nhằm thúc đẩy việc chia sẻ dữ liệu, các nhà lãnh đạo doanh nghiệp ở các đơn vị kinh doanh cần có tư duy chia sẻ dữ liệu. Thúc đẩy sự hợp tác ngay cả khi mục đích chia sẻ dữ liệu có thể khác nhau hoặc xung đột, tránh văn hóa “quyền sở hữu” dữ liệu - bằng cách xác định các tác động về mặt cảm xúc và những thành kiến cố hữu cản trở việc chia sẻ dữ liệu.
Trong bộ phận công nghệ thông tin của các tổ chức cần phân biệt chiến lược quản lí dữ liệu giữa kho dữ liệu, hồ dữ liệu và trung tâm dữ liệu. Tạo các phương pháp quản lí dữ liệu mới và linh hoạt để thích ứng với môi trường không chắc chắn và luôn thay đổi.
Ưu tiên các trường hợp sử dụng trong đó việc tăng cường chia sẻ dữ liệu sẽ mang lại sự liên kết tối đa với kết quả kinh doanh, bao gồm tăng tiết kiệm chi phí, tạo ra doanh thu ròng mới hoặc giá trị phi tiền tệ cũng như cải thiện khả năng ra quyết định giảm thiểu rủi ro.
7. Kết luận
Trong bối cảnh hiện nay, dữ liệu đóng vai trò rất lớn trong hoạt động kinh doanh của mọi tổ chức. Đặc biệt trong thời đại số, việc chia sẻ dữ liệu mang lại nhiều cơ hội mới và tiềm năng lớn để tạo ra giá trị và thúc đẩy sự đổi mới trong tổ chức và doanh nghiệp. Tuy nhiên, cũng không thể phủ nhận rằng việc này đặt ra nhiều thách thức cần được giải quyết, bao gồm vấn đề về bảo mật và quyền riêng tư. Để khai thác tối đa lợi ích của việc chia sẻ dữ liệu, các tổ chức cần phải xem xét và áp dụng các mô hình chia sẻ hiệu quả, đồng thời phải tăng cường hợp tác và tuân thủ các quy định pháp lí liên quan. Chỉ thông qua sự cộng tác và chia sẻ thông tin, chúng ta mới có thể tiến xa hơn trong việc tạo ra giá trị và thúc đẩy sự phát triển kinh tế - xã hội.
Tài liệu tham khảo:
1. Ada Lovelace Institute and AI Council (2021). Exploring Legal Mechanisms for Data Stewardship. https://www.adalovelaceinstitute.org/wp-content/uploads/2021/03/Legalmechanisms-for-data-stewardship_report_Ada_AI-Council-2.pdf
2. Bastiaansen, H., Dalmolen, S., Kollenstart, M., & Punter, M. (2019). Infrastructural Sovereignty over Agreement and Transaction Data (‘Metadata’) in an Open Network-Model for Multilateral Sharing of Sensitive Data. In Proceedings of the 40th International Conference on Information Systems, Munich: Germany.
3. Bellary, S., Krishnankutty, B., & Latha, M. S. (2014). Basics of case report form designing in clinical research. Perspectives in clinical research, 5(4), 159.
4. Cheah, P. Y., Tangseefa, D., Somsaman, A., Chunsuttiwat, T., Nosten, F., Day, N. P., ... & Parker, M. (2015). Perceived benefits, harms, and views about how to share data responsibly: a qualitative study of experiences with and attitudes toward data sharing among research staff and community representatives in Thailand. Journal of Empirical Research on Human Research Ethics, 10(3), pages 278-289.
5. CRADAs (2023). National Institutes of Health. https://www.techtransfer.nih.gov/policy/cradas
6. D’Hauwers, R., & Walravens, N. (2021). Do You Trust Me? Value and Governance in Data Sharing Business Models. Proceedings of Sixth International Congress on Information and Communication Technology(235), pages 217-225.
7. Dahlberg, T., & Nokkala, T. (2019). Willingness to Share Supply Chain Data in an Ecosystem Governed Platform - An Interview Study. BLED 2019 Proceedings, pages 619-638. https://doi.org/10.18690/978-961-286-280-0.33
8. David Froelicher et al. (2021), Truly privacy-preserving federated analytics for precision medicine with multiparty homomorphic encryption. https://www.nature.com/articles/s41467-021-25972-y
9. Driver’s Seat (2023). https://driversseat.co/
10. European Commission. (2022a). Data protection in the EU: The General Data Protection Regulation (GDPR), the Data Protection Law Enforcement Directive and other rules concerning the protection of personal data. https://ec.europa.eu/info/law/law-topic/dataprotection/data-protection-eu_en
11. European Commission.(2022b). European data strategy: Making the EU a role model for a society empowered by data. https://commission.europa.eu/strategy-and-policy/priorities-2019-2024/europe-fit-digital-age/european-data-strategy_en
12. Food, U. S. (2018). Drugs Administration. Code of Federal Regulations-Title 21-Food and Drugs.
13. Gauthier Chassang & Lisa Feriol (2023). Data sharing / Open data. https://www.eurogct.org/research-pathways/public-involvement-and-data/data-sharing-open-data
14. Gelhaar, J., & Otto, B. (2020). Challenges in the Emergence of Data Ecosystems. In Proceedings of the 23rd Pacific Asia Conference on Information Systems, Dubai: UAE.
15. Gillian Diebold (2023). Exploring Data-Sharing Models to Maximize Benefits From Data. https://itif.org/publications/2023/10/02/exploring-data-sharing-models-to-maximize-benefits-from-data/
16. Hannah Gaimster (2023), The complete guide to federated data analysis. Lifebit. https://www.lifebit.ai/federated-dataanalysis/the-complete-guide-to-federated-data-analysis
17. Jack Hardinges et al. (2019). Data Trusts: Lessons from Three Pilots. https://theodi.org/article/odi-data-trusts-report/
18. Laurence Goasduff (2021). Data Sharing Is a Business Necessity to Accelerate Digital Business. https://www.gartner.com/smarterwithgartner/data-sharing-is-a-business-necessity-to-accelerate-digital-busines
19. Lindner, M., Straub, S., & Khne, B [Bettina] (2021). How to share Data? Data Sharing Platforms for Organizations: Economic and legal fundamentals, current practical projects, first recommendations for action. https://www.datasharingsdw.de/story/SDW_Studie_DataSharing_EN.pdf
20. Opriel, S., Mller, F., Burkhardt, U., & Otto, B. (2021). Requirements for Usage Control based Exchange of Sensitive Data in Automotive Supply Chains. In T. Bui (Ed.), Proceedings of the Annual Hawaii International Conference on System Sciences, Proceedings of the 54th Hawaii International Conference on System Sciences. Hawaii International Conference on System Sciences. https://doi.org/10.24251/HICSS.2021.05
21. Parmar, R., Mackenzie, I., Cohn, D., & Gann, D. (2014). The new patterns of innovation. Harvard business review, 92(1), 2.
22. Project Summary (2023), Ag Data Coop, https://www.agdatacoop.org/
23. Research Data Oxford Funder Requirements (2019). http://researchdata.ox.ac.uk/ funder-requirements/
24. Richter, H., & Slowinski, P. R. (2019). The Data Sharing Economy: On the Emergence of New Intermediaries. IIC - International Review of Intellectual Property and Competition Law, 50, pages 4-29. https://doi.org/10.1007/s40319-018-00777-7
25. Schweihoff, J., Jussen, I., Dahms, V., Mller, F., & Otto, B. (2023). How to Share Data Online (fast) - A Taxonomy of Data Sharing Business Models.
TS. Chu Thị Hồng Hải, ThS. Triệu Thu Hương (Khoa Công nghệ thông tin và kinh tế số, Học viện Ngân hàng)