Thứ Tư, ngày 20 tháng 10 năm 2021

Những ứng dụng của thị giác máy tính trong đời sống con người

Ngày đăng:09:18 09/03/2021
Lượt xem: 3.253
Cỡ chữ
Lĩnh vực trí tuệ nhân tạo (AI) vô cùng mới mẻ và đang là xu hướng phát triển trên toàn thế giới bởi khả năng xử lý hàng triệu thông tin trong vài phút và nếu có bất kỳ thay đổi nào, AI cũng có thể giúp giải quyết nhanh chóng và chính xác trong thời gian thực, điều mà ngay chính con người nhiều lúc gặp khó khăn trong thực hiện.
Hơn 10 năm trước, nhiều người hoài nghi trước dự báo “50 năm nữa loài người sẽ có máy tính nhận dạng hình ảnh tốt như mắt người”. Nhưng thực tế cho thấy, chỉ 10 năm sau, máy tính nhận dạng được hình ảnh đã xuất hiện. Hiện nay, nhiều máy móc đã vượt qua khả năng nhận diện, phân tích hình ảnh bằng mắt thường của con người. Thị giác máy tính được xem là một trong những lĩnh vực thuộc AI và mang lại nhiều ứng dụng thực tiễn cho cuộc sống của con người.
 


Thị giác máy tính được xem là một trong những lĩnh vực thuộc AI và mang lại nhiều ứng dụng thực tiễn cho cuộc sống của con người
 
I. Khái niệm thị giác máy tính
 
Thị giác máy tính (Computer Vision) là một lĩnh vực khoa học liên ngành liên quan đến việc làm thế nào máy tính có thể đạt được sự hiểu biết ở mức cao từ hình ảnh hoặc video kỹ thuật số. Thị giác máy tính bao gồm các phương pháp thu nhận, xử lý ảnh kỹ thuật số, phân tích và nhận dạng các hình ảnh từ thế giới thực để cho ra các thông tin. 
 
Các nguồn hình ảnh đa dạng: Máy ảnh số, camera giám sát, các máy quét, máy chụp y tế hoặc công nghiệp,...
 
II. Những ứng dụng của thị giác máy tính trong đời sống
 
1. Ứng dụng Computer Vision trong thương mại điện tử
 
Một ứng dụng trong thương mại điện tử là tính năng tìm kiếm bằng hình ảnh, hỗ trợ cho việc mua hàng dễ dàng. 
 
Taobao là một trong những trang thương mại điện tử vô cùng nổi tiếng của Trung Quốc. Với lượng hàng hóa khổng lồ, chứa nhiều mẫu mã, kiểu dáng đa dạng khiến Taobao nhanh chóng trở thành sân chơi cho các doanh nghiệp cũng như người tiêu dùng Việt Nam và quốc tế. Tuy nhiên, rào cản về ngôn ngữ là một trong những hạn chế khiến người Việt khó có thể tiếp cận được nguồn hàng cũng như đặt mua trên website này. Nhận thấy được khó khăn từ người dùng, taobao đã được tích hợp tính năng tìm kiếm bằng hình ảnh hỗ trợ cho việc mua hàng dễ dàng hơn bao giờ hết. Không cần quảng cáo rầm rộ bằng những chiến dịch PR lớn, ngay khi Taobao có ứng dụng này, người dùng quốc tế đã truyền tai nhau để cùng mua sắm trực tuyến.
 
Trong một show trình diễn vào năm 2017, Tommy Hilfiger - Thương hiệu thời trang hàng đầu tại Mỹ đã giới thiệu một ứng dụng với tên gọi Tommy Land. Với Tommy Land khán giả của họ có thể chụp lại những bức ảnh người mẫu trên sân khấu, poster và bất cứ đâu, sau đó đăng tải chúng lên ứng dụng để xem thông tin và đặt hàng ngay lập tức. Với công nghệ này, Tommy Land đã lôi kéo được rất nhiều khán giả tham gia show, đồng thời hãng cũng nhận ra nhu cầu cao của mỗi người giữa thấy - thích - mua. Ứng dụng đã làm gia tăng cảm giác phấn khích cho khán giả và cũng giúp Tommy Hilfiger gia tăng số lượng sản phẩm bán ra tại thời điểm đó.
 
Taobao, trong chiến dịch “Nhìn thấy - Mua ngay” tại tuần lễ thời trang Paris năm 2019, ngay tại buổi trình diễn, người xem chỉ cần mở ứng dụng và chụp những gì họ muốn, Taobao sẽ đưa bạn đến một cửa hàng phù hợp của Tmall để sở hữu ngay những món đồ từ hình ảnh đăng tải.
 


Nhiều ngân hàng hiện nay trên thế giới đã sử dụng Computer Vision để thực hiện quy trình KYC
 
2. Ứng dụng Computer Vision trong ngân hàng
 
Các ngân hàng tiên tiến đang sử dụng Computer Vision để thực hiện các quy trình KYC (Biết khách hàng của bạn). Điều này cho phép khách hàng mở tài khoản bằng cách sử dụng selfie và cuộc gọi video ngắn.  Phương pháp xác minh kỹ thuật số này giúp loại bỏ việc xác minh thủ công. Khách hàng có thể mở một tài khoản thoải mái tại nhà của họ. Đây là việc làm có lợi cho các ngân hàng, vì họ có thể thu hút nhiều khách hàng hơn và tận dụng thời gian, nhân lực để thực hiện các nhiệm vụ quan trọng hơn.
 
Công nghệ Computer Vision cũng được sử dụng để xác định cảm xúc của khách hàng nhằm mục đích cá nhân hóa dịch vụ ngân hàng trên nhiều kênh. Sự hài lòng của khách hàng ngày càng tăng và dễ dàng tạo tài khoản có tác động trực tiếp đến doanh thu của ngân hàng.
 
Computer Vision có thể giúp các ngân hàng thay thế tiền tệ truyền thống cũng như thẻ tín dụng và thẻ ghi nợ. Chúng được thay thế bằng mã kỹ thuật số sử dụng một lần trên điện thoại thông minh của khách hàng.  Họ lưu trữ thông tin thẻ của người dùng bằng kỹ thuật số, được xác thực bằng sinh trắc học tại điểm bán (POS). Mặc dù hiện tại các phương thức thanh toán này không loại bỏ hoàn toàn sự phụ thuộc của chúng ta vào thẻ, nhưng việc thực hiện Computer Vision trong tài chính có thể giúp chúng ta đạt được một xã hội kỹ thuật số thực sự trong tương lai.
 
Dữ liệu sinh trắc học như quét mống mắt của khách hàng có thể được sử dụng để xác minh khách hàng và ủy quyền giao dịch. Điều này có thể cải thiện vấn đề bảo mật vì quét mống mắt rất khó để nhân rộng. Các trường hợp gian lận ngân hàng có thể giảm đáng kể, cung cấp một môi trường an toàn hơn cho người dùng. Điều này làm tăng sự tin tưởng của khách hàng trong tổ chức và thậm chí có thể giúp thu hút khách hàng mới.
 
Kết hợp thị giác máy tính với video cũng có tiềm năng đáng kể về mặt an toàn và bảo mật: AI đang được sử dụng ngày càng nhiều để nhận dạng các cá nhân thông qua khuôn mặt, nhưng giờ đây có thể đưa giai đoạn quan trọng này đi xa hơn và phát hiện cảm xúc của con người thông qua phân tích biểu cảm vi mô trên khuôn mặt, giãn đồng tử, chuyển động mắt và ánh mắt. Bằng cách kết hợp thông tin này với các mẫu giọng nói và giọng điệu phân tích giọng nói, có thể xác định bảy cảm xúc chính của con người. Hơn nữa, công nghệ chỉ yêu cầu cảnh quay video độ phân giải thấp - cụ thể là thường được sử dụng cho camera quan sát và các mục đích nhận dạng khác.
 
Bằng cách xem khuôn mặt của ai đó trực tiếp hoặc trên video được ghi lại trong thời gian thực, công nghệ này không chỉ có thể định danh một cá nhân, mà còn đánh giá trạng thái cảm xúc của họ sâu sắc hơn bất kỳ con người nào có thể. Thay vì chỉ đơn giản là phát hiện xem ai đó vui hay buồn, nó có thể đánh giá sự chính trực: khả năng ai đó đang trung thực. Nó cũng có thể phân loại các cảnh trong thời gian thực thông qua các đoạn video được phát trực tuyến, phát hiện tình trạng bất ổn, xáo trộn và xung đột, hoặc liệu ai đó có bị căng thẳng hoặc lo lắng, cũng như hành vi đáng ngờ.
 
3. Ứng dụng Computer Vision trong chăm sóc sức khỏe 
 
Các thuật toán Computer Vision trong ngành chăm sóc sức khỏe đang phát triển với tốc độ nhanh chóng. Từ đó giúp bác sĩ, y tá chữa cho bệnh nhân mau lấy lại sức khỏe:
 
- Có thể đếm các tế bào ung thư để đánh giá tốc độ lây lan của chúng bằng cách phát hiện đối tượng.
 
- Có thể phát hiện sớm các tình trạng mãn tính thông qua xử lý hình ảnh nhanh hơn, điều này giúp có thể can thiệp ngay lập tức.
 
- Có thể phát hiện và phân loại các vết vỡ, bong gân và các thương tích khác từ tia X.
 
4. Ứng dụng Computer Vision trong ngành công nghiệp ô tô
 
Hầu hết các xe mới đều có công nghệ phòng ngừa tai nạn. Các hệ thống này dựa trên công nghệ Computer Vision và chúng xử lý nơi có làn đường, nếu có phương tiện hoặc người ở gần đó để dự đoán tai nạn, cảnh báo người lái xe và trong một số trường hợp tự động ngắt. Hệ thống nhận diện khuôn mặt cũng có thể cảnh báo người lái xe nếu anh ta sắp ngủ.
 
5. Ứng dụng Computer Vision trong bảo hiểm
 
Hệ thống Computer Vision hỗ trợ trong quá trình kiểm tra tài sản bị hư hỏng. Chụp ảnh và nhận được báo giá ngay lập tức nhanh hơn nhiều so với việc chờ đợi một người đến kiểm tra tài sản của bạn có thể mất nhiều ngày hoặc vài tuần. 
 
Sử dụng Computer Vision, người ta có thể đánh giá mức độ thiệt hại và phân biệt xem sự cố là một điều không may hay được thực hiện với mục đích lừa đảo. Việc sử dụng máy ảnh giúp xác minh yêu cầu nhanh chóng và chính xác. Các công ty bảo hiểm có thể hưởng lợi rất nhiều từ việc này vì nó giúp loại bỏ các cơ hội gian lận và khiếu nại sai.
 
6. Ứng dụng Computer Vision trong bán lẻ 
 
Thị giác máy tính đang được sử dụng trong các cửa hàng ngày càng nhiều, đặc biệt là giúp cải thiện trải nghiệm của khách hàng. Amazon đang dẫn đầu trong việc phát triển công nghệ cho lĩnh vực bán lẻ.
 
- Amazon Go, cửa hàng bán lẻ đầu tiên của Amazon xây dựng trong thế giới thật, ra đời dựa trên nhu cầu được trải nghiệm mua sắm mà người mua không phải xếp hàng, không quầy thu ngân.
 
- Amazon Go có gì khác biệt so với cửa hàng tiện lợi hay siêu thị bình thường? Hãy tưởng tượng bạn đang dạo một vòng cửa hàng để lựa chọn sản phẩm, khi tìm thấy món hàng mình cần, bạn chỉ việc lấy nó khỏi kệ và cho sản phẩm vào giỏ hàng. Sau đó, bạn chỉ bước ra khỏi cửa hàng mà không phải xếp hàng thanh toán. Tài khoản ngân hàng của bạn sẽ được tự động trừ tiền và một hóa đơn chi tiết những sản phẩm bạn vừa mua sẽ được gửi đến thiết bị di động của bạn.
 
Tất cả là nhờ một quy trình tự động, trong đó, các camera và các bộ cảm biến của cửa hàng Amazon Go có nhiệm vụ “liệt kê” những sản phẩm mà khách lấy khỏi kệ hàng để hệ thống tự tính tiền và trừ vào tài khoản Amazon của khách. Tất nhiên, Amazon sẽ gửi vào e-mail của khách một hóa đơn điện tử.
 
- Với Amazon Go, mỗi cửa hàng là một sự hợp nhất giữa hàng loạt công nghệ: Dịch vụ dựa trên vị trí, nhận dạng bằng quét mã QR, hệ thống thanh toán tích hợp, nhận diện hình ảnh, công nghệ cảm biến và AI. Quan trọng hơn, đây đều là các công nghệ mà Amazon có sẵn hoặc dễ dàng tìm kiếm một nhà cung cấp khác, nên chúng hoàn toàn có thể triển khai.
 
7. Ứng dụng Computer Vision trong sản xuất
 
 Trong sản xuất, một ứng dụng của Computer Vision là thực hiện dự đoán bảo trì. Sử dụng hình ảnh thu được qua camera quan sát, có thể dự đoán máy có khả năng bị hỏng. Do đó, việc bảo trì có thể được thực hiện và phụ tùng cần thiết được mua. Các ứng dụng khác liên quan đến kiểm tra gói tự động và đọc mã vạch.
 
8. Ứng dụng Computer Vision trong lĩnh vực an ninh
 
- Camera an ninh: Khi một ngân hàng đang có cướp, camera sẽ ghi lại được hình ảnh và mô tả nó lại dưới dạng text, sau đó gửi cho cơ quan chức năng, mọi chuyện sẽ được xử lý kịp thời và nhanh chóng hơn.
 
- Hệ thống Computer Vision giúp tăng cường khả năng phát hiện cháy rừng. Sử dụng hình ảnh hồng ngoại (IR) như một phần của các giao thức giám sát cháy rừng. Các thuật toán nâng cao phân tích các đặc điểm hình ảnh video như chuyển động hoặc độ sáng để phát hiện lửa.
 
- Nhận dạng biển số xe ở bãi đỗ xe: Để tiết kiệm chi phí, các bãi giữ xe thường so sánh biển số vào - ra thủ công. Tuy nhiên, với các bãi xe quá đông hoặc các bãi xe tính phí theo giờ thì cần thiết phải so sánh bằng máy, giúp truy tìm dễ dàng khi có sự cố xảy ra.
 
Các bãi đỗ xe được trang bị camera và các thuật toán thị giác máy để đọc biển số xe tự động.
 
III. Kết luận
 
Thị giác máy tính là một lĩnh vực thú vị, được ứng dụng trên nhiều lĩnh vực, hứa hẹn mang lại nhiều lợi ích cho cuộc sống của con người. Tuy nhiên, nó cũng luôn là thách thức đối với các hệ thống máy tính. Khả năng học sâu và sức mạnh của các thuật toán học máy ngày càng lớn mạnh là nguyên nhân của những mối lo ngại liên tục gia tăng. Điều đó không có nghĩa là chúng ta nên dừng lại việc nghiên cứu, mà thị giác máy tính cần phải được giám sát bởi mọi người trên toàn cầu.

 
Tài liệu tham khảo:
 
1. Y. Aloimonos (ed.), Special Issue on Purposive and Qualitive Active Vision, CVGIP B: Image Understanding, Vol. 56 (1992).
 
2.https://emerj.com/ai-sector-overviews/computer-vision-applications-shopping-driving-and-more/.
 
3.https://algorithmxlab.com/blog/computer-vision/.
 
4. https://bdtechtalks.com/2019/12/30/computer-vision-applications-deep-learning/.


ThS. Lê Cẩm Tú

Chuyên đề Công nghệ và Ngân hàng số, số 07/2020
Bình luận Ý kiến của bạn sẽ được biên tập trước khi đăng. Xin vui lòng gõ tiếng Việt có dấu