Hôm qua khi xem hình chụp của Zing trong chỗ làm việc của Tổ thông tin đáp ứng nhanh phục vụ truy vết bệnh nhân COVID-19 mình thấy có một màn hình truy vết. Trên hình là biểu diễn của việc tiếp xúc gần của các đối tượng từ F0 đến F0, được biểu diễn bằng dạng graph (tạm dịch là đồ thị, nhưng dịch như vậy thì không đúng lắm). Graph là một công cụ cực kì hữu ích không chỉ được dùng ở Việt Nam trong việc truy vết đối tượng nghi nhiễm COVID-19 mà nhiều nước khác cũng dùng. Và ứng dụng của graph không chỉ là thế, nó còn dùng để phát hiện lừa đảo bảo hiểm, mô phỏng mối quan hệ của người dùng mạng xã hội (Facebook, Twitter, Tinh tế đang dùng), gợi ý mua hàng và rất nhiều thứ hay ho khác.
Phân tích graph là một lĩnh vực mới (thật ra cũng không mới lắm), nó liên quan đến việc biểu diễn các đối tượng và mối quan hệ của chúng ra sao. Trong một "graph" sẽ bao gồm một số điểm và các đường nối giữa những điểm đó. Những mũi tên này thường sẽ có 1 chiều duy nhất. Với mối quan hệ 2 chiều thì chúng ta sẽ biểu diễn nó bằng 2 mũi tên. Mình thấy định nghĩa của Oracle là dễ hiểu, anh em có thể xem thêm ở đây.
Graph analytics là gì?
Phân tích graph là một lĩnh vực mới (thật ra cũng không mới lắm), nó liên quan đến việc biểu diễn các đối tượng và mối quan hệ của chúng ra sao. Trong một "graph" sẽ bao gồm một số điểm và các đường nối giữa những điểm đó. Những mũi tên này thường sẽ có 1 chiều duy nhất. Với mối quan hệ 2 chiều thì chúng ta sẽ biểu diễn nó bằng 2 mũi tên. Mình thấy định nghĩa của Oracle là dễ hiểu, anh em có thể xem thêm ở đây.
Trong hình trên, graph này biểu diễn việc chuyển khoản Bitcoin giữa các tài khoản với nhau. Mỗi cục hình tròn là một tài khoản, các mũi tên thì biểu thị việc chuyển khoản (SEND_TO).
Việc biểu diễn các điểm và đường như thế này rất thường được sử dụng trong đời sống, nhưng với các hệ thống máy tính và hệ thống phân tích thì nó là một thứ mới, bởi trước đây dữ liệu thường được lưu trữ thành các bảng (giống các file Excel mà bạn hay dùng) chứ không phải là những điểm và mũi tên. Giữa các bảng này sẽ có một cột chung nào đó để "join" dữ liệu lại giữa các bảng lại với nhau (giống hàm VLOOKUP của Excel).
Còn với dạng graph, nó cung cấp một cách linh hoạt hơn để bạn làm những phân tích mà cần phải "truy vết" (traverse) bằng cách đi theo những mũi tên giữa các đối tượng, hoặc phân tích về sức mạnh, về chất lượng của mối quan hệ giữa những đối tượng này. Trong các hệ thống lưu trữ dạng graph, những phân tích dạng này sẽ chạy nhanh và hiệu quả hơn so với hệ thống lưu trữ dạng bảng truyền thống. Các hệ thống lưu trữ graph được gọi là graph database.
Graph database đã bắt đầu được sử dụng phổ biến trong khoảng 10 năm trước, và giờ đây ở thời đại mạng xã hội và người dùng tương tác nhiều với nhau thì graph càng trở nên phổ biến hơn.
Người ta dùng graph để làm gì?
- Phát hiện mối liên hệ giữa những người dùng có quen biết nhau, có tương tác giống nhau trên mạng xã hội.
- Phát hiện các hành vi vi phạm tài chính, ví dụ như hành vi rửa tiền khi chuyển khoản qua nhiều tài khoản, nhiều ngân hàng khác nhau
- Phát hiện gian lận thẻ tín dụng, nơi có thể bị rò rỉ thông tin rẻ, phát hiện gian lận trong đền bù bảo hiểm, lợi dụng chính sách phúc lợi của nhà nước
- Gợi ý kết bạn dựa trên mối quan hệ bạn bè hiện có của tài khoản mạng xã hội
- Phát hiện điểm yếu trong hệ thống lưới điện, hệ thống ống nước, kiểm soát hệ thống mạng và phát hiện hack
- Tối ưu đường bay của máy bay thương mại, tối ưu đường vận tải của các xe chở hàng
- Nghiên cứu khoa học về sinh học
- Và như nước ta đang dùng: truy vết F0, F1, F2, F4… dựa trên các tiếp xúc của họ
Đây là một graph phân tích việc yêu cầu đền bù bảo hiểm, trong đó các bên liên quan được liệt kê ra, mối quan hệ của họ cũng được biểu diễn. Các công ty bảo hiểm thường rất khó phát hiện ra kẻ lừa đảo vì chúng thường làm việc với luật sư, bác sĩ để xây dựng nên hồ sơ đẹp cho vụ va chạm. Họ thường chọn các chấn thương khó xác định và khó bị bác bỏ, nên các công ty bảo hiểm hoặc kiện ra tòa (với khả năng thua), hoặc trả một khoản tiền nhỏ cho xong chuyện.
Nhờ có các công cụ graph, họ có thể xác định được những người có liên quan trọng 1 vụ tai nạn, sau đó tra cứu tiếp thông tin của những người và của chiếc xe gặp nạn xem liệu nó có dính dáng tới những vụ tai nạn trước đó không, họ có chung bác sĩ, chung luật sư hay không, những người hành khách và người lái có giống giống nhau không. Nếu có, khả năng cao là bảo hiểm đang bị trục lợi. Để chạy việc phân tích này trên các file Excel hoặc các cơ sở dữ liệu truyền thống thì mất rất lâu, còn graph database thì chút xíu là xong rồi.
Các kiểu phân tích graph thường thấy
Graph là tên chung thôi, nhưng đi sâu vào thì nó có nhiều cách phân tích lắm:
Phân tích path: Path là con đường nối giữa các điểm với nhau, và trong graph người ta thường sẽ đi tìm đường ngắn nhất giữa các điểm. Ví dụ, tìm con đường ngắn nhất để xe tải đi sao cho nó có thể ghé hết cả 5 địa điểm mà khách hàng đang chờ hàng. Hoặc tìm kiếm những người "thân thiết" mà chưa kết bạn chưa kết bạn trên Facebook để gợi ý lên giao diện.
Connectivity analysis: vì mỗi mũi tên có lưu trữ thông tin trong đó, ví dụ công suất điện truyền tải giữa các trạm điện, dựa vào đây người ta có thể xác định các đường dây nào có sự cố hoặc các trạm điện nào có thể trở thành điểm yếu trong hạ tầng năng lượng của thành phố. Một số công ty thì dùng connectivity analysis để biết được nguồn gốc dữ liệu của mình đến từ đâu, đã đi qua các bước cộng trừ nhân chia và biến đổi như thế nào.
Tinh tế đang dùng connectivity analyis để biết được bạn tương tác với một bài viết ra sao, bạn đọc, bạn comment, bạn rating thì sao, và kết hợp với cả việc follow tag, follow người dùng, tương tác giữa các người dùng với nhau… để xây dựng nên thuật toán dành cho tab ForU. Tab này hiện đã có gấp đôi số người dùng so với hồi chưa dùng graph, và bản thân mình dùng cũng thấy nội dung gợi ý ra liên quan hơn, muốn đọc hơn.
![[IMG]](https://photo2.tinhte.vn/data/attachment-files/2021/01/5327042_graph_tinhte_analysis.jpg)
Community analysis: dựa trên chất lượng và số lượng các mối quan hệ trong một cộng đồng, người ta có thể phân nhóm thành từng cộng đồng nhỏ hơn, dùng trong marketing để nhắm trúng một tập khách hàng mục tiêu cụ thể. Người ta cũng có thể dùng cách này để đoán xem liệu cộng đồng có tăng trưởng lên về kích thước, hoặc có "lai" thêm với các cộng đồng mới hay không.
Centrality analysis: phân tích này tìm ra "trung điểm" trong một mạng lưới, ví dụ tìm ra người có tầm ảnh hưởng trong một cộng đồng, tìm những trang web được truy cập nhiều nhất trong một tập người dùng nhất định… Thuật toán PageRank của Google cũng có sử dụng kiểu phân tích này.
Việc dùng graph để truy vết các ca nghi nhiễm hoặc nhiễm COVID-19 là sự kết hợp của path, connectivity và community analysis trong graph. Dễ nhất là dùng path analysis để xác định những người tiếp xúc gần với bệnh nhân, cảnh báo cho họ, thông báo cho cơ quan y tế địa phương một cách nhanh chóng. Để làm việc tương tự trong các database truyền thống phải mất nhiều thời gian hơn, máy chạy nặng hơn, phí đi thời gian vàng để khoanh vùng dập dịch.
==***==
==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
---
Khóa học Hacker và Marketing từ A-Z trên ZALO!
Khóa học Hacker và Marketing từ A-Z trên Facebook!
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP
Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán
Khóa học hướng dẫn về Moodle chuyên nghiệp và hay Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.
Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình kiếm tiền Youtube bằng phần mềm Camtasia Studio Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công ==***== Bảo hiểm nhân thọ - Bảo vệ người trụ cột Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng
Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Nguồn: Tinh Tế
Topics:

































