Header ads

Header ads
» »Unlabelled » AI của DeepMind đã có thể giải mã protein, nhiều căn bệnh nguy hiểm giờ có thể tìm thuốc chữa

Cover_AI.jpg

Thời gian qua, anh em đã thấy những AI của startup DeepMind đã tạo ra được không ít những thành tựu về mặt công nghệ và kỹ thuật. Từ AlphaGo đánh bại cả kiện tướng cờ vây, chơi được cả StarCraft và DOTA 2 thắng con người. Nhưng bây giờ, AI của DeepMind cuối cùng cũng đã có được thành tựu thật sự hữu ích đối với đời sống con người. Denis Hassabis, nhà đồng sáng lập startup nghiên cứu trí thông minh nhân tạo từ Anh Quốc trước đến nay luôn khẳng định rằng, AI biết chơi game suy cho cùng cũng chỉ là những bước tiến quan trọng để đạt được mục tiêu sau cùng: Trí thông minh nhân tạo giúp con người hiểu được cả thế giới.

Tinhte_AI8.jpg

Có lẽ đến ngày hôm nay, DeepMind đã phần nào đạt được mục tiêu ấy, khi AI AlphaFold được phát triển. Đây là một hệ thống deep learning có khả năng dự đoán cấu trúc các đoạn phân tử protein chính xác tới từng đơn vị nguyên tử. Với khả năng này, AlphaFold đã đưa ra được lời giải đáp cho thử thách lớn tồn tại hơn nửa thế kỷ của ngành hóa sinh. Hội đồng "cuộc thi" CASP (Critical Assessment of protein Structure Prediction) trong nhiều năm qua đã đưa ra thử thách dài hơi để nghiên cứu tận gốc kết cấu của những chuỗi protein quan trọng trong các loại mầm bệnh và tế bào cho các nhà nghiên cứu. John Moult tại đại học Maryland, Mỹ, đứng đầu hội đồng CASP vừa tuyên bố rằng, "đây là lần đầu tiên AI được ứng dụng để giải quyết một vấn đề nghiêm túc."

Tại sao phải dùng AI phân tích chuỗi protein?


Một chuỗi protein được tạo ra từ những dải hợp chất amino acid cuộn lại với nhau, tạo ra những kết cấu vô cùng phức tạp. Chính kết cấu này là thứ quyết định mục đích và nhiệm vụ của từng chuỗi protein. Khi tìm ra nhiệm vụ của từng chuỗi protein, con người sẽ hiểu được một cách cơ bản cơ chế tồn tại của các sinh vật sống, khi nào protein hoạt động, khi nào không.

Tinhte_AI1.jpg

Chính bản thân nỗ lực tìm kiếm vaccine COVID-19 của con người thời gian qua đều tập trung chủ yếu vào những chuỗi protein bên ngoài bề mặt gai của mỗi con virus. Cách chủng coronavirus SARS-CoV-2 bám vào tế bào trong cơ thể người phụ thuộc hoàn toàn vào hình dạng của loại protein này, cũng như hình dạng của những chuỗi protein bên ngoài các tế bào. Gai trên bề mặt virus SARS-CoV-2 chỉ là một trong vô vàn dạng protein khác nhau. Trong cơ thể người, ít nhất có hàng chục nghìn loại protein khác nhau.

Tinhte_AI2.jpg

Quay trở lại với AlphaFold. AI này có thể dự đoán được kết cấu của hàng chục loại protein khác nhau, với sai số 1.6 angstrom, tức là 0.16 nano mét, kích thước này là ở tầm nguyên tử. Khả năng này của AI đã vượt rất xa khả năng tính toán của những phương pháp cần dùng tới các hệ thống siêu máy tính xử lý cực mạnh. Khả năng của AlphaFold lần đầu tiên chạm tới ngưỡng về độ chính xác của những kỹ thuật thí nghiệm vạch ra cấu trúc protein trong phòng thí nghiệm, chẳng hạn như kính hiển vi điện tử lạnh (cryo-electron microscopy), cộng hưởng từ hạt nhân (nuclear magnetic resonance), hay tinh thể học X quang (x-ray crystallography). Những kỹ thuật kể trên rất chính xác, nhưng rất chậm chạp và đắt đỏ. Mỗi chuỗi protein, để có thể xác định được kết cấu thông qua một trong ba kỹ thuật kể trên tốn hàng trăm nghìn USD chi phí, và có thể mất nhiều năm trời thử sai mới ra được kết quả đúng.

Còn AlphaFold thì có thể phân tích kết cấu một chuỗi protein chỉ trong vài ngày xử lý mà thôi.

Giải mã protein: Bài toán nửa thế kỷ của loài người


Đột phá từ AI của DeepMind, ở tầm ngắn hạn, mở ra cơ hội cho các nhà nghiên cứu tạo ra những loại thuốc mới, và hiểu một cách cặn kẽ những căn bệnh nguy hiểm gây ra cho con người. Xa hơn, dự đoán được kết cấu protein sẽ giúp con người tạo ra được những protein nhân tạo, như enzyme có khả năng tiêu thụ rác thải hoặc giúp tạo ra nhiên liệu sinh học. Các nhà nghiên cứu cũng đang tìm ra các phương pháp để tạo ra được những loại protein cho phép tăng sản lượng nông sản mỗi mùa vụ, hoặc giúp sản phẩm nông nghiệp giàu chất dinh dưỡng hơn đối với con người.

Tinhte_AI3.jpg

Mohammed AlQuraishi, nhà sinh vật học tại đại học Columbia, người đã từng tự phát triển phần mềm dự đoán kết cấu protein cho rằng: "Đây là một bước tiến vô cùng đáng kể. Đấy là thứ mà chính tôi cũng không dám nghĩ sẽ phát triển nhanh chóng đến như vậy. Kể ra thì cũng shock."

David Baker, giám đốc phòng nghiên cứu thiết kế protein tại Đại học Washington, người từng đứng đầu nhóm phát triển công cụ phân tích protein Rosetta thì cho rằng: "Đây rõ ràng là thứ rất quan trọng. Đúng là một thành tựu đáng nể, hệt như cách họ làm được với AI chơi cờ vây."

Tinhte_AI4.jpg

Định danh được kết cấu của một chuỗi protein thực sự rất khó. Đối với hầu hết các loại protein, các nhà nghiên cứu có được kết cấu phân tử amino acid trong chuỗi, nhưng không thể định hình được kết cấu amino acid được uốn như thế nào. Mỗi chuỗi protein, hay thậm chí là mỗi đoạn amino acid đều có hàng tỷ khả năng uốn, tạo thành những kết cấu khác nhau. Các nhà khoa học cũng đã phải vật lộn với điều này từ khoảng nửa thế kỷ qua, kể từ khi Christian Anfinsen giành được giải Nobel khi phát hiện ra chuỗi amino acid sẽ định hình kết cấu của mỗi protein vào năm 1972.

Giải đấu CASP


Cuộc thi CASP lần đầu tổ chức vào năm 1994, qua đó tạo ra cú hích cần thiết cho giới khoa học. Cứ hai năm một lần, ban tổ chức sẽ đưa ra khoảng 100 chuỗi amino acid của những protein đã được xác định kết cấu nhưng chưa được công bố rộng rãi (nên là không có phao để gian lận). Những nhóm nghiên cứu trên toàn thế giới sẽ phải tranh tài với nhau để tìm ra cách uốn những đoạn amino acid thành đúng kết cấu của protein ban đầu, thông qua những phần mềm máy tính. Vấn đề là, trong hơn 20 năm liên tục, những thành tựu ban đầu được phát triển để tranh tài ở giải CASP đã được ứng dụng thực tiễn, nhưng tốc độ giải những bài toán sinh học rất chậm chạp.

Tinhte_AI5.jpg

CASP có được bước đột phá, khi DeepMind đưa AI AlphaFold vào cuộc thi tổ chức năm 2018. Khi ấy, độ chính xác khi phân tích chuỗi protein của AlphaFold không thể so sánh được với những kỹ thuật đã được chứng minh và dùng trong phòng thí nghiệm. Nhưng xét về tốc độ tính toán, thì nó là vô địch. Cũng nhờ AlphaFold, những nhà nghiên cứu khác cũng đã tư duy lại về phương pháp phần mềm của họ dùng để nghiên cứu chuỗi protein. Đến cuộc thi CASP năm nay, hơn nửa trong số những bên tham gia tranh tài đều dùng công nghệ deep learning để phân tích. Tuy nhiên, AlphaFold cũng có bước tiến rất quan trọng. Lấy ví dụ giải nhì, công cụ trRosetta của David Baker có điểm số cách AlphaFold rất xa.

CASP tính điểm cho từng công cụ phân tích chuỗi protein thông qua một con số gọi là Global Distance Test (GDT), thang điểm từ 0 đến 100 để xác định mức độ chính xác của một chuỗi protein được máy móc tính toán, so với hình dạng thật của nó đã được nghiên cứu ra trong phòng thí nghiệm. Phiên bản mới nhất của AlphaFold đạt được điểm số đáng nể trong hầu hết những bài kiểm tra. Hai phần ba chuỗi protein nó phân tích đạt điểm trên 90. Nhưng chuỗi protein khó nhất, AlphaFold cũng đạt 25 điểm cao hơn so với đối thủ. Vào năm 2018, cách biệt về độ chính xác và điểm số chỉ là khoảng 6/100.

Tinhte_AI6.jpg

Điểm số trên 90 trong thang 100 khi phân tích một chuỗi protein chứng tỏ rằng, những sai khác trong quá trình phân tích kết cấu protein so với kết quả trong phòng thí nghiệm không phải lỗi của phần mềm, mà có thể là lỗi trong quá trình nghiên cứu thí nghiệm. Hoặc, nó cũng có nghĩa cấu trúc protein giải được bằng AI vẫn chính xác, nằm trong phạm vi biến thiên của tự nhiên. Thậm chíu có 4 đoạn protein trong cuộc thi mà các giám khảo độc lập chưa hoàn tất việc nghiên cứu trong phòng thí nghiệm, mà AlphaFold vẫn đưa ra được kết quả chính xác.

AlQuraishi trước đây tưởng rằng, sẽ mất tới 10 năm để các nhà nghiên cứu có được thành tựu như năm nay, xét đến mức độ chính xác của các công cụ tham gia giải CASP vào năm 2018.

AI chuẩn bị cứu sống được con người


Thành tựu của AlphaFold thực tế cũng được dựa trên kết quả nghiên cứu của hàng trăm nhà khoa học trên toàn thế giới. DeepMind cũng phải nhờ tới sự giúp sức của một nhóm các nhà sinh học, vật lý học và khoa học máy tính. Cách xử lý vấn đề của AI cũng tương đối khác. Nó tập trung vào từng phần nhỏ của vấn đề, giải quyết chính xác chúng, rồi lắp ghép kết quả để tạo ra một bức tranh toàn cảnh.

AlphaFold được DeepMind "huấn luyện" dựa trên khoảng 170 nghìn nguyên mẫu protein từ ngân hàng dữ liệu mở. Hệ thống trí thông minh nhân tạo này so sánh những chuỗi amino acid khác nhau trong ngân hàng dữ liệu, tìm ra những cặp amino acid thường đi gần với nhau trong kết cấu xoắn. Sau đó AlphaFold sử dụng dữ liệu này để dự đoán khoảng cách giữa các cặp amino acid trong những chuỗi protein chưa được giải đáp. Nó cũng có thể xác định mức độ chính xác của kết quả chính nó tạo ra. Quá trình huấn luyện mất khoảng vài tuần, sử dụng hệ thống máy tính với sức mạnh xử lý tương đương từ 100 đến 200 chiếc GPU.

Tinhte_AI7.png

Bà Janet Thornton thuộc Viện Thông tin sinh học Châu Âu tại Cambridge, Anh đã làm việc để giải mã kết cấu và công dụng của các chuỗi protein trong vòng 50 năm. Bà khẳng định "vấn đề này đã tồn tại cỡ nửa thế kỷ. Tôi suýt nữa thì nghĩ rằng hết cuộc đời tôi, vấn đề này sẽ không thể giải quyết."
Rất nhiều loại thuốc ngày nay có trên thị trường được tạo ra bằng cách mô phỏng kết cấu phân tử dưới dạng 3D, rồi tìm cách nhét những phân tử thuốc đó vào protein được định hướng. Điều này chỉ có thể khả thi khi chuỗi protein đó đã được giải mã hoàn toàn. Phương pháp nghiên cứu thuốc này chỉ áp dụng được cho khoảng một phần tư trong số hơn 20 nghìn chuỗi protein trong cơ thể người. Bà Thornton nói rằng, điều này nghĩa là AI AlphaFold đã mở ra cơ hội để nghiên cứu những phương thuốc tiềm năng hướng vào 15 nghìn loại protein còn lại trong cơ thể người, và "mở ra cả một hướng nghiên cứu mới."

DeepMind cho biết, họ có kế hoạch nghiên cứu AlphaFold để tìm ra phương pháp trị những căn bệnh như ký sinh trùng Leishmania, sốt rét hay những căn bệnh truyền nhiễm ở vùng nhiệt đới gây ra bởi ký sinh trùng, vì chúng đều liên quan tới những chuỗi protein chưa được giải mã.
Bản thân AlphaFold cũng không phải là vô địch. Nó mất vài ngày để đưa ra kết quả giải mã protein. Còn đối với hệ thống của AlQuraishi, sử dụng thuật toán gọi là RGN (mạng hình học lặp lại), có thể giải mã một chuỗi protein chỉ trong vài giây đồng hồ, nhưng độ chính xác thấp hơn. Vấn đề là đôi khi tốc độ quan trọng hơn sự chính xác.

Nhưng điều đó không đồng nghĩa với việc AlphaFold vô dụng. Baker cho rằng: "Một khi nhóm phát triển mô tả cách AI này vận hành, mọi người sẽ sử dụng nó cho rất nhiều mục đích khác nhau, những mục tiêu mà ngay cả bây giờ chúng ta chưa thể nghĩ ra."

Theo MIT Technology Review

==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn