Chúng tôi đã xây dựng một công cụ tìm kiếm hỗ trợ AI cho 60.000 tài liệu nghiên cứu COVID-19
Có rất nhiều nghiên cứu được công bố về coronavirus mà các nhà khoa học không thể theo kịp. Đó là lý do tại sao chúng tôi tạo ra COVIDScholar, có thể giúp các nhà nghiên cứu tìm hiểu về virus.
Chúng tôi đã xây dựng một công cụ tìm kiếm hỗ trợ AI cho 60.000 tài liệu nghiên cứu COVID-19
[Nguồn hình ảnh: panimoni / iStock; Irina Shatilova / iStock]
BỞI AMALIE TREWARTHA VÀ JOHN DAGDELEN3 PHÚT ĐỌC
Cộng đồng khoa học trên toàn thế giới đã huy động với tốc độ chưa từng có để giải quyết đại dịch COVID-19, và kết quả nghiên cứu mới nổi là đáng kinh ngạc. Mỗi ngày, hàng trăm bài báo khoa học về COVID-19 xuất hiện , trong cả các tạp chí truyền thống và các bản in không được đánh giá ngang hàng. Đã có nhiều hơn bất kỳ con người nào có thể theo kịp, và nhiều nghiên cứu liên tục xuất hiện.
Và đó không chỉ là nghiên cứu mới. Chúng tôi ước tính rằng có tới 500.000 bài báo liên quan đến COVID-19 đã được xuất bản trước khi dịch bùng phát, bao gồm các bài báo liên quan đến sự bùng phát của SARS năm 2002 và MERS năm 2012. Bất kỳ một trong số này có thể chứa thông tin chính dẫn đến hiệu quả điều trị hoặc vắc-xin cho COVID-19.
Các phương pháp tìm kiếm truyền thống thông qua các tài liệu nghiên cứu chỉ không cắt nó nữa. Đây là lý do tại sao chúng tôi và các đồng nghiệp của chúng tôi tại Phòng thí nghiệm quốc gia Lawrence Berkeley đang sử dụng các kỹ thuật trí tuệ nhân tạo mới nhất để xây dựng COVIDScholar , một công cụ tìm kiếm dành riêng cho COVID-19. COVIDScholar bao gồm các công cụ thu thập manh mối tinh tế như các loại thuốc tương tự hoặc phương pháp nghiên cứu để đề xuất nghiên cứu có liên quan cho các nhà khoa học. AI không thể thay thế các nhà khoa học, nhưng nó có thể giúp họ có được những hiểu biết mới từ nhiều bài báo hơn là họ có thể đọc trong cả cuộc đời.
COVIDScholar là một công cụ tìm kiếm với các thuật toán học máy dưới mui xe. [Ảnh chụp màn hình: Cuộc hội thoại ]
TẠI SAO NÓ QUAN TRỌNG
Khi tìm ra phương pháp điều trị hiệu quả cho COVID-19, thời gian là điều cốt yếu. Các nhà khoa học dành 23% thời gian để tìm kiếm và đọc các bài báo . Mỗi giây, các công cụ tìm kiếm của chúng tôi có thể tiết kiệm chúng là nhiều thời gian hơn để dành những khám phá trong phòng thí nghiệm và phân tích dữ liệu.
AI có thể làm nhiều hơn là chỉ tiết kiệm thời gian của các nhà khoa học. Công việc trước đây của nhóm chúng tôi cho thấy AI có thể nắm bắt kiến thức khoa học tiềm ẩn từ văn bản, tạo ra các kết nối mà con người bỏ lỡ. Ở đó, chúng tôi đã chỉ ra rằng AI có thể đề xuất các vật liệu chức năng mới, tiên tiến nhiều năm trước khi con người phát hiện ra chúng. Thông tin có ở đó cùng, nhưng phải kết hợp thông tin từ hàng trăm ngàn giấy tờ để tìm thấy nó.
Chúng tôi hiện đang áp dụng các kỹ thuật tương tự cho COVID-19, để tìm ra các loại thuốc hiện có có thể được tái sử dụng, các liên kết di truyền có thể giúp phát triển vắc-xin hoặc chế độ điều trị hiệu quả. Chúng tôi cũng bắt đầu xây dựng những cải tiến mới, như sử dụng các cấu trúc phân tử để giúp tìm ra loại thuốc nào tương tự nhau, bao gồm cả những loại thuốc tương tự theo những cách không ngờ tới.
LÀM THẾ NÀO CHÚNG TA LÀM CÔNG VIỆC NÀY
Phần quan trọng nhất trong công việc của chúng tôi là dữ liệu. Chúng tôi đã xây dựng các trang web phế liệu thu thập các bài báo mới khi chúng được xuất bản từ nhiều nguồn khác nhau, làm cho chúng có sẵn trên trang web của chúng tôi trong vòng 15 phút sau khi chúng xuất hiện trực tuyến. Chúng tôi cũng làm sạch dữ liệu, sửa lỗi định dạng và so sánh cùng một loại giấy từ nhiều nguồn để tìm phiên bản tốt nhất. Các thuật toán học máy của chúng tôi sau đó đi vào bài báo, gắn thẻ nó với các danh mục chủ đề và đánh dấu công việc quan trọng đối với COVID-19.
COVIDScholar nhãn và phân loại khoảng 250 bài báo mỗi ngày để giúp các nhà nghiên cứu thực hiện các kết nối mà họ có thể bỏ lỡ. [Ảnh: Kevin Cruse và Haoyan Huo, CC BY-ND]
Chúng tôi cũng liên tục tìm kiếm các chuyên gia trong các lĩnh vực mới. Đầu vào và chú thích dữ liệu của họ là những gì cho phép chúng tôi đào tạo các mô hình AI mới.
Cho đến nay, chúng tôi đã tập hợp được hơn 60.000 bài viết về COVID-19 và chúng tôi đang mở rộng bộ sưu tập hàng ngày. Chúng tôi cũng đã xây dựng các công cụ tìm kiếm để nhóm nghiên cứu thành các danh mục, đề xuất nghiên cứu liên quan và cho phép người dùng tìm các bài báo kết nối các khái niệm khác nhau, chẳng hạn như các bài báo kết nối một loại thuốc cụ thể với các bệnh mà nó đã được sử dụng trước đây. Chúng tôi hiện đang xây dựng các thuật toán AI cho phép các nhà nghiên cứu cắm kết quả tìm kiếm vào các mô hình định lượng để nghiên cứu các chủ đề như tương tác protein. Chúng ta cũng bắt đầu tìm hiểu các tài liệu trong quá khứ để tìm đá quý ẩn.
Chúng tôi hy vọng rằng sẽ sớm thôi, các nhà nghiên cứu sử dụng COVIDScholar sẽ bắt đầu xác định các mối quan hệ mà họ có thể không bao giờ tưởng tượng được, đưa chúng ta đến gần hơn với các phương pháp điều trị và phương thuốc cho COVID-19.
Chúng tôi đã xây dựng một công cụ tìm kiếm hỗ trợ AI cho 60.000 tài liệu nghiên cứu COVID-19
[Nguồn hình ảnh: panimoni / iStock; Irina Shatilova / iStock]
BỞI AMALIE TREWARTHA VÀ JOHN DAGDELEN3 PHÚT ĐỌC
Cộng đồng khoa học trên toàn thế giới đã huy động với tốc độ chưa từng có để giải quyết đại dịch COVID-19, và kết quả nghiên cứu mới nổi là đáng kinh ngạc. Mỗi ngày, hàng trăm bài báo khoa học về COVID-19 xuất hiện , trong cả các tạp chí truyền thống và các bản in không được đánh giá ngang hàng. Đã có nhiều hơn bất kỳ con người nào có thể theo kịp, và nhiều nghiên cứu liên tục xuất hiện.
Và đó không chỉ là nghiên cứu mới. Chúng tôi ước tính rằng có tới 500.000 bài báo liên quan đến COVID-19 đã được xuất bản trước khi dịch bùng phát, bao gồm các bài báo liên quan đến sự bùng phát của SARS năm 2002 và MERS năm 2012. Bất kỳ một trong số này có thể chứa thông tin chính dẫn đến hiệu quả điều trị hoặc vắc-xin cho COVID-19.
Các phương pháp tìm kiếm truyền thống thông qua các tài liệu nghiên cứu chỉ không cắt nó nữa. Đây là lý do tại sao chúng tôi và các đồng nghiệp của chúng tôi tại Phòng thí nghiệm quốc gia Lawrence Berkeley đang sử dụng các kỹ thuật trí tuệ nhân tạo mới nhất để xây dựng COVIDScholar , một công cụ tìm kiếm dành riêng cho COVID-19. COVIDScholar bao gồm các công cụ thu thập manh mối tinh tế như các loại thuốc tương tự hoặc phương pháp nghiên cứu để đề xuất nghiên cứu có liên quan cho các nhà khoa học. AI không thể thay thế các nhà khoa học, nhưng nó có thể giúp họ có được những hiểu biết mới từ nhiều bài báo hơn là họ có thể đọc trong cả cuộc đời.
COVIDScholar là một công cụ tìm kiếm với các thuật toán học máy dưới mui xe. [Ảnh chụp màn hình: Cuộc hội thoại ]
TẠI SAO NÓ QUAN TRỌNG
Khi tìm ra phương pháp điều trị hiệu quả cho COVID-19, thời gian là điều cốt yếu. Các nhà khoa học dành 23% thời gian để tìm kiếm và đọc các bài báo . Mỗi giây, các công cụ tìm kiếm của chúng tôi có thể tiết kiệm chúng là nhiều thời gian hơn để dành những khám phá trong phòng thí nghiệm và phân tích dữ liệu.
AI có thể làm nhiều hơn là chỉ tiết kiệm thời gian của các nhà khoa học. Công việc trước đây của nhóm chúng tôi cho thấy AI có thể nắm bắt kiến thức khoa học tiềm ẩn từ văn bản, tạo ra các kết nối mà con người bỏ lỡ. Ở đó, chúng tôi đã chỉ ra rằng AI có thể đề xuất các vật liệu chức năng mới, tiên tiến nhiều năm trước khi con người phát hiện ra chúng. Thông tin có ở đó cùng, nhưng phải kết hợp thông tin từ hàng trăm ngàn giấy tờ để tìm thấy nó.
Chúng tôi hiện đang áp dụng các kỹ thuật tương tự cho COVID-19, để tìm ra các loại thuốc hiện có có thể được tái sử dụng, các liên kết di truyền có thể giúp phát triển vắc-xin hoặc chế độ điều trị hiệu quả. Chúng tôi cũng bắt đầu xây dựng những cải tiến mới, như sử dụng các cấu trúc phân tử để giúp tìm ra loại thuốc nào tương tự nhau, bao gồm cả những loại thuốc tương tự theo những cách không ngờ tới.
LÀM THẾ NÀO CHÚNG TA LÀM CÔNG VIỆC NÀY
Phần quan trọng nhất trong công việc của chúng tôi là dữ liệu. Chúng tôi đã xây dựng các trang web phế liệu thu thập các bài báo mới khi chúng được xuất bản từ nhiều nguồn khác nhau, làm cho chúng có sẵn trên trang web của chúng tôi trong vòng 15 phút sau khi chúng xuất hiện trực tuyến. Chúng tôi cũng làm sạch dữ liệu, sửa lỗi định dạng và so sánh cùng một loại giấy từ nhiều nguồn để tìm phiên bản tốt nhất. Các thuật toán học máy của chúng tôi sau đó đi vào bài báo, gắn thẻ nó với các danh mục chủ đề và đánh dấu công việc quan trọng đối với COVID-19.
COVIDScholar nhãn và phân loại khoảng 250 bài báo mỗi ngày để giúp các nhà nghiên cứu thực hiện các kết nối mà họ có thể bỏ lỡ. [Ảnh: Kevin Cruse và Haoyan Huo, CC BY-ND]
Chúng tôi cũng liên tục tìm kiếm các chuyên gia trong các lĩnh vực mới. Đầu vào và chú thích dữ liệu của họ là những gì cho phép chúng tôi đào tạo các mô hình AI mới.
Cho đến nay, chúng tôi đã tập hợp được hơn 60.000 bài viết về COVID-19 và chúng tôi đang mở rộng bộ sưu tập hàng ngày. Chúng tôi cũng đã xây dựng các công cụ tìm kiếm để nhóm nghiên cứu thành các danh mục, đề xuất nghiên cứu liên quan và cho phép người dùng tìm các bài báo kết nối các khái niệm khác nhau, chẳng hạn như các bài báo kết nối một loại thuốc cụ thể với các bệnh mà nó đã được sử dụng trước đây. Chúng tôi hiện đang xây dựng các thuật toán AI cho phép các nhà nghiên cứu cắm kết quả tìm kiếm vào các mô hình định lượng để nghiên cứu các chủ đề như tương tác protein. Chúng ta cũng bắt đầu tìm hiểu các tài liệu trong quá khứ để tìm đá quý ẩn.
Chúng tôi hy vọng rằng sẽ sớm thôi, các nhà nghiên cứu sử dụng COVIDScholar sẽ bắt đầu xác định các mối quan hệ mà họ có thể không bao giờ tưởng tượng được, đưa chúng ta đến gần hơn với các phương pháp điều trị và phương thuốc cho COVID-19.
Nhận xét
Đăng nhận xét