Broad Institute 與 NVIDIA 攜手將 NVIDIA Clara 導入 Terra 雲端平台
協助 25,000 名研究人員推動生物醫學發現
此合作關係將加速基因組分析工作流程;
團隊將共同開發用於發現及開發標靶治療的大型語言模型
NVIDIA (輝達) 今天宣布攜手麻省理工學院及哈佛大學共同成立的 Broad Institute,為 Terra 雲端平台及其超過 25,000 名用戶 (包括學術界的生物醫學研究人員、新創公司及大型製藥公司) 提供快速分析海量醫療資料所需的人工智慧 (AI) 和加速工具。
本合作的宗旨為串連 NVIDIA 在 AI 領域的專業知識、醫療照護運算平台與 Broad Institute 旗下世界知名的研究人員、科學家與開放平台,並著重在以下三大領域:
l 在 Terra 平台使用 NVIDIA Clara™ Parabricks®:現已可在六個新的 Terra 工作流程中使用Parabricks (對序列資料進行二次分析的 GPU 加速軟體套件)。用戶能藉由 Clara Parabricks 在一個多小時內分析完整的基因組;相較之下,使用 CPU 的運算環境則需要 24 小時。此外,使用 Clara Parabricks 還能降低一半以上的運算成本。
l 建立大型語言模型 (large language model;LLM):研究人員將利用 NVIDIA BioNeMo 為組成生命的 DNA 和 RNA 建立基礎模型,以便進一步探索人類生物學。NVIDIA BioNeMo 是甫推出的 AI 應用框架,用於生物學的大型語言模型。
l 將更強大的深度學習 (Deep Learning) 用於基因組分析工具套件 (GATK):NVIDIA 將一個新的深度學習模型直接整合進 Broad Institute 的 GATK 工具套件上。超過十萬名研究人員使用 GATK 這個業界標準辨別與疾病相關的基因變異,這將幫助藥物研究人員開發新療法。
NVIDIA 醫療照護部門副總裁 Kimberly Powell 表示:「整個醫療照護體系都需要更好的運算工具,讓我們在認識疾病、開發診斷方式與提供治療等方面獲得突破性的進展。擴大與 Broad Institute 的合作讓我們得以發揮大型語言模型的力量,提出共同解決辦法,並縮小研究人員的洞察與病患實際受益之間的落差。」
Broad Institute 的目標是提供一個開放式雲端平台,將研究人員之間以及為獲得突破性成果所需的資料集和工具串連起來,促進下一世代的生物醫學研究協作。
Broad Institute 數據長 Anthony Philippakis 表示:「生命科學正處於資料革命之中,研究人員迫切需要新的方法將機器學習導入生物醫學領域。這次合作的目標是擴大資料分享及合作流程,以拓展基因組學的研究規模。」
用於研究疾病的大型語言模型
NVIDIA 的 BioNeMo 框架包括針對蛋白質和化學預先訓練好的大型語言模型,能夠簡化訓練、推論和擴展等作業。BioNeMo 是 NVIDIA NeMo Megatron 框架的延伸,特別適用於化學、蛋白質和 DNA/ RNA 序列等領域。
BioNeMo 讓開發人員有效地訓練和部署具有數十億個參數的生物學大型語言模型。NVIDIA 與 Broad Institute 的團隊將共同打造新模型並加入 BioNeMo 集合中,開放在 Terra 平台上供使用。
用於特定領域 AI 的 NVIDIA 軟體
NVIDIA Parabricks GPU 加速工作流程讓研究人員分析多種基因組資料時減少處理時間並降低成本。對 Broad Institute 的 GATK 於生殖细胞系工作流程上的最佳應用來說,在 GPU 上使用 Parabricks 進行分析的速度可提高多達 24 倍,且成本不到一半。
Broad Institute 研究人員還將獲得醫學影像開源深度學習框架 MONAI 的存取權,以及可用於基因組單細胞分析、用於加速資料準備的 GPU 加速資料科學工具套件 NVIDIA RAPIDS™。
進一步瞭解 Clara Parabricks 與 Terra 的整合細節,並搶先試用 NVIDIA BioNeMo 大型語言模型服務。
觀看創辦人暨執行長黃仁勳在 GTC 2022 的主題演講。免費報名 GTC 大會,與 NVIDIA 及業界領袖一同參與精彩議程。
發表迴響