AWS助科學家發現13萬種RNA病毒 預防全球冠狀病毒傳染病爆發
Amazon Web Services (AWS)宣佈近期與加拿大英屬哥倫比亞大學雲端創新中心 (UBC CIC) 達成合作,讓其國際科學家團隊利用建基於AWS技術的超級運算平台,在短短11天內蒐集了近600萬份公開生物樣本,並成功識別出超過13萬種新的核糖核酸 (RNA) 病毒,當中包括9種新型冠狀病毒。相比之下,若科學家使用一台傳統電腦進行此項RNA病毒研究,預計需時逾2,000年才能完成。透過識別並溯源新型病毒,科學家期望能在病毒感染人類、牲畜、農作物和瀕危物種前及早識別出它們,協助預防全球傳染病大爆發。
在AWS的支援下,UBC CIC團隊和全球計算病毒學家展開了「The Open Virome」計劃,創建了用於發現病毒的公開雲端運算平台Serratus。研究成果已發佈於科學雜誌《自然》(Nature) 。團隊同時亦公開病毒數據庫,與全球科學界分享最新發現,有助加速全球各地對RNA病毒的研究。
RNA病毒引起的疾病包括普通感冒、流感、SARS、新冠肺炎、丙型肝炎、伊波拉、狂犬病、小兒麻痺症和麻疹等。由於RNA病毒繁殖和進化速度快,它們更容易感染不同的新宿主。若基因組學研究人員能夠及早識別新冠病毒,將徹底改變現時全球疫情情況。透過AWS雲端服務的幫助下取得的研究成果,已從根本上改變了生物資訊學的研究方式。科學家以往需花數十年分析及研究數據,最終卻只能發現1.5萬種病毒。在使用AWS的基礎架構和服務後,「The Open Virome 」計劃研究團隊已為科學界在發現新病毒上節省了數千萬港元和長達數年的時間。
病毒的識別和研究需要分析大量的基因測序數據,其中包括數十萬種未知病毒的DNA和RNA。基因組學的數據每天都在倍增,以致病毒測序數據庫變得非常龐大,依靠傳統運算根本無法對其進行全面分析和處理。「The Open Virome 」計劃負責人、計算病毒學家Artem Babaian表示:「數據是預防未來病毒蔓延的關鍵,但往往因數據量超出處理能力,即使擁有所需數據,我們也未能靈活應用。 」
透過「The Open Virome 」計劃,研究人員僅在8周內便順利在AWS上建構了功能強大的超級運算平台。借助AWS卓越的彈性運算能力,他們能夠快速處理數百萬GB的數據,並且獲得了顯著的成本效益。團隊在Amazon Simple Storage Service (Amazon S3) 中複製了病毒基因測序資料庫 (Sequence Read Archive) 後,使用AWS彈性運算雲端實例Amazon Elastic Compute Cloud (Amazon EC2) 來分析數據集。團隊的原定目標是以少於1美分的成本處理每個測序數據集,然而在計劃完成時實際每個測序數據集的處理成本僅為半美分以下,超越了原定目標。
在短短11天內,團隊處理了高達570萬個測序數據集,並且僅僅花費了2.4萬美元 (約18.8萬港元),發現了13萬種新型RNA病毒。透過建基於AWS的Serratus平台,研究人員不僅能識別潛在有害的新病毒,更能提醒科學家注意導致新冠肺炎病毒 (SARS-CoV-2 virus) 的潛在突變,幫助改善診斷測試和疫苗開發,為醫療政策決策者提供更有效的資訊。
醫療和生命科學行業是AWS的優勢領域之一,通過在基因組學研究中應用雲端運算,幫助客戶將更多的時間和資源投放於科研,及加快獲得洞見,從而更快地進行突破性研究和推出產品。AWS強大的運算和機器學習服務確保科學家可以快速地透過執行工作負載,其近乎無限的運算能力且靈活的定價亦帶來非常高的成本效益,同時其遍佈全球的基礎設施和統一的架構,及託管的40 多個開放的生命科學和基因組數據集,能確保科學家在全球各地展開安全的研究協作。
發表迴響