Amazon Omics 旨在大規模優化生物數據分析


在其年度 re:Invent 大會上,Amazon Web Services 週二推出了一項名為 Amazon Omics 的新服務,旨在幫助生物信息學家、研究人員和科學家存儲和分析基因組和其他生物數據類型,以加速精準醫學的科學進步。

組學通常是指以後綴“組學”結尾的生物學研究領域,例如基因組學、轉錄組學(研究細胞中的 RNA)、蛋白質組學(研究蛋白質組或蛋白質組)和代謝組學(研究細胞內的分子)。 組學通常涉及使用大數據集的大規模研究。

據該公司稱,這項新服務不僅可以被科學家用來創建一個巨大的數據存儲,還可以導入大型原始數據文件,例如基因組序列或精準醫學中使用的其他數據文件——一個使用基因組和蛋白質的醫學領域優化疾病治療的數據。

AWS 表示,Amazon Omics 還可以幫助建立基本的生物信息學工作流程並使用現有的 AWS 分析和機器學習服務分析結果,並補充說該服務會隨著使用量的增長自動配置底層基礎設施。

針對生物信息學優化的數據存儲

亞馬遜的首席開發倡導者 Channy Yun 在一篇博文中寫道,新服務基於三個主要組件——優化存儲、工作流託管計算和麵向特定類型分析的數據存儲。

為了降低成本,Amazon Omics 使用生物信息學感知存儲選項來存儲原始序列數據。 據該公司稱,為了優化運行分析的數據,Amazon Omics 將原始數據導入變體存儲並將其轉換為可作為 Apache Iceberg 表使用的查詢就緒模式。

版權所有 © 2022 IDG Communications, Inc.

發佈留言