本專題將建立一個人類與病毒共有基因體DNA 序列的網際網路介面的查詢系統 。
這個系統包括三個的子系統 ( 1 )基因體序列之可擴充性儲存系統( 2 )DNA 序列線上比對系統(3) 病毒分類查詢系統 。
「 基因體序列之可擴充性儲存系統 」 是將非關聯式資料庫 HBase 建置在實驗室自行架設的 Hadoop Cluster 系統 圖 5 來儲存大量的共有基因體 DNA 序列與這些序列在不同類別 人類與各種病毒 出現次數分布 。 「 病毒分類查詢系統 」 則是使用傳統的關聯式 MySQL 資料庫來查詢病毒的分類資訊 科屬種 。 「 DNA 序列線上比對系統 」 則是利用網路機器人 將查詢者輸入的 DNA 序列 呼叫 NCBI Blast API完成線上即時比對 然後篩選回傳比對結果 。 本專題所開發的查詢系統 可以提供生物或病毒學家做全面性地 「 人類與病毒共有基因體 DNA 序列 」 研究參考 。