2021靜宜資科系專題 ─ 第五組

利用評分模式整合
各基因體平台之資訊與權重

針對子宮頸癌做拷貝數與基因表現之權重評分模型

子宮頸癌

子宮頸癌,對婦女健康造成極大的威脅。
可能受年齡、吸菸、性生活、荷爾蒙等數種原因,導致子宮頸癌的發生。

結論

根據分析結果,推測GE是影響子宮頸癌比例最重要的因素,往後可嘗試使用其他癌症資料放入本研究之模型中,觀察其分類結果的準確率以及何者因素影響較大。

團隊介紹

指導老師:陳佩君

組員:
曾湘庭、陳虹君
黃雅瑄、許雅雯
溫嘉文、謝曉茹、江泯萱

首頁

概論

+

DNA

DNA序列變異

+

RNA

RNA序列變異

=

Cancer

癌症的發生

摘要與簡介

摘要

一、研究背景與動機

  疾病的形成可能與DNA和RNA的變異有關,因此必須同時考慮。以往的整合性研究,大部分假設DNA與RNA對疾病的影響相同。因為欲整合DNA與RNA對疾病的影響力,本研究提出一個評分模式,可整合DNA與RNA訊息外,還可藉由權重判斷,影響疾病的主因是因遺傳還是變異,提供後續醫藥發展的參考與重心。

  近年來,國內癌症罹患率越來越高,其中婦女發生率最高為子宮頸癌,我們使用一筆共307位子宮頸癌患者CN與GE的資料,針對體內的遺傳物質分析與疾病之間的關聯。

二、研究方法

  首先,經過資料的整合之後,針對HPV16與HPV18做T檢定取得P-value值,並篩選基因做初步分類,便於做接下來的分析。其中,以邏輯斯迴歸(Logistic regression)作為權重選取之方法,KNN演算法(K-Nearest Neighbor)則為預測分類之用途。

三、研究結果

  設計一個評分方法結合CN以及GE得到SCORE,利用SCORE分別對CN、GE做T檢定後得到的P-value值來擷取基因,並將基因放入KNN模型中做分類預測。

  無論K值為多少,GE的正確率都是較高的,可推測GE是影響子宮頸癌最大的因素。