23andMe:大數據引發大責任

23andMe:大数据引发大责任

點擊標題下「大數據文摘」可快捷關注

大數據文摘翻譯作品

翻譯/整理:孫強,徐麗玲

23andMe是一家谷歌支持的面向消費者的基因檢測公司,最近他們宣佈將他們已有的海量基因數據應用於藥物開發。我想這是一個非常好的主意,但我們要提醒谷歌記住他們的“不作惡”原則。

23andMe是什麼?

23andMe提供通過郵件下單的個人基因組測序服務:下了單,你會收到一套試劑盒,用棉棒刮擦口腔上顎提取DNA樣本,並寄回給測序公司,然後等待自己的基因檢測結果(在線顯示)。聽起來很炫,不是嗎?數據來源形式是一塊“SNP面板”,這意味著測試一長串已知的在一般人群中很常見的單核苷酸突變。我們所繼承的SNPs的獨特模式可以描述我們祖先在世界各地的進化路徑,並告訴我們可能攜帶的或風險比較大的疾病。

我的一個南非同事為了好玩做過其中一項測試。他驚喜地發現他家族中關於他的曾曾曾祖母是黑人的傳言是真的,他的整個家族都繼承了她的一些非洲黑人的SNP模式。在一次家庭聚會上,在一些令人不快的種族主義親戚面前,他非常高興地宣佈了這個發現。這些科學證據無疑給了那些種族偏執狂們一記響亮的耳光,呵呵,沒有比這更令人高興的了。

這些數據如何應用於藥物開發?

在藥物開發領域,一個很流行的實踐是:通過DNA測序從一群具有相同疾病人群中尋找出共同的因子,以確定治療的靶目標。大部分時候,基因突變通過增加、減少或改變特定蛋白的產物引發疾病。明確影響某個蛋白表達的基因的突變給研究者提供一個靶點。然後他們能夠嘗試開發藥物替代缺陷蛋白,或者阻止它的過分表達或錯誤表達。接下來,他們能夠採用模型生物測試藥物的有效性,如通過改變老鼠的基因結構使其攜帶相同的基因突變。

聽起來很科學是吧?這種藥物開發有時候會成功,但是更多的時候是失敗,導致藥物開發非常昂貴。製藥公司存在的很多問題都源於這樣一個事實: 藥物開發是一個令人難以置信的昂貴和風險極高的事業。這導致了 “綁架信息”的行業氛圍,阻礙了醫學發現的共享。23andMe可能會改變這一局面,把信息共享的力量還給公眾。當然,他們也可能會成為其他像葛蘭素史克一樣封閉的公司。

23andMe介入藥物開發是好事嗎?

我並不同意這一觀點,即醫藥公司必然是“邪惡”的 - 但他們的行業的特性使得他們在盈利的時候兼顧道德幾乎是不可能的。開發一種藥物,平均而言,大約需要15年,耗資20億美元,才能把它推向市場。按照法律規定,一個公司新藥的專利保護只有五年,之後藥物進入非專利保護的一般生產。在這些苛刻的條件下,企業如何能夠盈利?他們或者在五年中拼命提高藥價,或玩一些其他花樣,如每4.9年召回'有問題'的藥物,然後以不同的名稱重新包裝上市。

如果我們想要得到免費的信息和負擔得起的藥品,藥物開發應留給各國政府和慈善機構,而不是企業。或者,你可以利用社會的頭腦眾籌來做這個事情。廣大人民群眾是個巨大的智力資源,具有難以估量的計算能力。目前已經有一些非常成功的智力眾籌的例子:

- Galaxy Zoo 該項目讓廣大市民從望遠鏡和衛星圖片中幫助分類數以千記的星系。電腦做這種工作不給力,而廣大群眾的頭腦風暴推進了項目,並得以跨越式發展(漂亮吧!)

- The Yellow Card Scheme (黃色卡片計劃),使人們能夠自我記錄報告任何藥物的不良反應。成千上萬的人填寫卡片,詳細記錄了他們那一天吃了什麼東西,他們是如何用藥的,這些詳細信息使我們可能發現一些以前很多年都沒有注意到的重要發現,比如在服用某些藥物時,飲用西柚汁是危險的。

23andMe:大數據引發大責任

西柚汁的某些成分能影響一些藥物在人體內的代謝效率,進而影響藥物劑量的有效性

我喜歡把科學交回人們手中的想法,它不應該被籠罩著神秘的面紗。科學不只是屬於寥寥幾個頭髮凌亂的天才 - 不管是誰,只要他有意解決問題,就可以推動科學前進。 23andMe公司有機會從大眾手裡獲得極其豐富的數據,在科學發現上作出前所未有的貢獻。我希望他們選擇保持低調:越來越多的人會貢獻和參與他們的項目,使更豐富的數據集成為可能。

自我報告數據集,會帶來一些偏差。你能記住,你的姑媽是死於中風或動脈瘤?你究竟是否清楚你的大家庭的家族遺傳關係?任何這種大規模的數據集都會出現可靠性問題。我認為,來自公眾的公開報告數據和科學分析結合得越緊密越好。處理大數據時,強大的分析和自我報告產生的偏差都是大問題, 搞不好會導致虛假的相關分析和結果。除此之外,這些23andMe的測試結果還會帶來另外的偏差:他們沒有測試全基因組,甚至沒有檢測大段DNA的的突變。所以,利用該項目的數據我們雖然有可能找到一些新的藥物靶標或未知的相互作用,但我們對結果需要謹慎對待。一個突變的存在或不存在僅僅是預測疾病的第一步:一個小的突變的表現型效應,像導致鐮狀紅細胞疾病的突變那樣,可以是非常難預測的,因為它依賴於一系列在基因、細胞和環境等不同水平的相互作用的因素。

大數據引發大的責任。我將繼續跟蹤23andMe,也許我還會買他們的測試盒 !不過,更多的數據可能來自政府牽頭的巨資項目,雖然現在還是未雨綢繆階段:比如100,000基因組計劃( 小編注:100000基因組計劃是英格蘭政府的一個基因組計劃,準備測100000個基因組,詳細信息參考鏈接:

http://www.genomicsengland.co.uk/the-100000-genomes-projet/ )。

【醫療大數據欄目介紹】

2015年2月7日“醫療大數據專欄”正式成立。隨著基因芯片及DNA測序技術的發展,生物醫療大數據迅猛發展,既是大數據技術發展的原動力,也是大數據技術的受益者。大數據文摘2013年7月成立,我們專注數據,每日堅持分享優質內容,從未間斷,我們努力為讀者和志願者打造一個分享和交流平臺。作為大數據文摘的志願者群,我們中有不少人從事醫療大數據相關工作,關心醫療大數據的發展,願意通過這個專欄,和大家一起分享醫療大數據的點點滴滴。

如果您是專業人員,願意與大家分享,請加入我們,我們把這個平臺和專欄做得更好。精準醫療的革命時代到來了,讓我們一起關注醫療大數據技術的發展。

【主編介紹】

有意聯繫譯者的朋友,請給“大數據文摘”後臺留言,附自我介紹及微信ID,謝謝。

23andMe:大數據引發大責任

孫強,資深生物信息專家,現在服務於美國國立癌症研究所,從事癌症基因組數據庫管理工作。熱愛大數據,加入大數據文摘志願者行列一年有餘,願以文會友,廣結大數據善緣。旅居美國多年,現在定居於大華府地區。

讀過的學校:山東大學,中科院植物所,加大洛杉磯分校( UCLA )

生活過的城市:淄博,濟南,北京,洛杉磯,華盛頓

其他愛好:足球,釣魚,打牌

大數據格言:big data is better data

大數據文摘精彩文章:

回覆金融 查看【金融與商業】專欄歷史期刊文章

回覆可視化 感受技術與藝術的完美結合

回覆安全 關於洩密、黑客、攻防的新鮮案例

回覆算法 既漲知識又有趣的人和事

回覆谷歌 看其在大數據領域的舉措

回覆院士 看眾多院士如何講大數據

回覆色情 這個,你懂的,可是你真的懂嗎?

回覆隱私 看看在大數據時代還有多少隱私

回覆醫療 查看醫療領域文章6篇

回覆徵信 大數據徵信專題四篇

回覆大國 "大數據國家檔案"之美國等12國

回覆體育 大數據在網球、NBA等應用案例

回覆平安 中國平安相關大數據案例、新聞

回覆志願者 瞭解大數據文摘及如何加入

大數據文摘ID:BigDataDigest

專注大數據,每日有分享

覆蓋千萬讀者的WeMedia聯盟成員之一


分享到:


相關文章: