国产成色视频在线播放_日本毛色视频网了_夜夜夜高潮夜夜爽的视频_无码一区免费不卡

全國熱線:400 0087 916

english
中文 English

資訊中心

【CDE】開征求《用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則(征求意見稿)》

2020-08-03 2608
關(guān)于公開征求《用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則(征求意見稿)》意見的通知
發(fā)布日期:20200803

       為進(jìn)一步指導(dǎo)和規(guī)范申辦者利用真實世界數(shù)據(jù)生成真實世界證據(jù)支持藥物研發(fā),我中心組織起草了《用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則(征求意見稿)》,現(xiàn)在中心網(wǎng)站予以公示,以廣泛聽取各界意見和建議,歡迎各界提出寶貴意見和建議,并請及時反饋給我們。
       征求意見時限為自發(fā)布之日起2個月。
       您的反饋意見請發(fā)到以下聯(lián)系人的郵箱:
       聯(lián)系人:高麗麗、趙駿
       聯(lián)系方式:gaoll@cde.org.cn,zhaojun@cde.org.cn
       感謝您的參與和大力支持。
                                                                                                                           國家藥品監(jiān)督管理局藥品審評中心
                                                                                                                                         2020年8月3日

附件 1 : 《用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則(征求意見稿)》.docx
附件 2 : 《用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則(征求意見稿)》起草說明.doc

 

附件1:

 

 

 

用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)

指導(dǎo)原則

(征求意見稿)

 

 

 

 

 

 

2020年7月

 

 

 

一、 概述 1

二、 真實世界數(shù)據(jù)來源及現(xiàn)狀 2

(一) 真實世界數(shù)據(jù)常見的主要來源 2

1. 醫(yī)院信息系統(tǒng)數(shù)據(jù) 2

2. 醫(yī)保支付數(shù)據(jù) 3

3. 登記研究數(shù)據(jù) 3

4. 藥品安全性主動監(jiān)測數(shù)據(jù) 4

5. 自然人群隊列數(shù)據(jù) 4

6. 組學(xué)數(shù)據(jù) 5

7. 死亡登記數(shù)據(jù) 5

8. 患者報告結(jié)局?jǐn)?shù)據(jù) 5

9. 來自移動設(shè)備的個體健康監(jiān)測數(shù)據(jù) 6

10. 其它特定功能數(shù)據(jù) 6

(二) 真實世界數(shù)據(jù)應(yīng)用面臨的主要問題 8

三、 真實世界數(shù)據(jù)適用性評價 8

(一) 源數(shù)據(jù)的適用性評價 9

(二) 經(jīng)治理數(shù)據(jù)的適用性評價 10

1. 相關(guān)性評價 10

2. 可靠性評價 12

四、 真實世界數(shù)據(jù)治理 14

(一) 個人信息保護(hù)和數(shù)據(jù)安全性處理 15

(二) 數(shù)據(jù)提取 15

(三) 數(shù)據(jù)清洗 16

(四) 數(shù)據(jù)轉(zhuǎn)化 17

(五) 數(shù)據(jù)傳輸和存儲 17

(六) 數(shù)據(jù)質(zhì)量控制 18

(七) 通用數(shù)據(jù)模型 19

(八) 真實世界數(shù)據(jù)治理計劃書 20

五、 真實世界數(shù)據(jù)的合規(guī)性、安全性與質(zhì)量管理體系 21

(一) 數(shù)據(jù)合規(guī)性 21

(二) 數(shù)據(jù)安全管理 21

(三) 質(zhì)量管理體系 22

六、 與監(jiān)管機(jī)構(gòu)的溝通 23

名詞解釋 24

參考文獻(xiàn) 28

附錄1 中英文對照表 31

 

 

用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則

 

  • 概述

真實世界證據(jù)Real World EvidenceRWE是藥物有效性和安全性評價證據(jù)鏈的重要組成部分,其相關(guān)概念和應(yīng)用參見《真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行)》。而真實世界數(shù)據(jù)Real World Data, RWD則是產(chǎn)生RWE的基礎(chǔ),沒有高質(zhì)量的適用的RWD支持,RWE亦無從談起。

真實世界數(shù)據(jù)是指來源于日常所收集的各種與患者健康狀況和/或診療及保健有關(guān)的數(shù)據(jù)。并非所有的真實世界數(shù)據(jù)經(jīng)分析后產(chǎn)生真實世界證據(jù),只有滿足適用性的RWD經(jīng)恰當(dāng)和充分地分析后才有可能形成RWE。目前RWD普遍存在數(shù)據(jù)的記錄、采集、存儲等流程缺乏嚴(yán)格的質(zhì)量控制,數(shù)據(jù)不完整,數(shù)據(jù)標(biāo)準(zhǔn)數(shù)據(jù)模型不統(tǒng)一等問題,對RWD的有效使用形成了障礙。因此,如何使收集的RWD能夠成為或經(jīng)治理后能夠成為滿足臨床研究目的所需的分析數(shù)據(jù),以及如何評估RWD是否適用于產(chǎn)生RWE,是使用真實世界數(shù)據(jù)形成真實世界證據(jù)支持藥物監(jiān)管決策的關(guān)鍵問題。

指導(dǎo)原則作為《真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行)》的補充,將從真實世界數(shù)據(jù)的定義、來源、評價、治理、標(biāo)準(zhǔn)、安全合規(guī)、質(zhì)量保障、適用性等方面,對真實世界數(shù)據(jù)給出具體要求和指導(dǎo)性建議,以幫助申辦者更好地進(jìn)行數(shù)據(jù)治理,評估RWD的適用性,為產(chǎn)生有效的RWE做好充分準(zhǔn)備。

與藥物研發(fā)有關(guān)的真實世界數(shù)據(jù)主要包括在真實醫(yī)療環(huán)境下業(yè)務(wù)流程記錄的數(shù)據(jù)(如電子病歷),以及各種觀察性研究數(shù)據(jù)等。此類數(shù)據(jù)可以是開展真實世界研究前已經(jīng)收集的數(shù)據(jù),也可以是為了開展真實世界研究而新收集的數(shù)據(jù)。

我國真實世界數(shù)據(jù)的來源按功能類型主要可分為醫(yī)院信息系統(tǒng)數(shù)據(jù)、醫(yī)保支付數(shù)據(jù)、疾病登記數(shù)據(jù)、公共衛(wèi)生監(jiān)測數(shù)據(jù)(如藥品安全性監(jiān)測、死亡信息登記、院外健康監(jiān)測)、自然人群隊列數(shù)據(jù)等,以下是根據(jù)數(shù)據(jù)功能類型分類的常見真實世界數(shù)據(jù)來源。

  1. 醫(yī)院信息系統(tǒng)數(shù)據(jù)

醫(yī)院信息系統(tǒng)數(shù)據(jù)包括結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)字化或非數(shù)字化患者記錄,如患者的人口學(xué)特征、臨床特征、診斷、治療、實驗室檢查、安全性和臨床結(jié)局等,通常分散存儲于醫(yī)療衛(wèi)生機(jī)構(gòu)的電子病歷/電子健康檔案(EMR/EHR)、實驗室信息管理系統(tǒng)(LIS)、醫(yī)學(xué)影像存檔與通訊系統(tǒng)(PACS)、放射信息管理系統(tǒng)(RIS)等不同信息系統(tǒng)中。有些醫(yī)療機(jī)構(gòu)在數(shù)據(jù)集成平臺或臨床數(shù)據(jù)中心(CDR)的基礎(chǔ)上建立院級科研數(shù)據(jù)平臺,整合患者門診、住院、隨訪等各類信息,形成直接用于臨床研究的數(shù)據(jù)。有些區(qū)域性醫(yī)療數(shù)據(jù)庫,利用相對集中的物理環(huán)境進(jìn)行跨醫(yī)療機(jī)構(gòu)的臨床數(shù)據(jù)的存儲和處理,具有存儲量大、類型多等特點,也可作為RWD的潛在來源。

醫(yī)院信息系統(tǒng)數(shù)據(jù)基于臨床診療實踐過程的記錄,涵蓋臨床結(jié)局和暴露變量范圍較廣,尤其電子病歷數(shù)據(jù)在真實世界研究中應(yīng)用較廣。

  1. 醫(yī)保支付數(shù)據(jù)

我國醫(yī)保支付數(shù)據(jù)的主要來源有兩類,一類是政府、醫(yī)療機(jī)構(gòu)建立的基本醫(yī)療保險體系,進(jìn)行醫(yī)保支付數(shù)據(jù)庫的建立和統(tǒng)一管理,包含有關(guān)患者基本信息、醫(yī)療服務(wù)利用、處方、結(jié)算、醫(yī)療索賠和計劃保健等結(jié)構(gòu)化字段的數(shù)據(jù)。另一類是商業(yè)健康保險數(shù)據(jù)庫,保險機(jī)構(gòu)建立,數(shù)據(jù)以保險公司理賠給付與保險期限作為分類指標(biāo),數(shù)據(jù)維度相對簡單。醫(yī)保系統(tǒng)作為真實世界數(shù)據(jù)來源,較多用于開展衛(wèi)生技術(shù)評價和藥物經(jīng)濟(jì)學(xué)研究

  1. 登記研究數(shù)據(jù)

登記研究(Registry Study數(shù)據(jù)通過有組織的系統(tǒng),利用觀察性研究的方法搜集臨床和其他來源的數(shù)據(jù),可用于評價特定疾病、特定健康狀況和暴露人群的臨床結(jié)局。登記研究根據(jù)研究定義的人群特點主要包括產(chǎn)品登記、健康服務(wù)登記和疾病登記三類,我國的登記研究主要是疾病登記和產(chǎn)品登記研究。其中,醫(yī)療機(jī)構(gòu)和企業(yè)支持開展的產(chǎn)品登記研究,觀察對象是使用某種醫(yī)藥產(chǎn)品的病例,重點觀察其不同適應(yīng)的效果或監(jiān)測不良反應(yīng)。

登記研究數(shù)據(jù)庫的優(yōu)勢在于以特定患者為研究人群通過整合臨床診療、醫(yī)保支付等多種數(shù)據(jù)來源,數(shù)據(jù)采集較為規(guī)范,一般包括患者自報數(shù)據(jù)和長期隨訪數(shù)據(jù),觀測結(jié)局指標(biāo)通常較為豐富,具有準(zhǔn)確性較高、結(jié)構(gòu)化強(qiáng)、人群代表性較好等優(yōu)點,于評價藥物的有效性、安全性、經(jīng)濟(jì)性和依從性具有較好的適用性

  1. 藥品安全性主動監(jiān)測數(shù)據(jù)

藥品安全性主動監(jiān)測數(shù)據(jù)主要用于開展藥物安全性研究及藥物流行病學(xué)研究,通過國家或區(qū)域藥品安全性監(jiān)測網(wǎng)絡(luò),從醫(yī)療機(jī)構(gòu)、制藥公司、醫(yī)學(xué)文獻(xiàn)、網(wǎng)絡(luò)媒體、患者報告結(jié)局等渠道,進(jìn)行數(shù)據(jù)收集此外,醫(yī)療機(jī)構(gòu)和企業(yè)自身建立的自有藥品安全性監(jiān)測數(shù)據(jù)庫也可能成為此類數(shù)據(jù)來源的一部分。

  1. 自然人群隊列數(shù)據(jù)

自然人群隊列數(shù)據(jù)指對普通人群或患有重大疾病人群通過長期前瞻性動態(tài)追蹤觀察,獲取的各種數(shù)據(jù)。自然人群隊列數(shù)據(jù)具有統(tǒng)一標(biāo)準(zhǔn)、信息化共享、時間跨度長和樣本量較大的特點,此類RWD可以幫助構(gòu)建常見疾病風(fēng)險模型,可對藥物研發(fā)的精準(zhǔn)目標(biāo)人群定位提供支持。

  1. 組學(xué)數(shù)據(jù)

組學(xué)數(shù)據(jù)作為精準(zhǔn)醫(yī)學(xué)的重要支撐,主要包括基因組、表觀遺傳、轉(zhuǎn)錄組、蛋白質(zhì)組和代謝組等數(shù)據(jù),這些數(shù)據(jù)從系統(tǒng)生物學(xué)角度刻畫了患者遺傳、生理學(xué)、生物學(xué)等方面的特征通常組學(xué)數(shù)據(jù)需要結(jié)合臨床數(shù)據(jù)才可能成為適用的RWD。

  1. 死亡登記數(shù)據(jù)

人口死亡登記是一個國家對其國民的死亡信息持續(xù)完整的收集和記錄。目前我國有四個系統(tǒng)用于收集人口死亡信息,分別隸屬于國家疾控中心、國家衛(wèi)生健康委員會、公安部和民政部。人口死亡登記數(shù)據(jù)包含死亡醫(yī)學(xué)證明書中的所有信息,記錄了詳細(xì)的死亡原因和死亡時間,可以產(chǎn)出人群分死因死亡率的數(shù)據(jù)來源。

  1. 患者報告結(jié)局?jǐn)?shù)據(jù)

患者報告結(jié)局(Patient-Reported Outcome, PRO是一種來自患者自身測量與評價疾病結(jié)局的指標(biāo),包括癥狀、生理、心理、醫(yī)療服務(wù)滿意度等,PRO在藥物評價體系發(fā)展中越來越重要。其記錄有紙質(zhì)和電子兩種方式,后者稱為電子患者報告結(jié)局(ePROePRO的興起與應(yīng)用,使得PRO與電子病歷系統(tǒng)對接并形成患者層面的完整數(shù)據(jù)流成為可能。

  1. 來自移動設(shè)備的個健康監(jiān)測數(shù)據(jù)

個人健康監(jiān)測數(shù)據(jù)可通過移動設(shè)備(如智能手機(jī)、可穿戴設(shè)備)實時采集個體生理體征指標(biāo)。這些數(shù)據(jù)常產(chǎn)生于普通人群的自我健康管理、醫(yī)療機(jī)構(gòu)對慢病患者的監(jiān)測、醫(yī)療保險公司對參保人群健康狀況評估的過程,通常存儲于可穿戴設(shè)備企業(yè)、醫(yī)療機(jī)構(gòu)數(shù)據(jù)庫以及商業(yè)保險公司數(shù)據(jù)系統(tǒng)等。由于可穿戴設(shè)備集生理體征數(shù)據(jù)方面具有便利性和即時性等優(yōu)勢,與電子健康數(shù)據(jù)銜接可形成更完整RWD。

  1. 其它特定功能數(shù)據(jù)

1 公共衛(wèi)生監(jiān)測數(shù)據(jù)

我國建立了一系列有關(guān)公共衛(wèi)生監(jiān)測的數(shù)據(jù)庫,如傳染病監(jiān)測、免疫接種不良事件(Adverse Events Following Immunization,AEFI)監(jiān)測等,所記錄的數(shù)據(jù)可用于分析傳染病的發(fā)病情況、疫苗的一般反應(yīng)和異常反應(yīng)發(fā)生率等。

2 患者隨訪數(shù)據(jù)

在真實世界臨床診療環(huán)境中,院內(nèi)電子病歷數(shù)據(jù)往往無法涵蓋患者一些重要的臨床指標(biāo),如總生存期、五年生存率、不良反應(yīng)信息等,需要補充長期隨訪數(shù)據(jù),才能形成適用的RWD。患者隨訪數(shù)據(jù)主要是指以臨床研究為目的,醫(yī)院隨訪部門或第三方授權(quán)服務(wù)商以信件、電話、門診、短信、網(wǎng)絡(luò)隨訪等方式對離院患者開展臨床終點、康復(fù)指導(dǎo)、用藥提醒、滿意度調(diào)查等服務(wù),服務(wù)中收集的院外數(shù)據(jù),通常存儲于醫(yī)院隨訪數(shù)據(jù)系統(tǒng)。通過與病歷數(shù)據(jù)的連接,實現(xiàn)多源臨床數(shù)據(jù)的融合,可最終形成覆蓋患者生命周期的完整數(shù)據(jù),用以探索疾病發(fā)生機(jī)制、發(fā)展規(guī)律、治療方法、預(yù)后相關(guān)因素等臨床研究問題。

3患者用藥數(shù)據(jù)

患者診療過程藥品使用數(shù)據(jù)包括患者信息、藥品品類、劑量以及不良反應(yīng)等信息,通常存儲于醫(yī)院藥品管理信息系統(tǒng)、醫(yī)藥電子商務(wù)平臺、制藥企業(yè)產(chǎn)品追溯和藥品安全性信息數(shù)據(jù)庫,以及藥品使用監(jiān)測平臺等。伴隨遠(yuǎn)程診療和互聯(lián)網(wǎng)+慢病管理模式的普及,存儲于處方流轉(zhuǎn)平臺或醫(yī)藥電商平臺的患者院外用藥數(shù)據(jù)逐漸增多,此類數(shù)據(jù)的有效利用或拼接,可作為患者維度診療過程記錄的RWD來源。

隨著醫(yī)療信息技術(shù)的不斷發(fā)展,新的RWD類型來源會不斷出現(xiàn),但其具體應(yīng)用有賴于所要解決的臨床研究問題,以及該數(shù)據(jù)所支持產(chǎn)生RWE適用性。

數(shù)據(jù)來源看,相較于RCT數(shù)據(jù),RWD在大多數(shù)情況下缺乏記錄、采集、存儲等流程的嚴(yán)格質(zhì)量控制,會造成數(shù)據(jù)不完整、關(guān)鍵變量缺失、記錄不準(zhǔn)確等問題,這些數(shù)據(jù)質(zhì)量上的缺陷,會極大影響后續(xù)的數(shù)據(jù)治理和應(yīng)用,甚至?xí)绊憯?shù)據(jù)的可追溯性,研究者也難以發(fā)現(xiàn)其中的問題并進(jìn)行核對和修正。由于患者病程、就診地點以及時間和空間等因素的變化,可能導(dǎo)致患者疾病狀態(tài)及相關(guān)因素等信息的缺失,為臨床研究疾病狀態(tài)及結(jié)局的系統(tǒng)性評價帶來挑戰(zhàn)。傾向性的數(shù)據(jù)收集,特別是登記研究數(shù)據(jù),會導(dǎo)致研究結(jié)果偏倚的潛在風(fēng)險。

由于各種RWD間相對獨立和封閉、數(shù)據(jù)管理系統(tǒng)種類繁多、數(shù)據(jù)存儲分散且數(shù)據(jù)標(biāo)準(zhǔn)不一致、數(shù)據(jù)橫向整合和交換存在困難造成數(shù)據(jù)碎片化信息孤島現(xiàn)象突出。對于電子病歷數(shù)據(jù),由于高度敏感性,業(yè)務(wù)系統(tǒng)一般封閉管理,對它們的利用可能會到一定限制。此外,在缺乏統(tǒng)一標(biāo)準(zhǔn)的情況下,數(shù)據(jù)類型較為多樣,既有結(jié)構(gòu)化數(shù)據(jù),也有文本、圖片、視頻等非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),在數(shù)據(jù)記錄、采集、存儲的過程中,也會導(dǎo)致數(shù)據(jù)的冗余和重復(fù),進(jìn)而造成數(shù)據(jù)處理難度大。

真實世界數(shù)據(jù)的適用性評價應(yīng)基于特定的研究目的和監(jiān)管決策用途。適用性評價可分為兩個階段,第一階段是從可及性、倫理合規(guī)、代表性、關(guān)鍵變量完整性、樣本和源數(shù)據(jù)活動狀態(tài)等維度,對源數(shù)據(jù)進(jìn)行初步評價和選擇,判斷其是否滿足研究方案的基本分析要求;第二階段包括數(shù)據(jù)的相關(guān)性、可靠性,以及采用的或擬采用的數(shù)據(jù)治理機(jī)制(數(shù)據(jù)標(biāo)準(zhǔn)和通用數(shù)據(jù)模型)評價分析,經(jīng)治理的數(shù)據(jù)是否適用于產(chǎn)生真實世界證據(jù)(見圖1)。如果真實世界研究中研究者根據(jù)自己設(shè)計好的電子病例報告表(eCRF)前瞻性收錄指定來源數(shù)據(jù),則無需進(jìn)行第一階段的初步適用性評價。

1 真實世界數(shù)據(jù)的適用性評價和數(shù)據(jù)治理過程示意圖

滿足基本分析要求的源數(shù)據(jù)至少應(yīng)具備以下條件:

1. 數(shù)據(jù)庫處于活動狀態(tài)且數(shù)據(jù)可及

在研究期間數(shù)據(jù)庫應(yīng)是連續(xù)的處于活動狀態(tài)的,所記錄的數(shù)據(jù)均是可及的,即具有數(shù)據(jù)的使用權(quán)限,并且可被第三方特別是監(jiān)管機(jī)構(gòu)評估。

2. 符合倫理和數(shù)據(jù)安全性要求

源數(shù)據(jù)的使用應(yīng)通過倫理審核,并符合數(shù)據(jù)安全性要求

3. 臨床結(jié)局和暴露/干預(yù)變量

數(shù)據(jù)的記錄必須有臨床結(jié)局變量和暴露/干預(yù)變量。

4. 具有一定的數(shù)據(jù)完整性

源數(shù)據(jù)通常是不完整的,但應(yīng)具有一定的完整性,至少應(yīng)包括結(jié)局變量、暴露/干預(yù)變量、人口學(xué)變量和重要的協(xié)變量,還要考慮分析模型中缺失數(shù)據(jù)對研究結(jié)論穩(wěn)健性的影響。

5. 樣本量

應(yīng)充分考慮和預(yù)判經(jīng)數(shù)據(jù)治理后源數(shù)據(jù)例數(shù)明顯減少的情況,以保證統(tǒng)計分析所需的樣本量。

經(jīng)治理的真實世界數(shù)據(jù)的適用性評價主要根據(jù)數(shù)據(jù)相關(guān)性可靠性。

  1. 相關(guān)性評價

相關(guān)性評價旨在評估RWD是否與所關(guān)注的臨床問題密切相關(guān),重點關(guān)注關(guān)鍵變量的覆蓋度、臨床結(jié)局定義的準(zhǔn)確性、目標(biāo)人群的代表性和多源異構(gòu)數(shù)據(jù)的融合性。

1 關(guān)鍵變量和信息的覆蓋度

RWD應(yīng)包含與臨床結(jié)局相關(guān)的重要變量和信息,如藥物使用、患者人口學(xué)和臨床特征、協(xié)變量、結(jié)局變量、隨訪時間、潛在安全性信息等。如果上述變量存在部分缺失,需充分評估是否能夠使用可靠的估計方法進(jìn)行填補,以及對于因果推斷結(jié)果可能造成的影響。

2 臨床結(jié)局定義的準(zhǔn)確性

選擇具有臨床意義的結(jié)局并進(jìn)行準(zhǔn)確定義對于真實世界研究至關(guān)重要。臨床結(jié)局的定義應(yīng)包括所基于的診斷標(biāo)準(zhǔn)、測量方法及其質(zhì)量控制(如果有)、測量工具(如量表的使用)、計算方法、測量時點、變量類型、變量類型的轉(zhuǎn)換(如從定量轉(zhuǎn)換為定性)、終點事件評價機(jī)制(如終點事件委員會的運行機(jī)制)等。當(dāng)不同數(shù)據(jù)源對臨床結(jié)局的定義不一致時,應(yīng)定義統(tǒng)一的臨床結(jié)局,并采用可靠的轉(zhuǎn)換方法。

3 目標(biāo)人群的代表性

真實世界研究較傳統(tǒng)RCT的優(yōu)勢之一是具有更廣泛的目標(biāo)人群的代表性。因此,在制定納入和排除標(biāo)準(zhǔn)時,應(yīng)盡可能地符合真實世界環(huán)境下目標(biāo)人群。

4 多源異構(gòu)數(shù)據(jù)的融合性

由于RWD的特性,很多情況下屬于多來源的異構(gòu)數(shù)據(jù),需要將不同來源數(shù)據(jù)在個體水平進(jìn)行數(shù)據(jù)的鏈接、融合和同構(gòu)處理。因此,應(yīng)通過身份標(biāo)識符進(jìn)行個體水平的準(zhǔn)確鏈接,以支持通用數(shù)據(jù)模型或數(shù)據(jù)標(biāo)準(zhǔn)對數(shù)據(jù)源中關(guān)鍵變量進(jìn)行整合。

  1. 可靠性評價

真實世界數(shù)據(jù)的可靠性主要從數(shù)據(jù)的完整性(Completeness)、準(zhǔn)確性(Accuracy)、透明性(Transparency)、質(zhì)量控制(Quality Control)和質(zhì)量保證(Quality Assurance)幾個方面進(jìn)行評價。

(1) 完整性

完整性是指數(shù)據(jù)信息的缺失程度,包括變量的缺失和變量值的缺失。對于不同研究,數(shù)據(jù)的缺失程度、缺失原因和變量值的缺失機(jī)制不盡相同,應(yīng)該予以詳盡描述。雖然RWD無法避免數(shù)據(jù)缺失問題,但缺失比例應(yīng)有一定限度。當(dāng)特定研究的數(shù)據(jù)缺失比例明顯超過同類研究的比例時,會加大研究結(jié)論的不確定性,此時需要慎重考慮該數(shù)據(jù)能否作為支持產(chǎn)生RWE的數(shù)據(jù)。對缺失原因的詳細(xì)分析有助于對數(shù)據(jù)可靠性的綜合判斷。如果涉及缺失數(shù)據(jù)的填補問題,應(yīng)根據(jù)缺失機(jī)制的合理假設(shè)采用正確的填補方法。

(2準(zhǔn)確性

準(zhǔn)確性是指數(shù)據(jù)與其描述的客觀特征是否一致,包括源數(shù)據(jù)是否準(zhǔn)確、數(shù)據(jù)值域是否在合理范圍、結(jié)局變量隨時間變化趨勢是否合理、編碼映射關(guān)系是否對應(yīng)且唯一等。數(shù)據(jù)的準(zhǔn)確性需要依據(jù)較權(quán)威的參照進(jìn)行識別和驗證,例如,終點事件是否經(jīng)獨立的終點事件委員會做出判斷。

3透明性

RWD透明性是指RWD的治理方案和治理過程清晰透明,應(yīng)確保關(guān)鍵暴露變量、協(xié)變量和結(jié)局變量能夠追溯至源數(shù)據(jù),并反映數(shù)據(jù)的提取、清洗、轉(zhuǎn)換和標(biāo)準(zhǔn)化過程。無論采用人工數(shù)據(jù)處理還是自動化程序處理,數(shù)據(jù)治理標(biāo)準(zhǔn)化操作程序和驗證確認(rèn)文件要清晰記錄和存檔,尤其反映數(shù)據(jù)可信性的問題,如數(shù)據(jù)缺失度、變量閾值范圍、衍生變量計算方法和映射關(guān)系等。數(shù)據(jù)治理方案應(yīng)事先根據(jù)研究目的制定,應(yīng)確保數(shù)據(jù)治理過程與治理方案保持一致。數(shù)據(jù)的透明性還包括數(shù)據(jù)的可及性(Accessibility)、數(shù)據(jù)庫之間的信息共享和對患者隱私的保護(hù)方法的透明。

4 質(zhì)量控制

質(zhì)量控制是指用以確證數(shù)據(jù)治理的各個環(huán)節(jié)符合質(zhì)量要求而實施的技術(shù)和活動。質(zhì)量控制評價包括但不限于:數(shù)據(jù)提取、安全處理、清洗、結(jié)構(gòu)化,以及后續(xù)的存儲、傳輸、分析和遞交等環(huán)節(jié)是否均有質(zhì)量控制,以保證所有數(shù)據(jù)是可靠的,數(shù)據(jù)處理過程是正確的;是否遵循完整、規(guī)范、可靠的數(shù)據(jù)治理方案和計劃,并依托于相應(yīng)的數(shù)據(jù)質(zhì)量核查和系統(tǒng)驗證規(guī)程,以保障數(shù)據(jù)治理系統(tǒng)在正常和穩(wěn)態(tài)下運行,確保真實世界數(shù)據(jù)的準(zhǔn)確性和可靠性。

5質(zhì)量保證

質(zhì)量保證是指預(yù)防、探測和糾正研究過程中出現(xiàn)的數(shù)據(jù)錯誤或問題的系統(tǒng)性措施。RWD的質(zhì)量保證與監(jiān)管合規(guī)性密切相關(guān),應(yīng)貫穿于數(shù)據(jù)治理的每一個環(huán)節(jié),考慮的內(nèi)容包括但不限于:是否建立與真實世界數(shù)據(jù)有關(guān)的研究計劃、方案和統(tǒng)計分析計劃;是否有相應(yīng)的標(biāo)準(zhǔn)操作規(guī)程;數(shù)據(jù)收集是否有明確流程和合格人員;是否使用了共同的定義框架,即數(shù)據(jù)字典;是否遵守收集關(guān)鍵數(shù)據(jù)變量的共同時間框架;用于數(shù)據(jù)元素捕獲的技術(shù)方法是否充分,包括各種來源數(shù)據(jù)的集成、藥物使用和實驗室檢查數(shù)據(jù)的記錄、隨訪記錄、與保險數(shù)據(jù)的鏈接等;患者的選擇是否將偏倚最小化以體現(xiàn)真正的目標(biāo)人群;數(shù)據(jù)輸入是否及時、傳輸是否安全;是否滿足監(jiān)管機(jī)構(gòu)現(xiàn)場核查調(diào)閱源數(shù)據(jù)、源文件等相關(guān)要求。

數(shù)據(jù)治理(Data Curation是指針對特定臨床研究問題,為達(dá)到適用于統(tǒng)計分析而對原始數(shù)據(jù)所進(jìn)行的治理,其內(nèi)容包括但不限于:數(shù)據(jù)安全性處理、數(shù)據(jù)提?。ê鄠€數(shù)據(jù)源)、數(shù)據(jù)清洗(邏輯核查及異常數(shù)據(jù)處理、數(shù)據(jù)完整性處理)、數(shù)據(jù)轉(zhuǎn)化(數(shù)據(jù)標(biāo)準(zhǔn)、通用數(shù)據(jù)模型、歸一化、自然語言處理、醫(yī)學(xué)編碼、衍生變量計算)、數(shù)據(jù)傳輸和存儲、數(shù)據(jù)質(zhì)量控制等若干環(huán)節(jié)。

真實世界研究涉及個人信息保護(hù)應(yīng)遵循國家信息安全技術(shù)規(guī)范、醫(yī)療大數(shù)據(jù)安全管理相關(guān)規(guī)定,對個人敏感信息應(yīng)進(jìn)行去標(biāo)識化(de-identification)處理,確保根據(jù)數(shù)據(jù)無法進(jìn)行個人敏感信息匹配還原,通過技術(shù)和管理方面的措施,防止個人信息的泄漏、損毀、丟失、篡改。

數(shù)據(jù)安全性處理應(yīng)基于研究所涉及的各種數(shù)據(jù)的類型、數(shù)量、性質(zhì)和內(nèi)容,尤其對于個人敏感信息,建立數(shù)據(jù)治理各環(huán)節(jié)的數(shù)據(jù)加密技術(shù)要求、風(fēng)險評估和應(yīng)急處置操作規(guī)程,并開展安全措施有效性審計。

根據(jù)源數(shù)據(jù)的存儲格式、是否為電子數(shù)據(jù)、是否包含非結(jié)構(gòu)化數(shù)據(jù)因素選擇合適的方式進(jìn)行數(shù)據(jù)提取,在數(shù)據(jù)提取時均應(yīng)遵守以下原則:

數(shù)據(jù)提取的方法應(yīng)通過驗證,以保障提取到的數(shù)據(jù)符合研究方案的要求。數(shù)據(jù)提取應(yīng)確保提取到的原始數(shù)據(jù)與源數(shù)據(jù)的準(zhǔn)確性,應(yīng)對提取到的原始數(shù)據(jù)與源數(shù)據(jù)進(jìn)行時間戳管理。

使用與源數(shù)據(jù)系統(tǒng)可互操作或集成的數(shù)據(jù)提取工具可以減少數(shù)據(jù)轉(zhuǎn)錄中的錯誤,從而提高數(shù)據(jù)準(zhǔn)確性以及臨床研究中數(shù)據(jù)采集的質(zhì)量和效率。對于盲法研究,還應(yīng)評估使用可互操作或集成的數(shù)據(jù)提取工具帶來的揭盲風(fēng)險。

數(shù)據(jù)清洗(Data Cleaning是指對提取的原始數(shù)據(jù)進(jìn)行重復(fù)或冗余數(shù)據(jù)的去除、變量值邏輯核查(Edit Check)和異常值的處理,以及數(shù)據(jù)缺失的處理。需要注意,修正數(shù)據(jù)時如果無法追溯到主要研究者或源數(shù)據(jù)負(fù)責(zé)方簽字確認(rèn),數(shù)據(jù)不應(yīng)做修改,以保證數(shù)據(jù)的真實性。

首先在保證數(shù)據(jù)完整性的前提下去除重復(fù)數(shù)據(jù)及不相關(guān)數(shù)據(jù)。在不同數(shù)據(jù)源合并過程中,可能產(chǎn)生重復(fù)數(shù)據(jù),需要去除。同時由于數(shù)據(jù)源與通用數(shù)據(jù)模型映射關(guān)系的不準(zhǔn)確,可能會采集到與研究目標(biāo)不相關(guān)的數(shù)據(jù),從數(shù)據(jù)集中刪除不需要的觀測值可以減少不必要的工作。

然后進(jìn)行邏輯核查和異常數(shù)據(jù)處理。通過邏輯核查可以發(fā)現(xiàn)原始數(shù)據(jù)或者提取數(shù)據(jù)時產(chǎn)生的錯誤,例如出院時間早于入院時間,出生年月按年齡推算不符,實驗室檢查結(jié)果不符合實際,定性判斷結(jié)果與方案中定義的判斷標(biāo)準(zhǔn)不一致等。對異常數(shù)據(jù)的處理要非常謹(jǐn)慎,避免由此產(chǎn)生的偏倚。對于發(fā)現(xiàn)的錯誤和異常數(shù)據(jù)應(yīng)通過進(jìn)一步核實才能更改數(shù)據(jù),數(shù)據(jù)的更改應(yīng)保留記錄。

最后對數(shù)據(jù)缺失進(jìn)行處理,對于不同研究,數(shù)據(jù)的缺失程度、缺失原因和變量值的缺失機(jī)制不盡相同。如果涉及缺失數(shù)據(jù)的填補問題,應(yīng)根據(jù)缺失機(jī)制的合理假設(shè)采用正確的填補方法。

數(shù)據(jù)轉(zhuǎn)化是將經(jīng)過數(shù)據(jù)清洗后原始數(shù)據(jù)的數(shù)據(jù)格式標(biāo)準(zhǔn)、醫(yī)學(xué)術(shù)語編碼標(biāo)準(zhǔn)、衍生變量計算,按照分析數(shù)據(jù)Analysis Dataset)中對應(yīng)標(biāo)準(zhǔn)進(jìn)行統(tǒng)一轉(zhuǎn)化為適用RWD的過程。

對于自由文本數(shù)據(jù)的轉(zhuǎn)化使用可靠的自然語言處理算法,在保障數(shù)據(jù)轉(zhuǎn)化準(zhǔn)確、可溯源的前提下,提高轉(zhuǎn)化效率。

在進(jìn)行衍生變量計算時,應(yīng)明確用于計算的原始數(shù)據(jù)變量及變量值、計算方法及衍生變量的定義,并進(jìn)行時間戳管理,以保障數(shù)據(jù)的準(zhǔn)確性和可追溯性。

真實世界數(shù)據(jù)的傳輸和存儲應(yīng)當(dāng)基于可信的網(wǎng)絡(luò)安全環(huán)境,在數(shù)據(jù)收集、處理、分析至銷毀的全生命周期予以控制。在數(shù)據(jù)傳輸和存儲過程中都應(yīng)有加密保護(hù)。外,應(yīng)建立操作設(shè)置審批流程、角色權(quán)限控制和最小授權(quán)的訪問控制策略,鼓勵建立自動化審計系統(tǒng),監(jiān)測記錄數(shù)據(jù)的處理和訪問活動

數(shù)據(jù)質(zhì)量控制是確保研究數(shù)據(jù)完整性、準(zhǔn)確性和透明性的關(guān)鍵。數(shù)據(jù)質(zhì)量控制需要建立完善的RWD質(zhì)量管理體系和SOP,建議原則包括:

1. 確保源數(shù)據(jù)的準(zhǔn)確性真實性

如電子病歷作為關(guān)鍵數(shù)據(jù)源,應(yīng)病歷質(zhì)控標(biāo)準(zhǔn)以滿足分析要求。來源于門診的疾病描述、診斷及其用藥信息需要有相關(guān)證據(jù)鏈佐證。

2. 在數(shù)據(jù)提取時充分考慮數(shù)據(jù)完整性問題

評估和確立提取字段,制定相應(yīng)的核查規(guī)則和數(shù)據(jù)庫架構(gòu)。

3. 建立數(shù)據(jù)錄入和結(jié)構(gòu)化的標(biāo)準(zhǔn)指南,確保錄入數(shù)據(jù)與源數(shù)據(jù)的一致性。

對于錄入過程中的任何修改,需要有負(fù)責(zé)人的確認(rèn)和簽名,并提供修改原因,確保留下完整的稽查軌跡。

4. 制定完善的數(shù)據(jù)質(zhì)量管理計劃

制定系統(tǒng)質(zhì)控和人工質(zhì)控計劃,確保數(shù)據(jù)的準(zhǔn)確性和完整性。對于關(guān)鍵變量,應(yīng)進(jìn)行100%核查和源文件調(diào)閱;其它變量可根據(jù)實際情況抽樣核查,例如,對于人口學(xué)信息、數(shù)值型變量閾值、編碼映射關(guān)系等,可按一定比例抽樣,核查其準(zhǔn)確性與合理性。

通用數(shù)據(jù)模型(Common Data Model,CDM是多學(xué)科合作模式下對多源異構(gòu)數(shù)據(jù)進(jìn)行快速集中和標(biāo)準(zhǔn)化處理的數(shù)據(jù)系統(tǒng),其主要功能是將不同標(biāo)準(zhǔn)的源數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的結(jié)構(gòu)、格式和術(shù)語,以便跨數(shù)據(jù)庫/數(shù)據(jù)集進(jìn)行數(shù)據(jù)整合。

由于多源數(shù)據(jù)的結(jié)構(gòu)和類型的復(fù)雜性、樣本規(guī)模和標(biāo)準(zhǔn)的差異性,在將源數(shù)據(jù)轉(zhuǎn)換為CDM的整體過程中,需要對源數(shù)據(jù)進(jìn)行提取、轉(zhuǎn)換、加載(Extract-Transform-Load,ETL),應(yīng)確保源數(shù)據(jù)在語法和語義上與目標(biāo)分析數(shù)據(jù)庫的結(jié)構(gòu)和術(shù)語一致。

2 異源數(shù)據(jù)模型向通用數(shù)據(jù)模型轉(zhuǎn)化的示意圖

理想的通用數(shù)據(jù)模型應(yīng)遵循以下原則:

  1. CDM可以定義為一種數(shù)據(jù)治理機(jī)制,通過該機(jī)制可以將源數(shù)據(jù)標(biāo)準(zhǔn)化為通用結(jié)構(gòu)、格式和術(shù)語,從而允許跨多個數(shù)據(jù)庫/數(shù)據(jù)集進(jìn)行數(shù)據(jù)整合。CDM應(yīng)具有訪問源數(shù)據(jù)的能力,是可動態(tài)擴(kuò)展和持續(xù)改進(jìn)的數(shù)據(jù)模型,并有版本控制;
  2. CDM變量的定義、測量、合并、記錄及其相應(yīng)的驗證應(yīng)保持透明,多個數(shù)據(jù)庫的數(shù)據(jù)轉(zhuǎn)換應(yīng)有清晰一致的規(guī)則;
  3. CDM應(yīng)有基線概念,安全性和有效性相關(guān)的常用變量或概念都應(yīng)映射到CDM,以適用于不同臨床研究問題,并可通過公認(rèn)或已知的研究結(jié)果進(jìn)行比對。

RWD治理計劃書應(yīng)事先制定,與整個項目研究計劃同步。如果治理計劃書在研究進(jìn)行過程中需要修訂,應(yīng)與審評機(jī)構(gòu)溝通并備案。計劃書中應(yīng)說明使用RWD用于監(jiān)管決策的目的使用RWD研究設(shè)計,還應(yīng)RWD源數(shù)據(jù)進(jìn)行說明,包括但不限于:RWD源數(shù)據(jù)/源文件的類型,例如衛(wèi)生信息系統(tǒng)數(shù)據(jù)、疾病登記數(shù)據(jù)、醫(yī)保數(shù)據(jù)等;RWD的源數(shù)據(jù)/源文件,適當(dāng)評價其既往應(yīng)用情況,說明采用的理由;RWD的治理,即由RWD數(shù)據(jù)來源到分析數(shù)據(jù)庫的治理過程,包括數(shù)據(jù)提取、數(shù)據(jù)安全性處理、數(shù)據(jù)清洗(邏輯核查及異常數(shù)據(jù)處理、數(shù)據(jù)完整性處理)、數(shù)據(jù)導(dǎo)入和結(jié)構(gòu)化(通用數(shù)據(jù)模型、歸一化、自然語言處理、醫(yī)學(xué)編碼、衍生變量)、數(shù)據(jù)傳輸?shù)龋徊捎玫臄?shù)據(jù)模型和數(shù)據(jù)標(biāo)準(zhǔn);缺失數(shù)據(jù)的處理方法;減少或控制使用RWD帶來的潛在偏倚所采取的措施;質(zhì)量控制和質(zhì)量保證;RWD的適用性評估,即申報項目對RWD的適用性評估準(zhǔn)則。

RWD 來源于患者個人診療等多種途徑的數(shù)據(jù),數(shù)據(jù)的收集、處理與使用等會涉及倫理及患者隱私問題。為充分保護(hù)患者的安全和權(quán)益,獲取和使用RWD以開展真實世界研究,須通過倫理委員會的審核批準(zhǔn)。參與RWD治理的相關(guān)人員需嚴(yán)格遵守相關(guān)法律、法規(guī)的要求,申辦者應(yīng)嚴(yán)格執(zhí)行,盡保護(hù)和管理義務(wù)。

應(yīng)依照國家法律法規(guī)、行業(yè)監(jiān)管要求等做好數(shù)據(jù)安全管理工作,對承載健康醫(yī)療數(shù)據(jù)的信息系統(tǒng)和網(wǎng)絡(luò)設(shè)施以及云平臺等進(jìn)行必要的安全保護(hù)。數(shù)據(jù)安全保護(hù)范圍應(yīng)涵蓋包括數(shù)據(jù)收集、數(shù)據(jù)提取、數(shù)據(jù)傳輸、數(shù)據(jù)存儲、數(shù)據(jù)交換、數(shù)據(jù)銷毀等在內(nèi)的各個生命周期。采用加密技術(shù)保證數(shù)據(jù)在收集、提取、傳輸和存儲過程中的完整性、保密性、可追溯性,使用介質(zhì)傳輸?shù)模瑧?yīng)對介質(zhì)實施管控。對不同介質(zhì)的數(shù)據(jù)形式采用不同的保護(hù)措施,并建立相對應(yīng)的訪問控制機(jī)制,對訪問記錄進(jìn)行審核、登記、歸檔和審計。

數(shù)據(jù)審計及相關(guān)操作規(guī)程為數(shù)據(jù)的收集、提取、傳輸、維護(hù)、存儲、共享、使用等提供記錄和依據(jù),應(yīng)包括人員審計、管理審計、技術(shù)審計,應(yīng)制定和部署醫(yī)療信息系統(tǒng)活動審計政策和適當(dāng)?shù)臉?biāo)準(zhǔn)操作流程。審計的內(nèi)容應(yīng)包括數(shù)據(jù)的任何狀態(tài)的任何操作,包括登錄、創(chuàng)建、修改和刪除記錄的行為,都應(yīng)自動生成帶有時間標(biāo)記的審計記錄,包括但不限于授權(quán)信息、操作時間、操作原因、操作內(nèi)容、操作人及簽名等信息,并可供審計。審計記錄應(yīng)被安全存儲并建立訪問控制策略。

應(yīng)建立完整的質(zhì)量管理體系,規(guī)范RWD的處理流程,并在實際工作中持續(xù)優(yōu)化、完善?;举|(zhì)量要素應(yīng)覆蓋:確保RWD的質(zhì)量,應(yīng)建立覆蓋RWD全生命周期管理的操作流程;計算機(jī)化系統(tǒng)功能應(yīng)滿足RWD的管理需求,符合相關(guān)法規(guī)對計算機(jī)化系統(tǒng)的相關(guān)要求;建立完善的人員管理制度,數(shù)據(jù)收集、治理、分析人員應(yīng)獲得相應(yīng)的培訓(xùn),符合職責(zé)能力要求,并對人員的權(quán)限進(jìn)行標(biāo)準(zhǔn)化管理;建立從數(shù)據(jù)收集至數(shù)據(jù)遞交各環(huán)節(jié)的風(fēng)險管理流程;制定標(biāo)準(zhǔn)的信息與文檔管理規(guī)范(紙質(zhì)、電子介質(zhì)),確保RWD處理流程記錄完整、準(zhǔn)確、透明,保護(hù)數(shù)據(jù)的安全性與合規(guī)性。

  • 監(jiān)管機(jī)構(gòu)的溝通

為保證RWD的質(zhì)量符合監(jiān)管要求,鼓勵申請人與監(jiān)管機(jī)構(gòu)及時溝通交流。在真實世界研究正式開始前,基于整體研發(fā)策略具體研究方案等,就RWD是否支持產(chǎn)生RWE進(jìn)行交流,包括RWD的可及性、樣本量是否足夠大、數(shù)據(jù)治理計劃是否合理可行、數(shù)據(jù)質(zhì)量可否得到保障等。在研究進(jìn)行中,如果根據(jù)研究實施中的變化情況對數(shù)據(jù)治理計劃進(jìn)行調(diào)整,申辦者需衡量數(shù)據(jù)治理計劃調(diào)整對試驗?zāi)繕?biāo)的潛在影響,向監(jiān)管機(jī)構(gòu)說明調(diào)整的充分理由,并征得其同意,還應(yīng)將更新的研究方案和數(shù)據(jù)治理計劃書備案。在研究完成后和遞交資料前,申辦者可與監(jiān)管機(jī)構(gòu)咨詢遞交資料和數(shù)據(jù)庫進(jìn)行溝通。

名詞解釋

電子病歷(Electronic Medical RecordEMR)由醫(yī)療機(jī)構(gòu)中授權(quán)的臨床專業(yè)人員創(chuàng)建、收集、管理和訪問的個體患者的健康相關(guān)信息電子記錄。

電子健康檔案(Electronic Health Record,EHR):符合國家認(rèn)可的使用的互操作性標(biāo)準(zhǔn),并能夠由多個醫(yī)療機(jī)構(gòu)中授權(quán)的臨床專業(yè)人員創(chuàng)建、管理和咨詢的針對個體患者的健康相關(guān)信息電子記錄。

分析數(shù)據(jù)庫(Analysis Dataset):根據(jù)特定研究的具體要求,對原始數(shù)據(jù)庫做該研究特有的定制化處理后形成的數(shù)據(jù)庫,包括從研究中心提取原始數(shù)據(jù)補足缺失項、完成隨訪、通過患者ID進(jìn)行數(shù)據(jù)關(guān)聯(lián)、衍生指標(biāo)計算、數(shù)據(jù)標(biāo)準(zhǔn)化、醫(yī)學(xué)編碼等。

觀察性研究(Observational Study):根據(jù)特定研究問題,不施加主動干預(yù)的、以自然人群或臨床人群為對象的、探索暴露/治療與結(jié)局因果關(guān)系的研究。

患者報告結(jié)局(Patient-Reported Outcome,PRO):是一種來自患者自身測量與評價疾病結(jié)局的指標(biāo),包括癥狀、生理、心理、醫(yī)療服務(wù)滿意度等。其記錄有紙質(zhì)和電子兩種方式,后者稱為電子患者報告結(jié)局(ePRO)。

邏輯核查(Edit Check):對輸入計算機(jī)系統(tǒng)的臨床研究數(shù)據(jù)的有效性的檢查,主要評價輸入數(shù)據(jù)與其預(yù)期的數(shù)值邏輯、數(shù)值范圍或數(shù)值屬性等方面是否存在邏輯性錯誤。

數(shù)據(jù)標(biāo)準(zhǔn)Data Standard):是關(guān)于如何在計算機(jī)系統(tǒng)之間構(gòu)建、定義、格式化或交換特定類型數(shù)據(jù)的一系列規(guī)則。數(shù)據(jù)標(biāo)準(zhǔn)可使遞交的資料具有可預(yù)測性和一致性,且具有信息技術(shù)系統(tǒng)或科學(xué)工具可以使用的形式。

數(shù)據(jù)清洗Data Cleaning):數(shù)據(jù)清洗旨在識別和糾正數(shù)據(jù)中的噪聲,將噪聲對數(shù)據(jù)分析結(jié)果的影響降至最低。數(shù)據(jù)中的噪聲主要包括不完整的數(shù)據(jù)、冗余的數(shù)據(jù)、沖突的數(shù)據(jù)和錯誤的數(shù)據(jù)等。

數(shù)據(jù)融合(Data Linkage: 將多來源的數(shù)據(jù)和信息加以合并、關(guān)聯(lián)及組合,形成統(tǒng)一的數(shù)據(jù)集。

數(shù)據(jù)元素(Data Element):臨床研究中記錄的受試者的單一觀察值,例如,出生日期,白細(xì)胞計數(shù),疼痛嚴(yán)重程度,以及其它臨床觀察值。

數(shù)據(jù)治理(Data Curation:針對特定臨床研究問題,為達(dá)到適用于統(tǒng)計分析而對原始數(shù)據(jù)所進(jìn)行的治理,其內(nèi)容至少包括數(shù)據(jù)提?。ê鄠€數(shù)據(jù)源)、數(shù)據(jù)安全性處理、數(shù)據(jù)清洗(邏輯核查及異常數(shù)據(jù)處理、數(shù)據(jù)完整性處理)、數(shù)據(jù)轉(zhuǎn)化(通用數(shù)據(jù)模型、歸一化、自然語言處理、醫(yī)學(xué)編碼、衍生變量計算)、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)傳輸和存儲等若干環(huán)節(jié)。

通用數(shù)據(jù)模型(Common Data Model,CDM):是多學(xué)科合作模式下對多源異構(gòu)數(shù)據(jù)進(jìn)行快速集中和標(biāo)準(zhǔn)化處理的數(shù)據(jù)系統(tǒng),其主要功能是將不同數(shù)據(jù)標(biāo)準(zhǔn)的源數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的結(jié)構(gòu)、格式和術(shù)語,以便跨數(shù)據(jù)庫/數(shù)據(jù)集進(jìn)行數(shù)據(jù)整合。

協(xié)變量(Covariate):研究者預(yù)計的或通過探索性分析確定的會對主要結(jié)局變量產(chǎn)生重要影響的變量,它可以分為基線協(xié)變量和非基線協(xié)變量兩類。

源數(shù)據(jù)(Source Data):臨床研究中記錄的臨床癥狀、觀測值和用于重建和評估該研究的其他活動的原始記錄和核證副本上的所有信息。源數(shù)據(jù)包含在源文件中(包括原始記錄或其有效副本)。

真實世界數(shù)據(jù)(Real-World Data,RWD):來源于日常所收集的各種與患者健康狀況和/或診療及保健有關(guān)的數(shù)據(jù)。并非所有的真實世界數(shù)據(jù)經(jīng)分析后就能成為真實世界證據(jù),只有滿足適用性的真實世界數(shù)據(jù)才有可能產(chǎn)生真實世界證據(jù)。

真實世界研究(Real-World Research/StudyRWR/RWS):針對臨床研究問題,在真實世界環(huán)境下收集與研究對象健康狀況和/或診療及保健有關(guān)的數(shù)據(jù)(真實世界數(shù)據(jù))或基于這些數(shù)據(jù)衍生的匯總數(shù)據(jù),通過分析,獲得藥物的使用價值及潛在獲益-風(fēng)險的臨床證據(jù)(真實世界證據(jù))的研究過程。

真實世界證據(jù)(Real-World Evidence,RWE):通過對適用的真實世界數(shù)據(jù)進(jìn)行恰當(dāng)和充分的分析所獲得的關(guān)于藥物的使用情況和潛在獲益-風(fēng)險的臨床證據(jù)。

參考文獻(xiàn)

[1] 蔡婷, 詹思延. 加快我國疫苗安全主動監(jiān)測系統(tǒng)建設(shè)的思考[J]. 中華預(yù)防醫(yī)學(xué)雜志. 2019,53(7): 664-667.

[2] 國家衛(wèi)生健康委, 國家藥品監(jiān)督管理局. 藥物臨床試驗質(zhì)量管理規(guī)范. 2020.07.01.

[3] 國家藥品監(jiān)督管理局藥品審評中心. 臨床試驗數(shù)據(jù)管理工作技術(shù)指南. 2016.07.27.

[4] 國家藥品監(jiān)督管理局. 真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行). 2020.01.07.

[5] 侯永芳, 宋海波, 劉紅亮, . 基于中國醫(yī)院藥物警戒系統(tǒng)開展主動監(jiān)測的實踐與探討[J]. 中國藥物警戒. 2019,16(4): 212-214.

[6] 周莉, 歐陽文偉, 李庚, . 中國登記研究的現(xiàn)狀分析[J] 中國循證醫(yī)學(xué)雜志. 2019,19(6): 702-707.

[7] Berger M, Daniel G, Frank K, et al. A framework for regulatory use of real world evidence. https://healthpolicy.duke. edu/sites/default/files/atoms/files/rwe_white_paper_2017.09.06.pdf.

[8] Booth CM, Karim S, Mackillop WJ. Real-world data: towards achieving the achievable in cancer care[J]. Nat Rev Clin Oncol. 2019,16(5): 312-325.

[9] Duke-Margolis Center for Health Policy. Characterizing RWD Quality and Relevancy for Regulatory Purposes. https://healthpolicy.duke.edu/publications.

[10] Duke-Margolis Center for Health Policy. Determining Real-World Data’s Fitness for Use and the Role of Reliability. https://healthpolicy.duke.edu/publications.

[11] EMA. Reflection paper on expectations for electronic source data and data transcribed to electronic data collection tools in clinical trials. https://www.ema.europa.eu/en/documents/regulatory-   procedural-guideline/reflection-paper-expectations-electronic-source-data-data-transcribed-electronic-data-collection_en.pdf.

[12] EMA. A Common Data Model for Europe – Why? Which? How? https://www.ema. europa.eu/en/documents/report/common-data-model-europe-why-which-how-workshop-report_en.pdf.

[13] Khozin S, Abernethy AP, Nussbaum NC, et al. Characteristics of real-world metastatic non-small cell lung cancer patients treated with nivolumab and pembrolizumab during the year following approval [J]. Oncologist. 2018, 23: 328–336.

[14] OHDSI – Observational Health Data Sciences and Informatics, https://www. ohdsi.org.

[15] Ong TC, Kahn MG, Kwan BM, et al. Dynamic ETL: a hybrid approach for health data extraction transformation and loading J.BMC Medical Informatics and Decision Making 2017, 17(1) : 134.

附錄1 中英文對照表

中英文詞匯對照

中文

英文

標(biāo)準(zhǔn)操作規(guī)程

Standard Operation Procedure, SOP

病例報告表

Case Report Form, CRF

病例登記

Patient Registry

電子病歷

Electronic Medical Record, EMR

電子健康檔案

Electronic Health Record, EHR

分析數(shù)據(jù)庫

Analysis Dataset

觀察性研究

Observational Study

患者報告結(jié)局

Patient Reported Outcome, PRO

結(jié)局變量

Outcome Variable

可追溯性

Traceability

臨床數(shù)據(jù)中心

Clinical Data Repository

邏輯核查

Edit Check

免疫接種不良事件

Adverse Events Following Mmunization, AEFI

數(shù)據(jù)標(biāo)準(zhǔn)

Data Standard

數(shù)據(jù)清洗

Data Cleaning

數(shù)據(jù)元素

Data Element

數(shù)據(jù)治理

Data Curation

通用數(shù)據(jù)模型

Common Data Model, CDM

衛(wèi)生信息系統(tǒng)

Hospital Information System, HIS

適用真實世界數(shù)據(jù)

Research-ready RWD

衍生變量

Derived Variable

醫(yī)保支付數(shù)據(jù)

Medical Claims Data

源數(shù)據(jù)

Source Data

真實世界數(shù)據(jù)

Real World Data, RWD

真實世界研究

Real World Research/Study,

RWR/RWS

真實世界證據(jù)

Real World Evidence,RWE