近日,我院徐祥龍特聘青年研究員和澳大利亞莫納什大學Jason J. Ong, Lei Zhang, Christopher K. Fairley, Eric P.F. Chow等教授在Frontiers in Public Health期刊合作發表題為 “Determinants and prediction of Chlamydia trachomatis re-testing and re-infection within 1 year among heterosexuals with chlamydia attending a sexual health clinic” 的論文。該期刊主要聚焦于公共衛生領域的前沿研究。該期刊也是中國科協科學技術創新部發布的預防醫學與衛生學高質量科技外文期刊,JCR分區為Q1,收錄于SCI/SCIE中, 影響因子為6.461。
徐祥龍特聘青年研究員主要從事交叉學科研究,将流行病學、統計學、生物數學、人工智能、轉化研究等多個學科方法應用于重要公共衛生問題的研究中。通過構建機器學習預測模型,開發疾病輔助預防與健康管理的人工智能工具,以促進疾病預防與健康管理的智能化和信息化。
沙眼衣原體是全球最常見的性傳播疾病之一。近年我國生殖道沙眼衣原體感染報告發病率呈上升趨勢。沙眼衣原體也是澳大利亞發病率較高的性傳播疾病之一,且再次感染率較高。在澳大利亞,推薦沙眼衣原體患者在治療三個月後再次檢測沙眼衣原體,以确定是否再次感染,但複查率較低。
該研究使用澳大利亞墨爾本性診所常規收集的電子健康記錄數據來建立預測模型。為找到有效的提高沙眼衣原體複查率和控制再次感染的方法,該研究首先提出使用機器學習算法構建沙眼衣原體複查和再次感染的預測模型。該研究也對感染沙眼衣原體的異性戀人群在未來一年内複查和再次感染的影響因素進行了統計學分析。
該研究發現沙眼衣原體感染者在一年内複查率較低(僅三成多),且再次感染率較高(約有15%)。這提示需要進一步的措施來提高沙眼衣原體複查率和降低沙眼衣原體再感染率。該研究通過構建10個不同的機器學習預測模型(Logistic回歸、支持向量機、随機森林、XGBoost、樸素貝葉斯、K近鄰、神經網絡等)來預測感染沙眼衣原體的異性戀人群在未來一年内複查和再感染的情況。該研究發現相比傳統的Logistic回歸模型,XGBoost算法可以提高沙眼衣原體複查及再感染的預測能力。該研究提示需建立多種類别的機器學習算法以尋找最佳預測能力的算法。該研究也提示除了關注建模方法以外,未來機器學習研究也需要關注數據的收集。此外,機器學習研究中預測因子的全面性和準确性等對預測結果也非常重要。該研究由于使用的是診所常規搜集的電子健康記錄數據,因部分沙眼衣原體的影響因素不在診所常規搜集的電子健康記錄數據,故而無法納入該研究的模型中。
該研究對感染沙眼衣原體的異性戀人群在未來一年内複查的影響因素進行了統計學分析,發現年齡較大者(≥35歲)、女性、HIV攜帶者、性工作者、伴侶同時接受治療者、性伴數量多者複查率更高。該研究也對未來一年内再次感染的影響因素進行了統計學分析,發現年齡較小(18-24歲) 、男性和HIV攜帶者再次感染率更高。
徐祥龍特聘青年研究員為該論文的第一作者,我院是該論文的第一完成單位。
(流行病與衛生統計學教研室)