高级搜索

基于卷积神经网络的肿瘤影像诊断文献计量研究

刘灵涛, 刘玉文, 黄锦泉, 张楚, 陈兴智

刘灵涛, 刘玉文, 黄锦泉, 张楚, 陈兴智. 基于卷积神经网络的肿瘤影像诊断文献计量研究[J]. 肿瘤防治研究, 2023, 50(5): 512-517. DOI: 10.3971/j.issn.1000-8578.2023.22.1123
引用本文: 刘灵涛, 刘玉文, 黄锦泉, 张楚, 陈兴智. 基于卷积神经网络的肿瘤影像诊断文献计量研究[J]. 肿瘤防治研究, 2023, 50(5): 512-517. DOI: 10.3971/j.issn.1000-8578.2023.22.1123
LIU Lingtao, LIU Yuwen, HUANG Jinquan, ZHANG Chu, CHEN Xingzhi. A Bibliometric Study of Oncology Imaging Diagnosis Based on Convolutional Neural Networks[J]. Cancer Research on Prevention and Treatment, 2023, 50(5): 512-517. DOI: 10.3971/j.issn.1000-8578.2023.22.1123
Citation: LIU Lingtao, LIU Yuwen, HUANG Jinquan, ZHANG Chu, CHEN Xingzhi. A Bibliometric Study of Oncology Imaging Diagnosis Based on Convolutional Neural Networks[J]. Cancer Research on Prevention and Treatment, 2023, 50(5): 512-517. DOI: 10.3971/j.issn.1000-8578.2023.22.1123

基于卷积神经网络的肿瘤影像诊断文献计量研究

基金项目: 

安徽高校人文社会科学研究项目 SK2021ZD0066

蚌埠医学院研究生科研创新计划项目 Byycx22048

详细信息
    作者简介:

    刘灵涛(1999-),男,硕士在读,主要从事医学信息学的研究,ORCID: 0009-0006-7855-2077

    通信作者:

    陈兴智(1970-),男,硕士,教授,主要从事医学信息学和高等医学教育的研究,E-mail: chen007835@163.com,ORCID: 0000-0003-3703-5306

  • 中图分类号: R730.44;G353.1

A Bibliometric Study of Oncology Imaging Diagnosis Based on Convolutional Neural Networks

Funding: 

Humanity and Social Science Research Project of Anhui Educational Committee SK2021ZD0066

Postgraduate Science Research Innovation Program of Bengbu Medical College Byycx22048

More Information
  • 摘要:
    目的 

    通过分析十年来国内外发表的关于卷积神经网络的肿瘤影像诊断领域的文献特征,了解该领域的研究热点及发展趋势。

    方法 

    以SCI-E数据库为数据源,检索2012年—2022年十年间发表的有关卷积神经网络的肿瘤影像诊断领域的文献,利用CiteSpace软件分析文献的国家、机构、期刊、作者共被引和关键词的分布特征。

    结果 

    最终共有1088篇文献纳入研究;文献主要来自中国、美国和印度等国家;中山大学发文39篇,是发文量最多的研究机构;Radiology Nuclear Medicine Medical Imaging是发文量最多的期刊;共得到25个高频关键词和15个突发性关键词;形成了image segmentation、lung nodule等12个作者共被引聚类和automatic segmentation、breast cancer等11个关键词聚类。

    结论 

    当前卷积神经网络的肿瘤影像诊断的研究主要集中在肿瘤分割、肺结节识别、乳腺癌的辅助诊断以及其他高频肿瘤的研究。

     

    Abstract:
    Objective 

    To understand the research hotspots and research trends about convolutional neural networks in the field of oncology imaging diagnosis by analyzing the characteristics of published literature at home and abroad over the past decade.

    Methods 

    The SCI-E database was used as the data source to retrieve literature about convolutional neural networks in the field of oncology imaging diagnosis published from 2012 to 2022. The distribution characteristics of countries, institutions, journals, co-cited authors, and keywords of the studies were analyzed by CiteSpace software.

    Results 

    A total of 1088 papers were eventually included, and they were mostly from China, the United States, and India. A total of 39 papers were published by Sun Yat-sen University, the research institution with the highest number of publications. Radiology Nuclear Medicine Medical Imaging was the journal with the highest number of publications. A total of 25 high-frequency keywords and 15 burst keywords were obtained. The formation of 12 author co-citation clusters such as image segmentation and lung nodule, as well as 11 keyword clusters such as automatic segmentation and breast cancer, was observed.

    Conclusion 

    Current research on convolutional neural networks for oncology imaging diagnosis focuses on oncology segmentation, lung-nodule recognition, assisted diagnosis of breast cancer, and other high-frequency oncology.

     

  • 近年来,肿瘤的发病率和死亡率呈明显的上升趋势。据全球癌症统计数据显示,2020年全球有近1 930万新发癌症病例以及近1 000万例癌症死亡[1],癌症已经成为危害人类生命健康的重要疾病。随着医疗大数据时代的到来,使用深度学习的方法处理和分析影像数据已成为重要的研究趋势。特别是卷积神经网络算法可以帮助临床医生自动识别医学影像中的感兴趣区域。卷积神经网络属于深度学习模型,其架构专为图像分析而设计,卷积神经网络由多个构建块组成,包括卷积层、池化层和全连接层,通过反向传播算法自动地学习空间层次结构的特征[2]。被广泛应用于肿瘤的预测、诊断和解剖结构识别等研究[3]

    文献计量学是指通过运用数学和统计学的方法对知识载体进行定量分析的跨学科研究[4]。在肿瘤影像领域的应用主要集中于肺癌[5]、乳腺癌[6]、食管癌[7]等方面的可视化分析,而这些文献计量学研究只进行了某一类肿瘤的研究热点分析,所以无法把握肿瘤影像领域的研究趋势和热点。目前尚未发现关于卷积神经网络在肿瘤影像诊断中应用的有关文献计量分析,因此本研究基于SCI-E数据库,运用文献计量学的方法全面评估十年来该领域的研究现状和发展趋势,以助于研究人员掌握其发展脉络和研究热点。

    文献来源于Web of Science Core Collection(WOSCC)的Science Citation Index Expanded(SCI-E)数据库,该数据库是国际公认的反映科学研究水准的数据库。纳入标准:文献类型为“Article”和“Review”,使用卷积神经网络对肿瘤进行检测、诊断和分割的研究,研究对象为人类,语言为English。排除标准:研究内容与卷积神经网络和肿瘤不相关或仅部分涉及,使用其他语言发表。

    采用主题词检索。第一个检索式#1=(tumor*) OR(cancer*)OR(carcino*)OR (onco*);第二个检索式#2=(convolutional neural network) OR(CNN);第三个检索式#3=(medica* imag*) OR(CT)OR(MRI)OR(PET)OR(X-ray);第四个检索式#4=#1 AND #2 AND #3,表示检索到文献为同时满足前三个检索结果。检索时间范围:2012年1月1日——2022年4月30日。将检索到的文献由研究人员逐一阅读标题和摘要,根据纳入及排除标准进行筛选。

    将检索结果另存为带有完整记录和引用参考文献的纯文本文件。利用CiteSpace软件(5.8.R3)对相关文献进行可视化分析[8]。CiteSpace软件分析并制作纳入文献第一作者所在国家和机构、共被引作者、关键词以及突发性关键词的知识图谱。对意义相同而描述不一致的关键词进行标准化处理,例如将“convolutional neural network”合并为“CNN”。国家、机构和期刊用于研究文献的分布特征;作者共被引、关键词聚类以及突发性关键词用于分析当前的研究热点和发展趋势。时间跨度从2012年1月——2022年4月,时间切片为1年。阈值设置为Top N=50。可视化网络的剪裁方法设置为默认。CiteSpace以模块值(Q值)和平均轮廓值(S值)两个指标评价聚类结果。当Q > 3时代表划分的聚类有显著的差异性,当S > 5时表明聚类结果具有信服性[9]

    共检索到相关文献1 317篇,根据纳排标准,共纳入文献1 088篇,包括1021篇原创文献和67篇综述文献。从2012年至2022年公开发表的文献按时间顺序分布,从2017年开始该领域公开发表的文献呈现较快增长,并在2021年取得最多的发文量为362篇。虽然检索从2012年开始,但是第一篇相关文献出现在2013年,见图 1

    图  1  发文量随年度变化图
    Figure  1  Change in annual number of published papers

    通过对发文国家进行可视化分析,得到发文国家共现网络图,图中不同的节点代表不同的元素,如第一作者发文的国家或机构,节点的大小反映了出版物的数量和频率,圆圈或连线的颜色对应不同的年份,节点之间连线的粗细代表协作、共现等关系的强弱。本图中清楚地显示出不同国家在卷积神经网络在肿瘤影像诊断领域的研究成果及影响力。文献出版数量前五的国家或地区是:中国425篇(39%)、美国299篇(27.5%)、印度70篇(6.4%)、韩国55篇(5.2%)和德国52篇(4.7%)。在可视化视图中,共有网络节点数64个和连接线87条,虽然有大量国家参与卷积神经网络在肿瘤影像诊断应用领域的研究,但仍以中、美等国为主,中美两国发文量占据发文总量的50%以上,见图 2

    图  2  发文国家共现网络分析图
    Figure  2  Co-occurrence network analysis of countries

    可视化分析显示相关的研究成果主要集中在中山大学39篇、上海交通大学29篇、中国科学院29篇、复旦大学21篇、哈佛大学医学院20篇。发文机构共现网络图共有网络节点数257个和连接数496条,见图 3

    图  3  发文机构共现网络分析图
    Figure  3  Co-occurrence network analysis of institutions

    本研究对通过WOS数据库自带的文献统计工具进行期刊发文量统计。发文量前十名的期刊见图 4,发文量最多的期刊是Radiology Nuclear Medicine Medical Imaging(218篇),占总发文量的20%,远超排名第二的Engineering Biomedical(106篇)。

    图  4  期刊发文量排名统计
    Figure  4  Ranking of journal publications

    通过对作者共被引进行可视化分析,梳理研究学者重点关注的领域。作者共被引聚类结果模块值Q为0.68,轮廓值为0.86,共有节点数409个,连接线1 111条。通过对作者共被引聚类获得#0 image segmentation(2017-2022)、#1 visceral fat area(2015-2017)、#2 pulmonary nodule classification(2015-2022)、#3 lung nodule(2015-2022)、#4 radiomics(2015-2022)、#5 particle swarm optimization(2016-2019)、#6 breast cancer(2017-2022)、#8 magnetic resonance imaging(2015-2022)、#9 adenocarcinoma of lung(2016-2022)、# 10cone-beam computed tomography(2018-2022)、#11 image processing(2017-2022)和#12 pulmonary nodule detection(2018-2022)12个聚类,括号内代表的是聚类的起止年份,见图 5

    图  5  作者共被引时间线图可视化
    Figure  5  Time plot of author co-citation

    CiteSpace软件提供了关键词的共现功能,从1 088篇文献中提取出423个关键词,对词频排名统计,同时计算每个关键词的中心度,其数值越大代表该关键词的重要性越大。本研究将频次40次以上的关键词作为高频词,共计得到25个高频关键词,高频关键词词频及中心性统计见表 1。在频率方面,“CNN”一词排名第一(473次),其次是“deep learning”,“CT”,“computer aided diagnosis”等,而中心性最大的是“lung nodule”,词频为136次。

    表  1  高频关键词词频分析统计
    Table  1  Analysis of high-frequency keyword
    下载: 导出CSV 
    | 显示表格

    通过对关键词聚类获得#0 pulmonary nodule detection、#1 automatic segmentation、#2 tandem and ovoids、#3 breast cancer、#4 machine learning、#5 nasopharyngeal carcinoma、#6 cancer、#7 lung cancer、#8 dce-mri、#9 lung abnormality和#10 weighted mri 11个聚类,见图 6。关键词的聚类结果模块值Q为0.56,轮廓值为0.85。聚类图节点数共有237个,连接线1 204条。

    图  6  关键词聚类分布可视化图
    Figure  6  Visualization of keyword clustering distribution

    本研究通过使用CiteSpace软件对关键词进行突发性检测,以了解该领域的研究重点及未来的发展趋势。结果显示了突发性最强的前20个关键词,以及出现的时间段。绿线表示2013年至2022年的时间段,而每个突发性关键词的时间段由红线绘制,见图 7

    图  7  突发性关键词(前20名)
    Figure  7  Top 20 burst keywords (Top 20)

    本研究通过对十年来已经发表的文献进行了可视化分析,发现在2012年—2022年间卷积神经网络在肿瘤影像诊断应用领域的相关文献数量几乎呈指数级增长。在2021年达到高峰,数量为362篇,而后截至2022年4月发文量为133篇,预计未来一段时间增长的趋势将进一步保持,这表明越来越多的研究人员关注该领域。中国在该领域贡献了最多的文献量,5个主要研究机构贡献者中有4个是中国的医学研究机构,说明过去十年间中国在开展卷积神经网络的肿瘤影像诊断领域的研究工作中具有强大的核心竞争力。从期刊的分析来看,发文量排名前10的期刊,刊名中含有“计算机”、“医学影像”、“肿瘤”和“生物医学”等字样,说明该领域具有计算机科学、医学、工程学等多学科交叉的性质。

    根据高频关键词和作者共被引时间线图可以发现,国际上关于卷积神经网络在肿瘤自动分割领域的研究较多,学者Ronneberger在作者共被引用排名最高(343次),其设计了一种像素级别的生物医学图像分割模型,实现了对肿瘤组织的分割[10]并被其他学者逐渐应用到肝脏[11]、肺结节[12]、胸部器官[13]等图像分割研究领域。关键词“lung nodule”中心度最大为0.71,表明肺结节的识别在卷积神经网络的肿瘤影像诊断应用领域占据着非常重要的地位[14]

    从对关键词聚类图谱分析发现,通过卷积神经网络研究乳腺癌的诊断和检测也是热点之一[15]。同时在“cancer”这一聚类词下,有关鼻咽癌[16]、皮肤癌[17]、前列腺癌[18]等肿瘤的诊断或鉴别诊断也都是当前研究的热点。

    根据突发性关键词可视化分析可知,肿瘤影像诊断领域卷积神经网络的应用在不同阶段呈现出不同的研究侧重点。在2021年之前,lesion(2017—2018)、lung nodule classification(2017—2019)、brain oncology segmentation(2020—2020)等突发性关键词表明该领域的研究主要集中于疾病分类、肺结节筛查和肿瘤分割等方面。从2021年开始,deep(2021—2022)、medical image analysis(2021—2022)、image registration(2021—2022)等突发性关键词表明研究核心向医学影像深度分析、多模态影像融合等方向发展。

    通过对突发性关键词分析发现,“image registration”一词出现最晚,近年来研究学者更加关注多模态影像配准的方法学研究,传统的卷积神经网络模型的开发建立在一种模态影像的基础上,提供的信息往往有限,而利用MRI和PET、CT和PET、MRI和CT及MRI-T1和MRI-T2等多种方式实现多模态影像的融合[19],以提高模型识别的准确性。“medical image analysis”一词突发性最强,由于卷积神经网络模型存在过度拟合、可解释性和可重复性较差等局限性,所以通过将影像特征与基因组学特征相结合[20]、根据临床专家的先验知识指导模型结构和损失函数设计以及采用多中心机构的数据集训练验证模型[21]等方法,都是针对提高模型分析能力的优化和改进。所以提高卷积神经网络肿瘤影像模型的临床实用性和可解释性将是未来该领域研究的关键。

    本研究通过绘制卷积神经网络的肿瘤影像诊断领域的文献知识图谱,全方位梳理了该领域的研究热点和发展趋势。同时也存在一定局限性,由于检索到的文献数量众多,本研究只对排名靠前的国家、机构、期刊、作者共被引和关键词进行了深入分析,但无法逐一分析具体文献,充分挖掘文献细节之间的关联,并且在作者共被引分析中存在只分析了第一作者和无法精准区分同名不同人的问题。以这项研究的结果为基础,未来该领域的计量学研究可侧重于重要研究学者和研究方向之间的内在关系。

    Competing interests: The authors declare that they have no competing interests.
    利益冲突声明:
    所有作者均声明不存在利益冲突。
    作者贡献:
    刘灵涛:设计研究方案、实施研究、撰写文章
    刘玉文:指导分析数据
    黄锦泉:实施研究、数据检索
    张  楚:分析数据、解释数据
    陈兴智:指导研究方案及撰写文章
  • 图  1   发文量随年度变化图

    Figure  1   Change in annual number of published papers

    图  2   发文国家共现网络分析图

    Figure  2   Co-occurrence network analysis of countries

    图  3   发文机构共现网络分析图

    Figure  3   Co-occurrence network analysis of institutions

    图  4   期刊发文量排名统计

    Figure  4   Ranking of journal publications

    图  5   作者共被引时间线图可视化

    Figure  5   Time plot of author co-citation

    图  6   关键词聚类分布可视化图

    Figure  6   Visualization of keyword clustering distribution

    图  7   突发性关键词(前20名)

    Figure  7   Top 20 burst keywords (Top 20)

    表  1   高频关键词词频分析统计

    Table  1   Analysis of high-frequency keyword

    下载: 导出CSV
  • [1]

    Sung H, Ferlay J, Siegel RL, et al. Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries[J]. CA Cancer J Clin, 2021, 71(3): 209-249. doi: 10.3322/caac.21660

    [2]

    Yamashita R, Nishio M, Do RKG, et al. Convolutional neural networks: an overview and application in radiology[J]. Insights Imaging, 2018, 9(4): 611-629. doi: 10.1007/s13244-018-0639-9

    [3]

    Shen D, Wu G, Suk HI. Deep Learning in Medical Image Analysis[J]. Annu Rev Biomed Eng, 2017, 19(1): 221-248. doi: 10.1146/annurev-bioeng-071516-044442

    [4] 周子番, 邱均平, 魏开洋. 从文献计量学到"五计学": 计量学方法的演化与发展[J]. 情报杂志, 2021, 40(10): 171-178. https://www.cnki.com.cn/Article/CJFDTOTAL-QBZZ202110024.htm

    Zhou ZF, Qiu JP, Wei KY. From Bibliometrics to "Five-Metrics": TheEvolution and Development of Bibliometrics Methods[J]. Qing Bao Za Zhi, 2021, 40(10): 171-178. https://www.cnki.com.cn/Article/CJFDTOTAL-QBZZ202110024.htm

    [5]

    Liang H, Chen Z, Wei F, et al. Bibliometrics research on radiomics of lung cancer[J]. Transl Cancer Res, 2021, 10(8): 3757-3771. doi: 10.21037/tcr-21-1277

    [6]

    Zhang Y, Yu C, Zhao F, et al. Landscape of Artificial Intelligence in Breast Cancer (2000-2021): A Bibliometric Analysis[J]. FrontBiosci (Landmark Ed), 2022, 27(8): 224. doi: 10.31083/j.fbl2708224

    [7]

    Tu JX, Lin XT, Ye HQ, et al. Global research trends of artificial intelligence applied in esophageal carcinoma: A bibliometric analysis (2000-2022) via CiteSpace and VOSviewer[J]. Front Oncol, 2022, 12: 972357. doi: 10.3389/fonc.2022.972357

    [8] 孙秋月, 孙力超, 张稚淳, 等. 基于CiteSpace的肿瘤干细胞研究态势的文献计量学分析[J]. 肿瘤防治研究, 2021, 48(9): 839-845. doi: 10.3971/j.issn.1000-8578.2021.21.0416

    Sun QY, Sun LC, Zhang ZC, et al. Trends in Research of Cancer Stem Cells: A Bibliometric Analysis Based on CiteSpace[J]. Zhong Liu Fang Zhi Yan Jiu, 2021, 48(9): 839-845. doi: 10.3971/j.issn.1000-8578.2021.21.0416

    [9] 陈悦, 陈超美, 刘则渊, 等. CiteSpace知识图谱的方法论功能[J]. 科学学研究, 2015, 33(2): 242-253. https://www.cnki.com.cn/Article/CJFDTOTAL-KXYJ201502009.htm

    Chen Y, Chen CM, Liu ZY, et al. The methodology function of CiteSpace mapping knowledge domains[J]. Ke Xue Xue Yan Jiu, 2015, 33(2): 242-253. https://www.cnki.com.cn/Article/CJFDTOTAL-KXYJ201502009.htm

    [10]

    Ronneberger O, Fischer P, Brox T. U-Net: Convolutional Networks for Biomedical Image Segmentation[C]//Navab N, Hornegger J, Wells WM, et al. Medical Image Computing and Computer-Assisted Intervention-MICCAI 2015. Cham: Springer International Publishing, 2015: 234-241.

    [11]

    Li X, Chen H, Qi X, et al. H-DenseUNet: Hybrid Densely Connected UNet for Liver and Oncology Segmentation From CT Volumes[J]. IEEE Trans Med Imaging, 2018, 37(12): 2663-2674. doi: 10.1109/TMI.2018.2845918

    [12]

    Wang S, Zhou M, Liu Z, et al. Central focused convolutional neural networks: Developing a data-driven model for lung nodule segmentation[J]. Med Image Anal, 2017, 40: 172-183. doi: 10.1016/j.media.2017.06.014

    [13]

    Dong X, Lei Y, Wang T, et al. Automatic multiorgan segmentation in thorax CT images using U-net-GAN[J]. Med Phys, 2019, 46(5): 2157-2168. doi: 10.1002/mp.13458

    [14]

    Zhang G, Yang Z, Gong L, et al. Classification of benign and malignant lung nodules from CT images based on hybrid features[J]. Phys Med Biol, 2019, 64(12): 125011. doi: 10.1088/1361-6560/ab2544

    [15]

    Heenaye-Mamode Khan M, Boodoo-Jahangeer N, Dullull W, et al. Multi-class classification of breast cancer abnormalities using Deep Convolutional Neural Network (CNN)[J]. PLoS One, 2021, 16(8): e0256500. doi: 10.1371/journal.pone.0256500

    [16]

    Wong LM, King AD, Ai QYH, et al. Convolutional neural network for discriminating nasopharyngeal carcinoma and benign hyperplasia on MRI[J]. Euro Radiol, 2021, 31(6): 3856-3863. doi: 10.1007/s00330-020-07451-y

    [17]

    Esteva A, Kuprel B, Novoa RA, et al. Dermatologist-level classification of skin cancer with deep neural networks[J]. Nature, 2017, 542(7639): 115-118. doi: 10.1038/nature21056

    [18]

    Abdelmaksoud IR, Shalaby A, Mahmoud A, et al. Precise Identification of Prostate Cancer from DWI Using Transfer Learning[J]. Sensors (Basel), 2021, 21(11): 3664. doi: 10.3390/s21113664

    [19]

    Huang B, Yang F, Yin M, et al. A Review of Multimodal Medical Image Fusion Techniques[J]. Comput Math Methods Med, 2020, 2020: 8279342. http://www.researchgate.net/publication/348378199_A_Comprehensive_Review_of_Multimodal_Medical_Image_Fusion_Techniques

    [20]

    Kirby J, Prior F, Petrick N, et al. Introduction to special issue on datasets hosted in The Cancer Imaging Archive (TCIA)[J]. Med Phys, 2020, 47(12): 6026-6028. doi: 10.1002/mp.14595

    [21]

    Zwirner K, Hilke FJ, Demidov G, et al. Radiogenomics in head and neck cancer: correlation of radiomic heterogeneity and somatic mutations in TP53, FAT1 and KMT2D[J]. Strahlenther Onkol, 2019, 195(9): 771-779. http://pubmed.ncbi.nlm.nih.gov/31123786/

图(7)  /  表(1)
计量
  • 文章访问数:  2196
  • HTML全文浏览量:  555
  • PDF下载量:  751
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-09-26
  • 修回日期:  2022-11-15
  • 网络出版日期:  2024-01-12
  • 刊出日期:  2023-05-24

目录

/

返回文章
返回
x 关闭 永久关闭