DeepScience:学术趋势预测与分析

导言

在此Github仓库中,我们选择COVID-19深度学习领域来预测科学的发展趋势。
我们使用AceMap中的论文和字段信息,值得注意的是,我们还收集了来自整个学术界的论文,包括19个学科(数学、历史、心理学、经济学、社会学、艺术、地理学、商业、物理学、政治学、哲学、生物学、计算机科学、材料科学、环境科学、医学、化学、工程和地质学)和292个子领域(子学科)。

为了预测学术趋势,我们构建了一个基于论文引文的领域图。具体来说,我们抓取的论文都有领域标签。每篇论文可能属于几个领域。我们使用引用关系来链接这些字段。例如,论文P1属于领域F1和F2,论文P2属于领域F2和F3,同样,P1引用P2。然后,我们添加边(F1,F2),(F1,F3),(F2,F2)和(F2,F3),每个边的权重是领域中引用的总数。节点的id可以在Acemap上找到,例如业务的id是2024422753,然后,您可以通过访问https://www.acemap.info/field/2024422753来查看该领域。

统计数据

我们产生的动态字段图逐日从2020年1月1日到2021年3月31日(456天)COVID-19。深度学习的时间范围是2017年10月1日至2021年3月31日。最后,构造了动态领域图,并将其称为COVID-19(深度学习)学术图。
您可以从Google Drive下载这两个数据集。

COVID-19 Deep Learning
Fields 18,369 40,930
Relations 198,137 669,426
Relations (weight > 1) 54,106 186,255

 

分析简介

Motif趋势

两个领域的跨主题模式在上升,深度学习的交叉话题数量远远大于COVID-19。在疫情后期,交叉趋势放缓并达到趋同。从2018年底到2019年,深度学习领域出现了爆炸性增长。虽然近几月深度学习论文发表速度有所放缓,但与COVID-19相比,仍有很大的发展前景。

网络特征

我们还计算了场图的几个网络特征。更多细节可以在我们的论文中找到。

热门话题

我们使用GCN-GANEvolveGCN预测未来交叉学科的发展趋势。

 

在COVID-19方面,我们发现:

  • 计算机辅助医疗深化内科诊断改革
  • 外科手术更注重风险评估
  • 在线医疗诊断进一步确保了用户隐私
  • 内分泌手术的交叉点继续增加
  • 医疗废物管理将更多地考虑环境保护
  • 机器学习辅助的疫情人口学分析

传递熵

传递熵是一种非参数统计量,用于测量两个随机过程之间的定向(时间不对称)信息传递量。我们使用转移熵从PageRank的角度挖掘不同领域之间的潜在影响。更多细节可以在我们的论文中找到。

 

如果您使用此存储库,请引用。

 

 

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注