导言
在此Github仓库中,我们选择COVID-19和深度学习领域来预测科学的发展趋势。
我们使用AceMap中的论文和字段信息,值得注意的是,我们还收集了来自整个学术界的论文,包括19个学科(数学、历史、心理学、经济学、社会学、艺术、地理学、商业、物理学、政治学、哲学、生物学、计算机科学、材料科学、环境科学、医学、化学、工程和地质学)和292个子领域(子学科)。
为了预测学术趋势,我们构建了一个基于论文引文的领域图。具体来说,我们抓取的论文都有领域标签。每篇论文可能属于几个领域。我们使用引用关系来链接这些字段。例如,论文P1属于领域F1和F2,论文P2属于领域F2和F3,同样,P1引用P2。然后,我们添加边(F1,F2),(F1,F3),(F2,F2)和(F2,F3),每个边的权重是领域中引用的总数。节点的id可以在Acemap上找到,例如业务的id是2024422753,然后,您可以通过访问https://www.acemap.info/field/2024422753来查看该领域。
统计数据
我们产生的动态字段图逐日从2020年1月1日到2021年3月31日(456天)COVID-19。深度学习的时间范围是2017年10月1日至2021年3月31日。最后,构造了动态领域图,并将其称为COVID-19(深度学习)学术图。
您可以从Google Drive下载这两个数据集。
COVID-19 | Deep Learning | |
---|---|---|
Fields | 18,369 | 40,930 |
Relations | 198,137 | 669,426 |
Relations (weight > 1) | 54,106 | 186,255 |
分析简介
Motif趋势
两个领域的跨主题模式在上升,深度学习的交叉话题数量远远大于COVID-19。在疫情后期,交叉趋势放缓并达到趋同。从2018年底到2019年,深度学习领域出现了爆炸性增长。虽然近几月深度学习论文发表速度有所放缓,但与COVID-19相比,仍有很大的发展前景。
网络特征
我们还计算了场图的几个网络特征。更多细节可以在我们的论文中找到。
热门话题
我们使用GCN-GAN和EvolveGCN预测未来交叉学科的发展趋势。
在COVID-19方面,我们发现:
- 计算机辅助医疗深化内科诊断改革
- 外科手术更注重风险评估
- 在线医疗诊断进一步确保了用户隐私
- 内分泌手术的交叉点继续增加
- 医疗废物管理将更多地考虑环境保护
- 机器学习辅助的疫情人口学分析
传递熵
传递熵是一种非参数统计量,用于测量两个随机过程之间的定向(时间不对称)信息传递量。我们使用转移熵从PageRank的角度挖掘不同领域之间的潜在影响。更多细节可以在我们的论文中找到。
如果您使用此存储库,请引用。
1 2 3 4 5 6 7 |
@software{Yi_DeepScience_2022, author = {Yi, Xu and Zhe, Li and Yihan, Zhang}, month = {3}, title = {DeepScience}, version = {0.1.0}, year = {2022} } |