国家材料腐蚀与防护科学数据中心
National Materials Corrosion and Protection Data Center
中文 | Eng 数据审核 登录 反馈
这个工具,可全网爬取科研圈中外文献!
2020-08-11 14:36:04 作者:本网整理 来源:材料科学与工程

对于多数科研人而言,写论文是件特别磨人的事情。


以前,几千几万字,写上好几个月,有的甚至需要花上一年左右的时间,还不见得能顺利发表。


这也让我一再感受到,科研真的不是那么好做的,做出一点扎扎实实的“成绩”实在是太难了!


但是,我现在转变了这样的想法。


所谓磨刀不误砍柴工,要撰写好一篇学术论文,必须要掌握好撰写学术论文的方法。


1 写论文是一门秃头的艺术


近年来,越来越多的科研机构,将 SCI 论文作为评价医生及科研人员学术水平的一个重要指标。


可以这么说,对于一名科研人,在职业发展的初中期,SCI 论文“就是金钱与地位的代名词”。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.jpg

要评职称了,论文不够数;


课题要结项了,调研工作还没做完;


博士四年级了,还差一篇C。


科研人注定生活在论文的阴影里。


前几天一个师弟告诉我,他马上要在线上做论文开题模拟答辩了,然而自己一点头绪也没有。


为了论文开题,他已经熬了3个晚上,写了删,删了写,到现在也没几行有用的字儿~想到后面的论文更让他不寒而栗。


作为科研大军的一员,虽然被虐得司空见惯,但也很理解。


第一次知道写论文能把人写秃,是在我研二的时候。


连续一个星期,我都在熬夜赶论文,翻墙、付费,前前后后下载了几百份资料包,一个一个打开筛选信息时却发现:将近50%的资料都是一样的!


整理完这些资料已经凌晨3点了,困得眼睛都睁不开,一想到明天就截稿了,我只好随便拼凑一篇应付。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.jpg

结果可想而知,导师还没看完第一页就把论文给退回来了,说论文通篇缺乏具体数据分析,研究计划就很粗糙,实施起来会出现各种bug。


好在,有个发了好几次「SCI」的师姐告诉我,手动找资料太局限了,现在她都是用Python来完成文献搜索、和数据处理。


师姐几十行代码写一个简单的爬虫工具,几分钟不到,“嗖嗖嗖…”自动抓取到指定网站上的成千上万篇论文,没有找不到,只有想不到的。


当我们缺选题、缺资料、缺脑筋的时候,拿这种方法来做论文,瞬间就能实现有数据、有内涵、有深度。

640?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1.gif

▲Python5分钟自动抓取论文


师姐用Python做了一个自动翻译的小工具,爬取到的外文文献自动翻译成中文,省下大把的时间做(谈)学(恋)术(爱)。

640?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1.gif

▲自动翻译外文文献


从爬取文献到清洗筛除数据,从数据统计到绘制韦恩图,从论文的写作到完成PPT,整个过程一气呵成。

640?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1.gif

▲自动处理数据制作violinplot、热点图、桑基图


我需要花大半天才能检索到的学术文献,师姐不到10分钟就搞定了。


师姐告诉我:很多学霸、行业专家都在使用python获取最新学术文献,处理特殊图像和撰写仿真脚本。


包括师姐论文中的 PPI 图、热图、富集图、韦恩图、和弦图、火山图和主成分分析图。


2 科研人不易 考验基本功的时候到了


对于传统的科研人来说,究竟如何看待人工智能时代似乎已不太重要了,而如何利用智能工具做研究,提高对社会世界的认识,则更显重要。


比方说,研究政府土地的,想通过全国土地招拍价格研究地价变化趋势。


搞旅游研究的,也想怎么去大众点评网抓抓数据,做做口碑传播研究。

640?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1.jpg

用python抓取数据制取市场分析表


对于研究者来说,用python辅助自己做科研是一座新的矿藏。


在互联网信息爆炸的时代,信息来源网站多,信息量大,如果采用常规的人工搜索文献和手动整理数据,往往费时费力还完不成。


当下,python 在信息搜集和数据分析方面的应用已经非常普遍,已经成了一项必备技能,而不再只是程序员的专属。


而且连小学生都在学。

免责声明:本网站所转载的文字、图片与视频资料版权归原创作者所有,如果涉及侵权,请第一时间联系本网删除。

关于国家科技资源服务平台

国家科技基础条件平台中心是科技部直属事业单位,致力于推动科技资源优化配置,实现开放共享,其主要职责是:承担国家科技基础条件平台建设项目的过程管理和基础性工作;承担国家科技基础条件平台建设发展战略、规范标准、管理方式、运行状况和问题的研究,以及国际合作与宣传、培训等工作;承担科技基础条件门户系统的建设与运行管理工作;参与对在建和已建国家科技基础条件平台项目的考核评估和运行监督工作。

国家科技资源服务平台相关网站


国家材料腐蚀与防护科学数据中心

国家高能物理科学数据中心

国家基因组科学数据中心

国家微生物科学数据中心

国家空间科学数据中心

国家天文科学数据中心

国家对地观测科学数据中心

国家极地科学数据中心

国家青藏高原科学数据中心

国家生态科学数据中心

国家冰川冻土沙漠科学数据中心

国家计量科学数据中心

国家地球系统科学数据中心

国家人口健康科学数据中心

国家基础学科公共科学数据中心

国家农业科学数据中心

国家林业和草原科学数据中心

国家气象科学数据中心

国家地震科学数据中心

国家海洋科学数据中心