国内药学数据库大 PK
由于国内以仿制药为主,较国外从头原研企业较少,使得国内数据库在建设内容上也更偏向仿制药的开发,比起国外数据库的高价格、全英文,国内数据库的价格低廉与本地化让其更接地气。
今天笔者就来为大家盘点一下国内药学数据库的一些优缺点,方便大家日后使用时能够根据数据库的特点选择更适合自己的数据库。
官方介入数据——质量高,不过数据联系不强
相信在做数据挖掘的童鞋们肯定也是非常关心数据的质量了,毕竟高质量数据是数据分析的前提和分析结论可靠性的保障。从这点上将首先要提的就是国家药监局和药监局下面的药审中心,国家药监局及药审中心的数据靠谱程度肯定是毋庸置疑的,而且平易近人的官网们还会定期在网站的一些栏目中放上年份或者季度的统计数据,简直不要太贴心了,并且数据还是免费的哦 ~
不过很可惜药监局这类官网也是最往往是小伙伴们很忽略的地方。
夸了亲亲官网这么一堆,那官网的数据于在找数据库的小伙伴们也是一点缺点都没有的嘛,当然也不是了。
这类官网的数据它和通常我们使用的数据库的一大区别是数据与数据之间是通过受理号来关联的,并不是通过药物的名字或者一些国际通用 ID 来关联,数据之间的关系也需要大家自己整理一下。
国内老牌数据库——数据全但数据展现形式简单
提到国内老牌数据库,大家可能很容易会想到药智、药渡这些。这些数据库成长的很早,积累的比较多。要是论找数据,可能有你想不到,估计没有他们找不到。
当然他们的数据有一半来自官方,另外一半数据来自于国外的一些开源数据库,同时老牌数据库们也是除了官方爸爸少数能做到数据实时更新的存在,因此不管是项目比较紧急还是需要很全面的数据进行分析,选这类数据库没错的。
同时笔者认为可能是由于数据量过大,整理数据字段与字段之间的联系会耗费大量的人力物力,所以这些老牌数据库们在数据的展示会大多直接以数据集为单元的形式将数据罗列出来,又因为数据集之间数据的组织逻辑不一样,所以想要得到更有效的信息也是需要大家自己去做进一步分析的。
题图来源:自制
文中图片:笔者自制
投稿:zhanglanxin@dxy.cn