期刊信息
 

刊名:中国中医药图书情报杂志
曾用名:中国医学文摘·中医
主办:中国中医科学院中医药信息研究所
主管:国家中医药管理局
ISSN:2095-5707
CN:10-1113/R
语言:中文
周期:双月刊
影响因子:0
被引频次:1335
期刊分类:图书情报
期刊热词:
图书馆,中医药,中医,大数据,中医药院校,文献计量学,数字图书馆,文献计量分析,投稿须知,互联网,

现在的位置:主页 > 期刊导读 >

图书情报数据挖掘处理平台设计(2)

来源:中国中医药图书情报杂志 【在线投稿】 栏目:期刊导读 时间:2020-08-11 17:46

【作者】网站采编

【关键词】

【摘要】2 软件设计 从功能的简易运行和设计的开拓性能角度出发,采用的挖掘算法延伸性应用具备两个特性: 1)挖掘算法的一些性能是比较卓越的,应用上更是灵

2 软件设计

从功能的简易运行和设计的开拓性能角度出发,采用的挖掘算法延伸性应用具备两个特性:

1)挖掘算法的一些性能是比较卓越的,应用上更是灵便突出,但是灵便的后果就是操作相当麻烦。所以本文必须整理出多个演变算法,才能给外界够提供出简便的对恰接口,使操作的运用既能活灵活现又尽可能的简单便捷。

2)改良可插播式应用的挖掘算法,既能在原始算法上增加新的运算公式也能在已有公式的基础上进行算法改动或者撤销,还不会对原始模块产生相对明显的影响。这种算法不仅落实了对最初算法的改进,还跟进了应用改进算法。具体的图书情报数据挖掘流程如图3所示。

图3 数据挖掘流程图Fig.3 Flow chart of data mining

在进行图书情报数据挖掘时,用户可以依据需求,对挖掘策略模板文件事先进行挖掘算法的设置,来确定某些参数的值和在未来的时间里需要设置的参数。在这类文件中,为了完成特定的策略文件,需要为平台中的属性指定所需要的算法,确定哪些已经有明确值的挖掘参数,哪些参数是用户对此策略模板的解释说明,指导用户定义策略文件。

3 实验结果分析

3.1 测试环境

功能测试工具为Microsoft Visual Studio 2015 for software tester;性能测试工具为Loadrunner 10;测试管理工具为Mercury Quslity center 9.0。

3.2 平台运行环境

服务器,HP ML-370 G5;操作平台,Windows 2013 Server,TRS DB Server V6;CPU,Inter Pentium Ⅲ 1 GHz以上;内存,4 GB以上;硬盘,1 TB;网络,支持TCP/IP协议;数据库,SQL Server,MySQL。

3.3 实验结果分析

为了验证本文平台在数据挖掘方面的性能,将文献[5]平台作为对比,进行量化测试。测试将负载均衡离差值作为衡量指标。

负载均衡离差值是负载均衡性的体现,计算公式为:

式中:n用于描述图书情报数据总量;ηv用于描述数据量为v时数据挖掘的负载;ηavg用于描述数据挖掘时的平均负载。

依据上式描述,将采用本文平台及文献[5]平台做比较,进行数据挖掘负载均衡离差值对比,结果见图4。

图4 不同平台挖掘负载均衡离差结果对比Fig.4 Comparison for load balance deviation results mined by different platforms

分析图4可知,在数据挖掘量和响应速度一定时,采用本文平台进行数据挖掘,其负载均衡离差值较为稳定,只有一处出现忽然增加的现象,均衡性较好的同时,稳定性较高,具有一定的优势;反之,采用文献[5]平台时,多处出现负载均衡离差值突然增高的现象,虽然均衡性较好,但稳定性较差,影响因素增多,需要进一步进行处理。

4 结论

针对传统平台一直存在数据挖掘中负载均衡差的问题,提出并设计了基于K-means算法的图书情报数据挖掘处理平台,并通过硬件及软件两部分进行分析,以负载均衡离差值为对比指标进行实验分析。结果表明,改进平台负载均衡较好,具有一定的优势。

[1]李艳,吕鹏,李珑.基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J].图书情报知识,2016(2):60-68.LI Yan,Lü Peng,LI on personalized services of university library based on the big data mining and decision analysis system[J].Document,information & knowledge,2016(2):60-68.

[2]何胜,冯新翎,武群辉,等.基于用户行为建模和大数据挖掘的图书馆个性化服务研究[J].图书情报工作,2017,61(1):40-46.HE Sheng,FENG Xinling,WU Qunhui,et on personalized services of library based on user behavior modeling and big data mining[J].Library and information service,2017,61(1):40-46.

[3]洪亮,李雪思,周莉娜.领域跨越:数据挖掘的应用和发展趋势[J].图书情报知识,2017(4): Liang,LI Xuesi,ZHOU applications and development trend of data mining[J].Document,information & knowledge,2017(4):22-32.

[4]李信,李旭晖,陆伟,等.大数据驱动下的图书情报学科热点领域挖掘:面向WOS题录数据的实证视角[J].图书馆论坛,2017,37(4):49-57.LI Xin,LI Xuhui,LU Wei,et of progresses and frontiers of big data-driven library and information science[J].Library tribune,2017,37(4):49-57.

[5]陈炎龙,段红玉.基于改进Hadoop云平台的海量文本数据挖掘[J].湖南师范大学自然科学学报,2016,39(3): Yanlong,DUAN text data mining based on improved Hadoop cloud platform[J].Journal of natural science of Hunan Normal University,2016,39(3):84-88.

[6]周芸韬.基于R语言的大数据处理平台的设计与实现[J].现代电子技术,2017,40(2): and implementation of big data processing platform based on R language[J].Modern electronics technique,2017,40(2):53-56.

文章来源:《中国中医药图书情报杂志》 网址: http://www.zgzyytsqbzz.cn/qikandaodu/2020/0811/420.html

上一篇:医学院校图书情报硕士专业学位研究生培养方式
下一篇:图书情报领域数据安全发展脉络及热点分析<sup

中国中医药图书情报杂志投稿 | 中国中医药图书情报杂志编辑部| 中国中医药图书情报杂志版面费 | 中国中医药图书情报杂志论文发表 | 中国中医药图书情报杂志最新目录
Copyright © 2018 《中国中医药图书情报杂志》杂志社 版权所有
投稿电话: 投稿邮箱: