当前位置:大学毕业论文> 本科论文>材料浏览

关于图书馆论文范文写作 大数据环境下图书馆数据资源质量评估和整体优化相关论文写作资料

主题:图书馆论文写作 时间:2024-03-13

大数据环境下图书馆数据资源质量评估和整体优化,此文是一篇图书馆论文范文,为你的毕业论文写作提供有价值的参考。

图书馆论文参考文献:

图书馆论文参考文献 大数据时代论文关于大数据的论文大数据杂志有关大数据的论文

[摘 要]图书馆已进入大数据时代,大数据的规模性、高速性和数据来源的多样性,使数据产生不一致和冲突,严重影响了图书馆大数据决策的科学性.本文提出了一种图书馆大数据资源质量评估和整体优化的方法,可为用户提供准确高效的大数据质量评价结果,并能够大幅度提升图书馆大数据决策的科学性.

[关键词]大数据;图书馆;数据资源;评估;优化

Jim Gray的新摩尔定理认为,大数据时代每隔18个月全球新增信息量是计算机有史以来全部信息量的总和.据国际数据资讯(IDC)公司监测,全球数据量大约每两年翻一番,预计到2020年,全球将拥有35ZB的数据量,并且85%以上的数据以非结构化或半结构化的形式存在.伴随云计算、物联网、大数据等技术的快速发展及其在图书馆服务中的广泛应用,圖书馆的服务模式呈现出复杂、多样化的发展趋势,导致图书馆的数据总量和数据环境复杂度快速增长,并呈现出“4V+1C”的大数据特征(分别是数据体量巨大(Volume)、数据类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)和具有较强的复杂性(Complexity),图书馆已进入大数据时代.

当前,图书馆数据除具备大数据的“4V+1C”特征外,还具有数据来源多样、多维度、突发性、异构性、分布式、动态、实时和不完全等特点,复杂的数据环境在增加大数据处理、分析和科学决策的难度和复杂度同时,也降低了图书馆从数据中发现知识和大数据决策的有效性.例如谷歌公司利用Google搜索日志大数据进行流感监测的方法(Google FlueTrend,GFT,谷歌流感趋势),在2007-2008年的预测结果虽然和官方最终统计数据的相关性高达97%,但在2011-2012的流感季节,随着日志数据复杂度的增长和可用性的下降,它的预测结果竞比实际值高估了50%;而在2012-2013流感季节中,它预测的结果竟然是美国疾控中心(CDC)最终记录结果的两倍.此外,据估算,数据错误每年造成美国工业界经济损失约占GDP的6%,导致98000名患者丧生,大约50%的数据仓库因数据质量的问题而取消或延迟使用嘲.因此,随着图书馆大数据总量、复杂度和价值量的快速增长,如何将数据质量管理贯穿于图书馆大数据采集、传输、存储、共享、维护、应用和消亡的生命周期全程,并通过大数据价值的发现、判定、监控、预警和优化流程,不断提升大数据的准确性、完整性、实时性、价值密度、可控性和可用性,是图书馆全面挖掘大数据价值和提升大数据决策科学性,实现图书馆管理和服务,从馆员“经验决策”向大数据“科学决策”转变的重要保证.

1关系大数据决策科学性的数据质量问题和数据价值保证

1.1数据噪声影响了数据决策的正确性

预测专家纳特·西尔弗在其著作《信号和噪声》中分析到:“如果信息的数量以每天250兆亿字节的速度增长,则其中有用的信息肯定接近于零.大部分信息都只是噪声而已,而且噪声的增长速度要比信号快得多.”由此看来,大数据中的噪声信号随着大数据总量的增长而快速增长,且噪声信号增长的速度要远大于价值数据增长的速度,并最终会将高价值数据淹没于噪声信号中,导致大数据的价值密度和数据决策可用性快速下降,严重干扰和影响大数据决策的科学性和准确性.此外,大数据的结构复杂度和数据价值发现的难度也随着噪声信号的增长而增长,将导致图书馆数据分析和决策过程中的系统资源损耗、算法复杂度和分析成本快速增长,最终会降低图书馆的大数据决策的可用性和收益率.第三,噪声数据总量的快速增长会大幅提升图书馆对大数据库存储、数据处理和网络传输能力的需求,增加了图书馆数据中心IT基础设施系统的运营负荷.

1.2大数据的真实性和准确性保证

为了保证大数据决策的科学性和可用性,图书馆通常利用用户阅读终端、传感器、视频监控设备、监控服务器和第三方共享数据,完成对图书馆IT系统设备运营、读者个性化服务活动、读者阅读行为和图书馆管理等过程的全数据采集.由于图书馆源数据采集设备、采集方法和数据传输网络性能的巨大差异性,导致所采集的大数据中存在着巨大数量的干扰数据、错误数据和低价值数据,因此,如何在大数据的采集、传输、处理和存储过程中执行科学的数据质量管理策略,是图书馆提高大数据准确性和决策科学性应重点关注的问题.此外,图书馆大数据具有多源性和结构多样性的特点,会导致大数据的格式和质量标准不统一,严重影响了大数据在处理、分析和决策过程中的可用性,因此,如何通过对大数据的清洗、滤噪和标准化处理等预处理方法检查数据的准确性和一致性,纠正大数据中的无效值和缺失值,也是图书馆增强大数据真实性、准确性的重要步骤.

1.3大数据的价值因决策对象和方式的不同而动态变化

随着“互联网+”时代的到来,图书馆利用互联网络和计算机技术完成了读者——服务器——物体三者的融化,实现了图书馆服务资源的优化和大数据融合,提升了图书馆的服务创新力和读者个性化服务写作水平.但是,“互联网+”时代在提升图书馆大数据价值总量和可用性的同时,也使大数据的多源特性、开放性和数据关系复杂度进一步增强,大数据的价值也会随着图书馆管理和服务决策的对象、方式不同而动态变化.其次,伴随图书馆大数据总量和数据结构复杂度的增长,大数据中的错误、缺失、冗余和不相关数据会严重影响大数据决策的效率和准确性,因此,如何依据图书馆大数据决策的对象、方式和目标来采集、处理、分析和应用数据,是关系图书馆大数据决策收益率的重要因素.第三,大数据处理的“1秒定律”表明,大数据决策必须在秒级的时间范围内分析出结果并传输出去,如果超过了这个时间大数据就失去了价值.因此,图书馆如何有效结合大数据生命周期发展规律和数据价值在时间轴上的变化趋势,实时、快速和动态地进行大数据决策,是提升图书馆大数据决策相关性和时效性的关键.

1.4数据的完整性和唯一性保证需求

结论:大学硕士与本科图书馆毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写附近图书馆地址查询方面论文范文。

大数据环境下图书馆读者服务开展优化
摘 要:大数据环境给图书馆的地位、服务理念、服务方式等带来了挑战。图书馆要想应对挑战,优化服务就要做到:树立以人为本的服务理念;提高图书馆工作人。

大数据环境下图书馆
摘要:图书馆具备了一定的数字资源优势,能够以此为基础借助大数据优势,推动数字资源建设发展,由此使读者能够获取到更为高效的信息服务。文将以图书馆的。

基于网络环境下图书馆信息资源建设措施
摘 要:随着网络和信息技术的不断发展,图书馆信息资源的载体出现了多种形态,并呈现出纸质信息资源与电子信息和网络信息并存的发展趋势,并且实现了相互。

网络环境下图书馆信息服务质量管理方法
摘 要:图书馆是一个对信息进行收集、存储、整理、传递的重要机构,随着网络技术的不断发展,网络技术已经被应用到了各个领域,因此,图使馆的管理等方面。

论文大全