知网元数据库十大核心数据
2023-01-22阅读(682)
问:大数据核心技术有哪些?
- 答:大数据技术的体系庞大且复杂,基础的技术包含数据的采集、数据预处理、分布式存储、数据库、数据仓库、机器学习、并行计算、可视化等。
1、数据采集与预处理:FlumeNG实时日志收集系统,支持在日志系统中定制各类数据发送方,用于收集数据;Zookeeper是一个分布式的,开放源码的分布式应用程序协调服务,提供数据同步服务。
2、数据存储:Hadoop作为一个开源的框架,专为离线和大规模数据分析而设计,HDFS作为其核心的存储引擎,已被广泛用于数据存储。HBase,是一个分布式的、面向列的开源数据库,可以认为是hdfs的封装,本质是数据存储、NoSQL数据库。
3、数据清洗:MapReduce作为Hadoop的查询引擎,用于大规模数据集的并行计算。
4、数据查询分析:Hive的核心工作就是把SQL语句翻译成MR程序,可以将结构化的数据映射为一张数据库表,并提供HQL(HiveSQL)查询功能。Spark启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
5、数据可视化:对接一些BI平台,将分析得到的数据进行可视化,用于指导决策服务。 - 答:大数据的核心是云技术和BI,离开云技术大数据没有根基和落地可能,离开BI和价值,大数据又变化为舍本逐末,丢弃关键目标。简单总结就是大数据目标驱动是BI,大数据实施落地式云技术。大数据的总体架构包括三层:数据存储、数据处理、数据分析,三层相互配合让大数据最终产生价值。数据有很多分法,有结构化,半结构化,非结构化; 也有元数据,主数据,业务数据; 还可以分为GIS,视频,文件,语音,业务交易类各种数据。传统的结构化数据库已经无法满足数据多样性的存储要求,因此在RDBMS基础上增加了两种类型,一种是hdfs可以直接应用于非结构化文件存储,一种是nosql类数据库,可以应用于结构化和半结构化数据存储。从存储层的搭建来说,关系型数据库,NoSQL数据库和hdfs分布式文件系统三种存储方式都需要。数据处理层核心解决问题在于数据存储出现分布式后带来的数据处理上的复杂度,海量存储后带来了数据处理上的时效性要求,这些都是数据处理层要解决的问题。
- 答:数据方面核心技术有哪些? 新人必读 大数据技术的体系庞大且复杂,基础的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。
问:知网核心期刊认证书有哪些
- 答:北大核心,南大核心,中国科学引文数据库等。
1、北大核心是学术界对某类期刊的定义,一种期刊等级的划分。它的对象是,中文学术资讯网类期刊。
2、南大核心期刊就是CSSCI的缩写,也可以称为C刊,还有一种C刊是各自单位根据自己的研究方向,从国内外核心数据库选出来的刊。
3、中国科学引文数据库(ChineseScienceCitationDatabase,简称CSCD)。创建于1989年,收录我国数学、物理、化学、天文学、地学、生物学、农林科学、医药卫生、工程技术和环境科学等领域出版的中英文科技核心期刊和优秀期刊千余种。
问:知网的《中国期刊全文数据库》的期刊导航中矿业工程类核心期刊有几种
- 答:知网的《中国期刊全文数据库》收录了“矿业工程”全部13种核心期刊。个别期刊在知网期刊导航中分在了其他类中。
1中国矿业大学学报
2采矿与安全工程学报
3金属矿山
4爆破
5矿产综合利用
6矿业安全与环保
7中国矿业
8矿冶工程
9非金属矿
10有色金属(选矿部分)
11矿业研究与开发
12化工矿物与加工
13矿产保护与利用