首页 > 图书中心 > 教学用书 > 本科研究生 > 信息

大数据原理及实践-张晓燕

大数据原理及实践

丛书名:高等教育“十四五”经管类精品教材
著(译)者:张晓燕
资源下载:
责任编辑:台啸天
字       数:213千字
开       本:16 开
印       张:13.5
出版版次:1
出版年份:2023-03-01
书       号:978-7-5642-3909-1/F.3909
纸书定价:39.00元   教师会员可用500积分申请样书

近几年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。人们把这种大规模数据称为“海量数据”。 本书针对社会需求,为信息管理与信息系统专业本科生提供大数据存储及处理方面的知识。通过系统的讲解大规模数据的存储及处理等基础知识,使学生了解分布式数据处理系统的基本思想、原理及架构;通过实际案例分析及实践,使学生掌握大数据存储及处理的技术方法,最终使学生具备参与大规模分布式数据处理系统的搭建、数据分析及处理以及数据可视化等方面的能力。 本书大致目录:第一章

  • 近几年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。

    人们把这种大规模数据称为“海量数据”。

    本书针对社会需求,为信息管理与信息系统专业本科生提供大数据存储及处理方面的知识。

    通过系统的讲解大规模数据的存储及处理等基础知识,使学生了解分布式数据处理系统的基本思想、原理及架构;通过实际案例分析及实践,使学生掌握大数据存储及处理的技术方法,最终使学生具备参与大规模分布式数据处理系统的搭建、数据分析及处理以及数据可视化等方面的能力。

    本书大致目录:第一章,第一章,Hadoop生态系统介绍;第二章,Hadoop基本原理及环境搭建;第三章,HDFS基本操作及MapReduce编程;第四章,数据仓库HIVE的基本原理及应用;第五章,SPARK基本原理及应用;第六章,综合案例。


  • 目 录。
    第1章 Hadoop生态系统简介/001。
    1.1 大数据发展/001。
    1.2 Hadoop平台介绍/006。
    1.3 相关的公司/009。
    1.4 Hadoop生态系统/011。
    第2章 Hadoop核心组件及其基本原理/014。
    2.1 HDFS基本原理/014。
    2.2 MapReduce分布式计算框架/022。
    2.3 Yarn介绍/029。
    第3章 Hadoop环境搭建/033。
    3.1 Linux基础/033。
    3.2 Linux的文件系统结构/036。
    3.3 文件类型/038。
    3.4 Linux基本操作命令/039。
    3.5 Linux下常用的工具软件/047。
    3.6 Hadoop环境搭建/051。
    第4章 Hive基本原理及安装部署/063。
    4.1 Hive基本原理/063。
    4.2 Hive的数据存储/064。
    4.3 Hive的安装部署/066。
    第5章 Hive的基本操作/070。
    5.1 Hive的DDL。
    data define language。
    操作/070。
    5.2 Hive的DML。
    data managed language。
    操作/076。
    5.3 Hive shell 参数/093。
    第6章 Spark基础知识/095。
    6.1 Spark原理/095。
    6.2 Spark架构及生态/098。
    6.3 Spark运行流程及特点/100。
    6.4 Spark运行模式/108。
    第7章 Spark RDD编程/114。
    7.1 RDD设计与运行原理/114。
    7.2 RDD基本操作/122。
    7.3 Spark SQL简介/132。
    第8章 基于MLLIB机器学习/140。
    8.1 概述/140。
    8.2 Spark分类和预测/142。
    8.3 决策树算法/145。
    8.4 朴素贝叶斯算法/152。
    8.5 回归分析与预测技术/157。
    8.6 聚类分析/167。
    大数据原理及实践。
    8.7 k-means聚类算法简介/172。
    8.8 DBSCAN聚类算法简介/179。
    8.9 关联规则分析简介/185。
    8.10 Apriori算法和FP Tree算法简介/188。
    参考文献/200。

版权所有(C)2023 2024澳门2024免费原料网版权所有   沪ICP备12043664号-2   沪公网安备31009102000068号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘