
会员
Python数据预处理技术与实践
更新时间:2020-05-22 16:39:13 最新章节:参考文献
书籍简介
数据预处理在大数据和人工智能方面有着广泛的应用,本书结合理论和工程应用循序渐进地介绍数据预处理技术,内容包括:网络爬虫、数据采集与存储、python数据处理库、信息格式化抽取、数据清洗、数据集成、特征向量化、特征降维、可视化技术、数据预处理在实际项目中的应用及其深度学习技术进行数据预处理。本书的特点是示例代码丰富,实用性和系统性较强,适合于大数据从业者、AI技术开发人员、培训机构及大专院校相关专业的教学参考书。
品牌:清华大学
上架时间:2019-12-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
白宁超 文俊 唐聃
同类热门书
最新上架
- 会员《HBase从入门到实战》系统介绍HBase基本原理与运行机制,融入了作者多年的开发经验与实践技巧。本书共分为11章,主要内容包括:HBase的体系结构和系统特性、HBase的基础数据结构与算法、RegionServer的核心模块、HBase的读写流程、Compaction实现原理和使用策略、负载均衡的实现与应用、HBase的基础指令(包括DDL指令、DML指令、命名空间指令等)、如何使用Java计算机5.2万字
- 会员全书共6章,第1章:介绍本书所使用到的主要工具和一些需要心里有数的预备知识;第2章:解析最简单、常用的基础语法,帮助读者适应本书的节奏;第3章:为进阶知识,会从CPU、操作系统的角度,深入分析函数的工作原理和实现细节;第4章:解析经典的C++语法,背后的实现逻辑,并介绍面向对象的编程思想及优缺点;第5章:讨论跟操作系统强相关的软件技术,会将所有章节的内容贯穿起来,初步形成一个现代操作系统的运作模型计算机9万字
- 会员本书图文并茂、通俗易懂,详细讲解常用的算法知识,又融入大量的竞赛实例和解题技巧,可帮助读者熟练应用各种算法解决实际问题。本书总计8章。第1章讲解STL,涉及双端队列、优先队列、位图、集合、映射和STL中的常用函数;第2章讲解实用的数据结构,涉及并查集、倍增、稀疏表、区间最值查询、最近公共祖先、树状数组和线段树;第3章讲解查找算法,涉及散列表、字符串模式匹配和字典树;第4章讲解平衡树,涉及树高与性能计算机10.7万字
- 会员自20世纪以来,互联网的发展已经堪称日新月异,人们的工作、生活、学习等各个方面越来越离不开互联网Web应用。JavaWeb是Web应用中成熟度高、普及率高、适用性广的开源技术,几乎所有Web应用程序都需要具备JavaWeb技术能力。本书分为5篇,共17章。第1篇介绍Web开发与JavaWeb开发,包括体系结构、相关技术、开发环境等;第2篇介绍JSP语言基础,包括JSP的基本概念、JSP指令、JSP计算机10.3万字
- 会员本书分为三部分:第1部分介绍代码的整理(微型重构);第二部分讨论如何将整理工作整合到开发工作流程中;第三部分深入探讨什么是软件设计、软件设计如何驱动软件开发和运营成本以及软件开发和运营成本又如何驱动软件设计、投资软件结构与不投资软件结构之间的权衡是什么、我们可以利用哪些经济和人文原则来决定是否以及如何改变软件结构。计算机3.7万字
- 会员本书系统讲解了音视频流媒体及播放器的基础理论及案例应用。本书为FFmpeg音视频流媒体系列丛书的第五本,前4本分别是《FFmpeg入门详细讲解——音视频原理及应用》《FFmpeg入门详细讲解——流媒体直播原理及应用》《FFmpeg入门详细讲解——命令行及音视频特效原理及应用》《FFmpeg入门详细讲解——SDK二次开发及直播美颜原理及应用》。计算机13.8万字
- 会员《Vue3移动Web开发与性能调优实战》旨在向读者介绍如何使用Vue3和其他现代Web技术创建高性能的移动Web应用程序。《Vue3移动Web开发与性能调优实战》不仅详细介绍有关移动Web和Vue3的技术知识,包括HTML5、CSS3、Vue全家桶、构建工具Vite、移动Web屏幕适配等,并讲解如何使用这些技术来创建快速、可靠和可扩展的应用程序,还深入探讨各种性能优化技术,并向读者展示如何计算机14.6万字
- 会员随着数据存储、数据处理等大数据技术的快速发展,数据科学在各行各业得到广泛的应用。数据清洗、特征工程、数据可视化、数据挖掘与建模等已成为高校师生和职场人士迎接数字化浪潮、与时俱进提升专业技能的必修课程。本书将Python课程学习与数据科学应用有机结合,为数字化人才的培养助力。全书共分13章,内容包括:第1章数据科学应用概述;第2章Python的入门基础知识;第3章数据清洗;第4~6章特征工程介绍,包计算机20.3万字
同类书籍最近更新
- 会员Ray是开源分布式计算框架,简化了扩展计算密集型Python工作负载的过程。本书展示了如何使用Ray构建机器学习应用程序,介绍了Ray如何融入当前的机器学习工具,以及Ray如何与这些工具紧密集成。本书前3章介绍了Ray作为分布式Python框架的基础知识,并提供了应用示例;第4-10章介绍了Ray高级库(RayRLlib、RayTune、RayDataset、RayTrain、RaySe程序设计10.7万字
- 会员Ifyouareawebormobileapplicationdeveloper,whowantstocreateGISapplicationsinyourrespectiveplatform,thisbookisidealforyou.YouwillneedJavaScriptprogrammingexperiencetoget程序设计5.6万字
- 会员本书讲解了如何将企业的营销活动开发和运营能力通过中台标准化和敏捷化,实现对前端需求的快速响应和后端能力的整合复用,从而提升企业营销能力和营销效果。本书内容来自vivo官方实践,vivo的活动中台“悟空”是各行业竞相学习和效仿的标杆。本书从业务、产品和技术角度对悟空中台的业务设计、技术架构、核心技术、实现思路、应用实践等做了讲解。全书一共7章,可以分为三个部分。第一部分活动中台的前世今生(第1~3章程序设计12.3万字
- 会员ThisbookiswritteninaCookbookstyle,beginningwithrecipeswhichfocusonhelpingdevelopersmaketheirsoftware/applicationavailableinAndroid.AndroiddeveloperswhowanttolearnAndroidNDK程序设计7.7万字
- 会员本书旨在指导大家优化运行在现代CPU上的应用程序的性能。具体来说,主要分为两部分内容:第一部分介绍性能分析,包括对CPU微架构、术语和指标的简要概述,还探讨了分析性能的不同方法和现代平台上可用的硬件监控功能。第二部分展示如何发现优化机会,以及可以做哪些转换来提高程序的性能。此外,还提供了一份可应用于用户应用程序的优化清单,包括循环优化、向量化、函数内联等,并讨论了有助于消除CPU微架构层面的程序设计10.5万字
- 会员本书首先介绍目前比较流行的地图可视化工具和常见的地图数据类型,便于读者从整体上掌握地图可视化的基本知识;然后介绍HTML、CSS、JavaScript等Web开发基础,便于不太熟悉Web开发的读者阅读本书,熟悉Web开发的读者可略过这部分内容;最后从Leaflet地图可视化基础、地图基本操作、专题地图绘制、地图动画等方面深入介绍Leaflet的开发过程,对每一步的案例代码都进行了详细说明,便于读者程序设计10.3万字