本书详细阐述了大数据领域数据采集与预处理的相关理论和技术。全书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。本书在第3章至第8章中安排了丰富的实践操作,以便读者更好地学习和掌握数据采集与预处理的关键技术。 本书可以作为高等院校大数据专业的大数据课程教材,也可供相关技术人员参考。
EBOOKS
- Available Now
- New eBook additions
- New kids additions
- New teen additions
- Mysteries
- Read Local
- Thrillers
- General Fiction
- Romance
- Biographies & Autobiographies
- Sci-Fi & Fantasy
- Popular Non-Fiction
- Graphic Novels
- See all ebooks collections
AUDIOBOOKS
- Available now
- New audiobook additions
- New kids additions
- New teen additions
- Mysteries
- Thrillers
- Romance
- Biographies & Autobiographies
- Popular Fiction
- Popular Non-Fiction
- Sci-Fi & Fantasy
- Professional Development
- Uplifting Listens
- See all audiobooks collections