Hadoop综合大作业-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Hadoop综合大作业

阅读量：6540 次

发布时间：2019-06-24

本文共 300 字，大约阅读时间需要 1 分钟。

Hadoop综合大作业要求：

1.用Hive对爬虫大作业产生的文本文件（或者英文词频统计下载的英文长篇小说）进行词频统计。

1、启动hadoop

2、Hdfs上创建文件夹并查看

3、上传英文词频统计文本至hdfs

4、启动Hive

5、导入文件内容到表docs并查看

6、进行词频统计

7、查看统计结果

2.将爬取校园新闻生成的csv文件，然后通过qq邮箱在虚拟机的Linux系统下载

把下载的csv文件上传到hdfs,然后启动hive

3.导入数据到docs表并查看

4.查看docs表

转载于:https://www.cnblogs.com/qq412158152/p/9087793.html

你可能感兴趣的文章

Cocos2d-JS项目之二：studio基础控件的使用

inheritprototype原型继承封装及综合继承最简实例

【磁耦隔离接口转换器】系列产品选型指南

Apriori 关联算法学习

二叉树、红黑树、伸展树、B树、B+树

Junit核心——测试集（TestSuite）

MVPArms官方首发一键生成组件化,体验纯傻瓜式组件化开发

Log4j_学习_00_资源帖

制作iso镜像U盘自动化安装linux系统

JSLint的使用

命令行常用命令--软连接

HTTP POST GET 本质区别详解

PHP中HASH函数的优化技巧

RSA算法实例

Unix环境高级编程笔记：3、文件I/O

Dubbo源码之服务端并发控制——ExecuteLimitFilter

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-21 08:52:05 当前IP: 3.145.18.97 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我