2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
上一节我们完成了如下的内容:
这里是三台公网云服务器,每台 2C4G,搭建一个Hadoop的学习环境,供我学习。
之前已经在 VM 虚拟机上搭建过一次,但是没留下笔记,这次趁着前几天薅羊毛的3台机器,赶紧尝试在公网上搭建体验一下。
Apache Sqoop 于 2021 年 6 月迁入 Attic。
Apache Sqoop 的使命是创建和维护与 Apache Hadoop 和结构化数据存储相关的大规模数据传输软件。
虽然项目已经可能过时,但是如果你的时间充裕的话,可以适当地学习一下,可能会对你有一定的帮助的!!!
sqoop import
--connect jdbc:mysql://h122.wzk.icu:3306/sqoop
--username hive
--password [email protected]
--target-dir /root
--append
-m 1
--fields-terminated-by "t"
--query 'select gname, serialNumber, price, stock_number,
create_time from goodtbl where price>88 and $CONDITIONS;'
上述参数的解释:
可以观察到 Sqoop 开始了 MapReduce 的任务
此时任务已经开始分配了 Map -> Reduce
可以看到任务执行完毕
sqoop import
--connect jdbc:mysql://h122.wzk.icu:3306/sqoop
--username hive
--password [email protected]
--target-dir /root
--delete-target-dir
--num-mappers 1
--fields-terminated-by "t"
--columns gname,serialNumber,price
--table goodtbl
上述参数的解释:
与上述的内容一致,就不放重复的内容了,只截取部分。
sqoop import
--connect jdbc:mysql://h122.wzk.icu:3306/sqoop
--username hive
--password [email protected]
--target-dir /root
--delete-target-dir
-m 1
--fields-terminated-by "t"
--table goodtbl
--where "price>=68"
与上述一致,内容结果等基本重复,也不放了。