hadoop下如何访问及导出最近几天的文件?

恒虎 发布于 2013/12/18 10:44
阅读 419
收藏 0
本人hadoop陆陆续续导入了2TB的数据,发现最近一段时间的数据倒错了,想把最近几天的的数据导出来分析,数据量大概有50G左右,请问有何方式导出?API可以实施吗?
加载中
0
恒虎

没有人知道?是否可以通过hadoop fs -ls可以查看到最新更新的文件,通过这种方式可以知道文件更新日期。这个是否可以通过这种方式获取文件,然后再进行导出。方式觉得很别扭,看看有没有其它便捷的途径。

0
漓江
漓江

确认hadoop fs命令中是否有find命令,如果有,使用find +time就可以获取到最近几天对应的文件。

返回顶部
顶部