1
回答
Hive 查询指定时间范围内的数据
开发十年,就只剩下这套Java开发体系了   

我用Hive写查询的时候发现,查询条件里面如果指定了时间范围,查询的速度会变更的非常慢,具体如下:

我是想查询12月18~25号的数据,device_gmt_time字段的内容是yyyy-MM-dd HH:mm:ss 的格式,所以我先用to_date转成日期,然后用datediff函数

select * from t_proxy_user_log_partition where datediff(to_date(device_gmt_time),'2013-12-18')>=0 and datediff(to_date(device_gmt_time),'2013-12-25')<=0

这个查询执行速度非常慢,如果去掉时间范围,查询速度快2倍以上,求教各位高手,手没有效率更高的查询时间范围的方法?

举报
顶部