8
回答
大段文本用什么计算其相似度比较好?
【腾讯云】校园拼团福利,1核2G服务器10元/月!>>>   
如题,目前数据库里存了大量网页爬的文本数据,大约500万条新闻类的数据吧,发现有一些重复的,目前有什么好的方法去重么?
<无标签>
举报
HZ先生
发帖于5年前 8回/367阅
顶部