8
回答
大段文本用什么计算其相似度比较好?
利用AWS快速构建适用于生产的无服务器应用程序,免费试用12个月>>>   
如题,目前数据库里存了大量网页爬的文本数据,大约500万条新闻类的数据吧,发现有一些重复的,目前有什么好的方法去重么?
<无标签>
举报
HZ先生
发帖于5年前 8回/358阅
顶部