如5000W条字符串,格式如下:
aabbccee25
cabbecee2p
bqbbeceekl
.......
如果我输入aabbccee25,就会按相似度由高到低查出结果!不知道有什么好的算法或工具没!用lucene能满足要求吗!
请高人指点!
如5000W条字符串,格式如下:
aabbccee25
cabbecee2p
bqbbeceekl
.......
如果我输入aabbccee25,就会按相似度由高到低查出结果!不知道有什么好的算法或工具没!用lucene能满足要求吗!
请高人指点!