字符串操作 ——倒排文档( 建立倒排索引)寻求代码

ConeIT 发布于 2014/06/19 16:47
阅读 314
收藏 0

建立倒排索引的过程,需要对文件进行顺序的扫描,在这个过程中,我们一般还会统计一下词的分布情况,比如想知道频次排名第X的词(如果两个词的词频相同,则按照字母顺序排序)会出现多少次? 为方便实现,首先以简单的键盘输入形式逐行输入文件的内容,实现基本的功能之后,再将输入方式改成从文本文件中读取。

例如:输入 

第一行需要查询的单词W
第二行文本的总行数N
第三行频次排名R
剩下为文本(每个单词之间靠空格隔开) 

输出 

第一行输出该词所在的行数序号(多个的话,按照从小到大排序输出,中间空格隔开,序号从一开始记),如果没有出现,输出 -1
第二行输出频次排名R的单词出现的次数。

加载中
0
中山野鬼
中山野鬼
该怎么统计怎么统计,该怎么排序怎么排序。哈。前面的事情和后面的事情分开做。。
返回顶部
顶部