如果目标文件是xml怎么进行聚类呢

仗义执剑天下行 发布于 2016/09/18 14:59
阅读 127
收藏 0

@penngo 你好,想跟你请教个问题:请问如果目标文件是xml怎么进行聚类呢,输出也是xml

包含以下信息:代表性文章的“标题、关键词、文章ID、文章链接、相关文章量”

大概是下面这种格式  

每次跟李克强总理出访,都是急行军,这次急行军行进到远在地球另一端的拉丁美洲。在巴西的两天时间里,李克强总理都去了哪些地方?见了哪些重要的人?做了哪些工作呢?\r\n现场:美军P-8A飞越南海岛礁遭中方8次警告离开\r\n实拍西班牙政客电视上激辩 假牙飞出塞回继续\r\n视频还原长春宝马奥迪碾死人真相 电瓶车违规",
   "detriment" : -0.20,
   "errmsg" : "OK",
   "finger" : 30757311,
   "furl" : "http://news.sina.com.cn/w/2015-05-23/083031867216.shtml",
   "keywords" : "泰国(10) 日本(11) 协议(3) 高铁(2) 签订(2) 新干线(7) 技术(2) 铁路(5) 签署(4) 太田(3) ",
   "md5" : "26805806de49684e02e617ff62370159",
   "pubtime" : "2015-05-23 08:30:00",
   "ret" : 0,
   "source" : "参考消息",
   "summary" : "  参考消息网5月23日报道 日媒称,泰国在国内规划的高速铁路有望采用日本新干线方式。两国交通部长5月27日将在东京举行会谈,并签署共识性文件。如果此次新干线成功实现出口,有",
   "title" : "日媒:泰国高铁或采用日本技术 即将签订协议",
   "url" : "http://news.sina.com.cn/w/2015-05-23/083031867216.shtml"
}

加载中
0
penngo
penngo
把xml内容需要的内容提取出来,放进聚类算法中进行聚类。
返回顶部
顶部