php 如何最优效率提取相关新闻

武当剑客 发布于 2013/12/23 10:57
阅读 426
收藏 1
PHP
每条新闻可能有多个关键词,如何用最优写法最快速提取所有相关新闻,请大侠指教
加载中
1
西门飞
西门飞
这个关键字就是所谓的 tag吧,可以将每个tag 对应一个素数,每篇新闻可以有N个tag  这N个素数相乘得到的乘积作为搜索索引,给定一个关键词 获取到对应的tag ,然后能整除这个tag的索引就是相关的新闻
苏生不惑
苏生不惑
好思路
0
A
AQMAN

每條新聞在儲存的時候就依照相關關鍵字分詞 儲存相關資料 之後要抓取 相關 关键词 就從 此另一整理出來的資料庫抓取對應即可


0
狮子的魂
狮子的魂

哈,这个你可以通过很多种方式来实现,最靠谱的方式还是通过相关度检索,因为功能本身就是相关新闻。如果你们的系统中有新闻的全文检索功能,那最好不过了。基本思路如下:

1. 新闻在添加的时侯可以提取新闻的关键词,并且存储,可以建一个字段啦。具体实现可以看看http://my.oschina.net/jcseg/blog/143203

2. 查看对应的新闻时,依据这个新闻的关键字到全文索引系统找几条相关度最好的就是最相关的文章了。如果没有全文索引,利用PG或者MySQL也好实现啦,可以看看:http://my.oschina.net/jcseg/blog/111106

php的话,可以使用sphinx啦,这种方式速度快,效果好,而且可以适合n个关键字。。。。

0
A
AQMAN
大陸仔還是挺厲害的
A
AQMAN
回复 @开源码农 : 嗚 是台灣的苦主,在台灣 出一張嘴才有出路啦 最近開始要來練嘴技了
开源无憾
开源无憾
台湾的同行?
0
A
AQMAN
剛剛怎有人說 不跟你說啊?
返回顶部
顶部