新闻 标签推荐系统 请问思路是否正确

mingbai123 发布于 2018/06/22 10:23
阅读 526
收藏 0

我现在想做用户标签 或者新闻标签。  比如用户a 阅读一篇文章 文章提取关键字 比如 世界杯 英格兰 足球, 然后把这些标签放在这个用户的表里。 然后以后推荐给这个用户 相似聚合交集标签的新闻 是否可行?

布鲁克林 2018/6/22 10:19:59

新闻的关键字标签提取 php有对应的插件,那么 我们是采集的时候提取,还是后台定时任务更新, 还是用户app读取新闻的时候 才执行这篇新闻的关键字?

加载中
0
5G架构师
5G架构师

说白了,你就是要给 用户打标签,看他属于哪一类用户,  清洗的代码很多可能需要自己写,也可以参考下别人的

0
m
mingbai123

引用来自“bindao58”的评论

说白了,你就是要给 用户打标签,看他属于哪一类用户,  清洗的代码很多可能需要自己写,也可以参考下别人的

 



我的想法是, 用户通过阅读某个新闻(新闻有3个标签) ,那么用户阅读完这篇新闻后 用户就有了这3个标签。 以后用户可能有10个标签,里面3个是重复的,那么以后我推荐给他新闻的时候 就偏重含有这3个标签的新闻。 这应该是基本的新闻推荐系统把

m
mingbai123
回复 @bindao58 : 打分一般怎么设计呢
5G架构师
5G架构师
打分,或者把之前非偏重的删除即可
0
5G架构师
5G架构师

引用来自“mingbai123”的评论

引用来自“bindao58”的评论

说白了,你就是要给 用户打标签,看他属于哪一类用户,  清洗的代码很多可能需要自己写,也可以参考下别人的

 



我的想法是, 用户通过阅读某个新闻(新闻有3个标签) ,那么用户阅读完这篇新闻后 用户就有了这3个标签。 以后用户可能有10个标签,里面3个是重复的,那么以后我推荐给他新闻的时候 就偏重含有这3个标签的新闻。 这应该是基本的新闻推荐系统把

百度看看

0
雪梨苹果
雪梨苹果

按你需求就选择采集时候提取。

个人推荐手动加或选标签,这样成本会低,别太相信程序,自动不准确的。

真的要自动,那推荐用阿里云的机器学习pai,有大数据的支撑下,标签提取会精准点,并且改成用定时任务处理。

 

0
m
mingbai123

引用来自“雪梨苹果”的评论

按你需求就选择采集时候提取。

个人推荐手动加或选标签,这样成本会低,别太相信程序,自动不准确的。

真的要自动,那推荐用阿里云的机器学习pai,有大数据的支撑下,标签提取会精准点,并且改成用定时任务处理。

 

https://help.aliyun.com/product/30367.html

阿里云的最近也在看 一直不明白原理

我的服务器就是阿里云的,我的数据库是mysql的

我正常的理解是

1:我采集新闻,然后给每条新闻打上标签(关键字提取),采集到mysql数据库新闻表里

2:用户阅读这条新闻,这条新闻3个标签,都放在用户行为表里

3:用户再次打开app 看新闻,新闻列表里就把mysql新闻表里 跟用户3个标签相似度较高的新闻优先推荐给用户

是这样的流程吗?如果我自己做

 

那么,如果用阿里云我就奇怪了怎么做,他是有算法,他也有精准度匹配

 

但要我的新闻表 和用户表 先都上传阿里云的机器平台吗,然后再返回给我?

 

这样时间不就耽误了吗

1我每次都是采集新闻后,再把新闻表上传给阿里云

2阿里云通过他们的算法 给上传的每个新闻打上标签

3:用户阅读 产生用户标签

4 然后离线匹配

 

 

m
mingbai123
回复 @雪梨苹果 : 好 我先看看 阿里云的文档其实很一般 大多数我们都不懂推荐系统和机器学习 他们搞的台生硬
雪梨苹果
雪梨苹果
你用的不是阿里云服务器的话,通信时间延迟肯定会有(不会很长),这是无法避免。你要自己开发匹配服务的话,可以试试,精准率不敢打保证。。。 具体做法我也不怎么清楚,阿里云这里有适合你的方案。 https://help.aliyun.com/document_detail/43471.html?spm=a2c4g.11186623.6.584.pao53E
返回顶部
顶部