请人开发WEB日志分析软件

张帆2 发布于 2010/08/31 18:06
阅读 998
收藏 1

日志分析软件

语种:c++

平台:windows

功能要求:

1,能自动识别主流WEB日志文件格式

  2 分析出各URL的状态码 (如:404 500),只匹配已添加的状态码 用户与蜘蛛要分开。

状态码可自行添加,(可以添对状态码的说明)

  3 分析出各类爬虫及他们访问的页面,对于重复的URL 数量相加,(爬虫可自定义添加)(可添加对爬虫的说明)

  4,分析出从搜索相引擎来的用户、关键字及搜索引擎的名字及次数 (搜索引擎可自定义添加,可添加说明)

 5,用户可选择保存报告位置

6,不能占用太多内存,以致机器崩溃

生成HMTL报告:

1,展示出来访问蜘蛛及对应蜘蛛访问的URL个数

2,展示出 来源搜索引擎,关键字及对应的数量,可选择这三个维度展示,如:按关键字展示,按数量展示,按搜索引擎展示

3,展示出 出错的 URL 蜘蛛与用户分开展示

 

界面要求:

1,用户自行添加LOG日志,要有文件对话供用户选择文件(还可自行添加文件地址 参考:可用TEXTBOX 一行一个文件地址)

 

2,多线程处理 防止界面假死

3,界面/报告要清爽,明了,要有进度条显示进度

4,处理速成度要快,最好能达10万条/秒左右

 

 

 

 联系

 QQ306870769

 手机:13968038592

可以长期合作

加载中
0
挖粪涂墙
挖粪涂墙

要求不低,价格怎么样?

0
麦田大圈圈
麦田大圈圈

又一个不写价格的?

0
匿名网友
匿名网友

我觉得这样开发一个软件就是思路错误,光靠webserver的原始日志很多指标是分析不到的。

最好是在页面访问的时候增加其他辅助参数写入日志,不然你这个通用性有了,但没有深入分析。

0
可观
可观

10w条/s是不是要求太高了?按照平均一条记录1k来算,每秒100m数据处理量? 还要少占内存?你提供什么样的运行环境?

返回顶部
顶部