怎样查看一个站点是什么语言开发的?

幸福的晚来秋 发布于 2013/05/21 13:49
阅读 5K+
收藏 0

公司开发爬虫的软件,抓取好多网站的数据,如何统计网站是哪种语言开发的?

现在抓取一些linux方面的信息从这两个网站上

http://www.chinaunix.net/

http://www.linuxsir.org/bbs

这两个站都是什么语言发的?

求各位回答。谢谢了。

加载中
0
伊藤熊吉
伊藤熊吉

http://www.chinaunix.net/ 应该是用PHP写的,你看源码会发现有PHP引用的痕迹,所以很大可能是PHP

第二个更简单了,模板样式 不觉得和discuz得默认很像么,源码也有PHP痕迹,所以同样很大可能是PHP

幸福的晚来秋
幸福的晚来秋
回复 @伊藤熊吉 : chinaunix的登陆是member.php?mod=logging&action=login&loginsubmit=yes&loginhash=LZsrJ linuxsir的登陆是Login.action 第一个确定是php了
伊藤熊吉
伊藤熊吉
回复 @幸福的晚来秋 : 没事.多了解了解各种语言的特点+细心就好了
幸福的晚来秋
幸福的晚来秋
回复 @伊藤熊吉 : 想自己观察啊,但是自己观察不出来啊
伊藤熊吉
伊藤熊吉
回复 @幸福的晚来秋 : 你是愿意听别人说还是用自己的眼睛去观察得到结论呢?
幸福的晚来秋
幸福的晚来秋
回复 @伊藤熊吉 : 同事网上搜索说是java做的
下一页
0
梅开源
梅开源
firefox好像有个插件看网站什么语言做的
幸福的晚来秋
幸福的晚来秋
回复 @梅开源 : 哦,谢谢,现在用的开源的爬虫
梅开源
梅开源
@幸福的晚来秋 不记得什么插件,依稀看到过。 爬虫的话看看服务器是什么吧,常用组合搭配一般服务器和语言比较固定。。
幸福的晚来秋
幸福的晚来秋
什么插件啊?求指导,如果想在爬虫里做到断定哪种语言怎么实现啊?
0
小耶果
小耶果

Server: nginx/1.2.8
X-Powered-By: PHP/5.2.17

幸福的晚来秋
幸福的晚来秋
回复 @小耶果 : 就是想做个标识,知道抓取的网站是什么语言开发的,做个统计功能,网上查询有说java开发的有说php的,搞不清了
幸福的晚来秋
幸福的晚来秋
回复 @李马燕 : 看不到啊,我下载插件试过了,看不到什么语言开发的
小耶果
小耶果
回复 @幸福的晚来秋 : 对方server的回馈,但不排除被人为篡改,但一般想故意隐藏且别有目的.连登陆都是login_js.php,后缀都暴露估计没有隐藏的必要.
帖子列表
帖子列表
这两个网站好像都看不到:X-Powered-By
幸福的晚来秋
幸福的晚来秋
这个信息准确吗
0
小耶果
小耶果
发送: 结果代码:0x00000000
GET /login_js.php HTTP/1.1
Host: bbs.chinaunix.net
Connection: keep-alive
Cache-Control: max-age=0
Accept: */*
User-Agent: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.64 Safari/537.31
Referer: http://www.chinaunix.net/
Accept-Encoding: gzip,deflate,sdch
Accept-Language: zh-CN,zh;q=0.8
Accept-Charset: UTF-8,*;q=0.5
Cookie: ndfU_2132_saltkey=DxDSI06U; ndfU_2132_lastvisit=1369112980; ndfU_2132_sid=Rp1o9b; ndfU_2132_lastact=1369117882%09login_js.php%09; __utma=225341893.81510871.1369116575.1369116575.1369116575.1; __utmb=225341893.9.10.1369116575; __utmc=225341893; __utmz=225341893.1369116575.1.1.utmcsr=oschina.net|utmccn=(referral)|utmcmd=referral|utmcct=/question/121401_111693

接收: 结果代码:0x00000000
HTTP/1.1 200 OK
Server: nginx/1.2.8
Date: Tue, 21 May 2013 06:31:40 GMT
Content-Type: text/html; charset=gbk
Transfer-Encoding: chunked
Connection: keep-alive
X-Powered-By: PHP/5.2.17
Set-Cookie: ndfU_2132_sid=oDD4Qq; expires=Wed, 22-May-2013 06:31:40 GMT; path=/
Set-Cookie: ndfU_2132_lastact=1369117900%09login_js.php%09; expires=Wed, 22-May-2013 06:31:40 GMT; path=/
Content-Encoding: gzip
幸福的晚来秋
幸福的晚来秋
第二个能发代码看下吗?
幸福的晚来秋
幸福的晚来秋
额,谢谢了,这个是php了,我刚才登陆试了,后缀是php
0
deleted
deleted

php的应用比较好判断,只是没改编译时的参数, 都是带彩蛋的, 比如...

http://zh.wikipedia.org/wiki/Special:Search?=PHPE9568F34-D428-11d2-A769-00AA001ACF42

http://www.chinaunix.net/index.php?=PHPE9568F34-D428-11d2-A769-00AA001ACF42

linuxsir那个虽然UI有点仿discuz, 但是不是discuz,  也不存在php默认的彩蛋....

幸福的晚来秋
幸福的晚来秋
回复 @勇者天空 : 太神奇了,学习了啊
deleted
deleted
回复 @幸福的晚来秋 : 可能discuz官方改php源代码或者nginx上做手脚滤掉了, 也可能很激进的用了没正式发布的php5.5(5.5在phpinfo里用base64输出图片, 把这个通过url访问的彩蛋给干掉了)
帖子列表
帖子列表
这个好有意思
幸福的晚来秋
幸福的晚来秋
discuz官方网 http://www.discuz.net/index.php?=PHPE9568F34-D428-11d2-A769-00AA001ACF42 没踩到蛋
幸福的晚来秋
幸福的晚来秋
明白了,彩蛋就是放这个参数 出现PHP的logo啊,做的真好啊 ,以后采集的时候加这个参数就知道是不是php了
下一页
0
南湖船老大
南湖船老大

第一个PHP,第二个Java。都散了吧,以我的判断为准

另外,可以看下招聘版块不就清楚了,这才是王道

幸福的晚来秋
幸福的晚来秋
@阿尔法兽 看后缀才是王道
南湖船老大
南湖船老大
回复 @幸福的晚来秋 : .do .action后缀
幸福的晚来秋
幸福的晚来秋
如何断定是java呢?
幸福的晚来秋
幸福的晚来秋
啊,好办法啊,采集网站先采集招聘版块,判断
0
亭舸翁
亭舸翁
其实吧,后缀是php也不能说明就是Php的。
fhp0917
fhp0917
+1
0
没手机的不配发言
没手机的不配发言
黄嘴企鹅 , 被封杀了好几次。 最近又改版?
0
小白小霸王
小白小霸王
看响应头是什么服务器 或许能看出来
返回顶部
顶部