当前访客身份:游客 [ 登录 | 加入 OSCHINA ]

代码分享

当前位置:
代码分享 » PHP  » 网页设计与交互
首席xx师

php 获取百度的热词数据

首席xx师 发布于 2012年02月16日 18时, 18评/2845阅
分享到: 
收藏 +0
1
获取百度的热词数据
标签: 百度

代码片段(1) [全屏查看所有代码]

1. [代码]获取百度的热词     跳至 [1] [全屏预览]

/**
 * 获取百度的热词
 * @user   小杰
 * @from   http://www.isharey.com/?p=354
 * @return array  返回百度的热词数据(数组返回)
 */
function getBaiduHotKeyWord()
{
    $templateRss = file_get_contents('http://top.baidu.com/rss_xml.php?p=top10');
    If (preg_match('/<table>(.*)<\/table>/is', $templateRss, $_description)) {
        $templateRss = $_description [0];
        $templateRss = str_replace("&", "&amp;", $templateRss);
    }
    $templateRss = "<?xml version=\"1.0\" encoding=\"GBK\"?>" . $templateRss;
    $xml = simplexml_load_String($templateRss);
    foreach ($xml->tbody->tr as $temp) {
        if (!empty ($temp->td->a)) {
            $keyArray [] = trim(($temp->td->a));
        }
    }
    return $keyArray;
}


开源中国-程序员在线工具:Git代码托管 API文档大全(120+) JS在线编辑演示 二维码 更多»

发表评论 回到顶部 网友评论(18)

  • 1楼:yinin 发表于 2012-02-17 08:50 回复此评论
    要的
  • 2楼:野草 发表于 2012-02-17 11:14 回复此评论
    有什么用?
  • 3楼:yuyang 发表于 2012-02-18 22:01 回复此评论
    file_get_content();用来获取数据这个存在很大隐患,数据异常的时候容易拖死线上服务...
    不建议用
  • 4楼:首席xx师 发表于 2012-02-19 22:57 回复此评论
     呵呵,我一般用curl的,这里只是少写些代码
  • 5楼:雷志伟 发表于 2012-02-21 13:11 回复此评论
    IP很容易被屏掉的吧.
  • 6楼:首席xx师 发表于 2012-02-21 14:06 回复此评论

    引用来自“ZhiWei”的评论

    IP很容易被屏掉的吧.
    一天能抓得了几次啊,呵呵,不可能一天抓取上百次吧
  • 7楼:无壳蜗牛 发表于 2012-02-21 15:49 回复此评论
    我写的php,自定义的函数,除个别外,一律返回值为bool,其他返回放在引用参数。
  • 8楼:雷志伟 发表于 2012-02-21 17:44 回复此评论

    引用来自“和谐王”的评论

    引用来自“ZhiWei”的评论

    IP很容易被屏掉的吧.
    一天能抓得了几次啊,呵呵,不可能一天抓取上百次吧
    一天抓几次? 那没有实际的应用价值了.
  • 9楼:首席xx师 发表于 2012-02-21 17:47 回复此评论

    引用来自“ZhiWei”的评论

    引用来自“和谐王”的评论

    引用来自“ZhiWei”的评论

    IP很容易被屏掉的吧.
    一天能抓得了几次啊,呵呵,不可能一天抓取上百次吧
    一天抓几次? 那没有实际的应用价值了.
    因为一天的热词波动不是很大的,一天3个时段抓取感觉就足够了
  • 10楼:首席xx师 发表于 2012-02-21 17:49 回复此评论

    引用来自“ZhiWei”的评论

    引用来自“和谐王”的评论

    引用来自“ZhiWei”的评论

    IP很容易被屏掉的吧.
    一天能抓得了几次啊,呵呵,不可能一天抓取上百次吧
    一天抓几次? 那没有实际的应用价值了.
    呵呵,实际应用时结合其他比如搜狗等等一起来结合使用的
  • 11楼:雷志伟 发表于 2012-02-21 17:54 回复此评论

    引用来自“和谐王”的评论

    引用来自“ZhiWei”的评论

    引用来自“和谐王”的评论

    引用来自“ZhiWei”的评论

    IP很容易被屏掉的吧.
    一天能抓得了几次啊,呵呵,不可能一天抓取上百次吧
    一天抓几次? 那没有实际的应用价值了.
    呵呵,实际应用时结合其他比如搜狗等等一起来结合使用的
    嗯, 应用不同, 需求不同吧.

    我想要一只一天可以抓上万次的... 苦于经常被封IP. 用代理又太无聊.
  • 12楼:首席xx师 发表于 2012-02-21 18:02 回复此评论

    引用来自“ZhiWei”的评论

    引用来自“和谐王”的评论

    引用来自“ZhiWei”的评论

    引用来自“和谐王”的评论

    引用来自“ZhiWei”的评论

    IP很容易被屏掉的吧.
    一天能抓得了几次啊,呵呵,不可能一天抓取上百次吧
    一天抓几次? 那没有实际的应用价值了.
    呵呵,实际应用时结合其他比如搜狗等等一起来结合使用的
    嗯, 应用不同, 需求不同吧.

    我想要一只一天可以抓上万次的... 苦于经常被封IP. 用代理又太无聊.
    那你这个需求跟程序无关吧,抓哪个网站都一样,太频繁都会被封ip
  • 13楼:言会咸 发表于 2012-02-22 19:56 回复此评论
    注释里的网址很给力哦!
  • 14楼:首席xx师 发表于 2012-02-23 22:55 回复此评论

    引用来自“言会咸”的评论

    注释里的网址很给力哦!
    嘿嘿,谢谢
  • 15楼:言会咸 发表于 2012-02-26 20:16 回复此评论

    引用来自“和谐王”的评论

    引用来自“言会咸”的评论

    注释里的网址很给力哦!
    嘿嘿,谢谢
    哈哈,我会经常光顾的
  • 16楼:首席xx师 发表于 2012-02-27 10:37 回复此评论

    引用来自“言会咸”的评论

    引用来自“和谐王”的评论

    引用来自“言会咸”的评论

    注释里的网址很给力哦!
    嘿嘿,谢谢
    哈哈,我会经常光顾的
    重新找虚拟主机中.现在打不开,嘿嘿
  • 17楼:flychina 发表于 2012-03-26 22:59 回复此评论
    应该增加链接、热度、类别等其他相关参数才好。
  • 18楼:韦文灵 发表于 2015-10-12 15:02 回复此评论
     visit count over limit、这个问题能解决不?
开源从代码分享开始 分享代码
首席xx师的其它代码 全部(5)...