谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕

来源: 投稿
2024-05-30 11:34:00

谷歌今年 3 月 27 日不小心将其部分内部 API 文档发布到 GitHub 上,直到 5 月 7 日才被删除。这些内部文件披露了 Google 搜索引擎相关的敏感信息。

据市场和受众研究公司SparkToro在官网博客发布的文章,本次泄露文档中的部分内容与谷歌公开表态的信息以及2023年的美国司法部起诉谷歌的反垄断案件中的证词相矛盾。比如,谷歌曾一再否认使用点击导向的排名机制,否认子域名在排名中被单独考虑,否认收集或考虑域名的年限等等。但泄露文档证实,这些因素都是谷歌搜索引擎排名机制中的一环。

此次泄露的谷歌搜索API文档共计2500余页,共包含14014个属性特征。这些文档据称是谷歌内部“Content API Warehouse”的一部分,并在代码托管平台GitHub上不慎公开了一段时间。

博客作者Rand Fishkin在多位前谷歌员工的沟通中确认,泄露的文档具备谷歌内部API文档的特征。Rand Fishkin与和技术SEO(搜索引擎优化)专家Mike King进行交流,并再次验证了这些文档的真实性。

这些文档的泄露可能对搜索营销领域产生深远的影响,因为它们提供了对谷歌搜索引擎内部工作机制的前所未有的洞察,包括它如何使用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量来影响搜索结果排名。

谷歌今天已证实被泄露的2500份内部文件是真实的,文件中详细描述了该公司收集的数据。在此之前,谷歌一直拒绝对这些材料发表评论。

谷歌发言人戴维斯-汤普森(Davis Thompson)在一封电子邮件中表示:"我们提醒大家不要根据断章取义、过时或不完整的信息对搜索做出不准确的假设。我们已经分享了有关搜索如何工作以及我们系统权衡的因素类型的大量信息,同时也在努力保护我们结果的完整性,使其免受操纵。"

详情查看:https://sparktoro.com/blog/

展开阅读全文
点击加入讨论🔥(5) 发布并加入讨论🔥
5 评论
1 收藏
分享
返回顶部
顶部