当前位置: 首页 » SEO » SEO技术 » 正文

杭州seo公司

放大字体  缩小字体 发布日期:2022-07-13 20:36:20  来源:杭州seo公司  作者:dan  浏览次数:139
核心提示:杭州seo公司-【专家专栏】链接提交-js代码推送进化版–转载很多seo从业人员每天都会关注百度搜索引擎蜘蛛的动向,因为这里

杭州seo公司-【专家专栏】链接提交-js代码推送进化版–转载

很多seo从业人员每天都会关注百度搜索引擎蜘蛛的动向,因为这里牵扯到网站的收录及不及时的作用。百度蜘蛛在抓取网站时其实就像一个流量用户来访问网站是一个意思,所以也有相匹配的IP地址,今天转载一篇百度搜索资源平台2020年5月19日发布的关于识别百度蜘蛛的技巧,正文部分如下:

>

经常听到开发者问,百度蜘蛛是什么?最近百度蜘蛛来的太频繁服务器抓爆了!最近百度蜘蛛都不来了怎么办?还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但IP地址范围动态变化不固定,我们无法对外公布。

那么如何才能识别正确的百度蜘蛛呢?今日干货带你轻松两步正确识别百度蜘蛛:

一、查看UA信息如果UA信息不对,可以直接判断为非百度搜索的蜘蛛。目前UA分为移动、PC、和小程序三个应用场景,这三个渠道UA分别如下:

移动UA:

Mozilla/5.0(Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Geck(杭州seo公司)o)Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)

PC UA:

Mozilla/5.0(compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

Mozilla/5.0(compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

小程序UA:

Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)

二、双向DNS解析认证

第一步:DNS反查IP

开发者通过对日志中访问服务器的IP地址运行反向DNS查找,判断某只spider是否来自百度搜索引擎,Baiduspider的hostname以.baidu.com或.baidu.jp 的格式命名,非.baidu.com或.baidu.jp即为冒充。

根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:

1).在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。

2).在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析ip,来判断是否来自Baiduspider的抓取。

3).在macos平台下,您可以使用dig命令反解ip来判断是否来自Baiduspider的抓取。打开命令处理器输入dig -x xxx.xxx.xxx.xxx(IP地址)就能解析ip,来判断是否来自Baiduspider的(杭州seo公司)抓取。

第二步:对域名运行正向DNS查找

对第一步中通过命令检索到的域名运行正向DNS查找,验证该域名与您日志中访问服务器的原始IP地址是否一致,IP地址一致可确认spider来自百度搜索引擎,IP地址不一致即为冒充。

示例1:

host 111.206.198.69

69.198.206.111. in-addr.arpa domain name pointer baiduspider-111-206-198-69.crawl.baidu.com.

host baiduspider-111-206-198-69.crawl.baidu.com

baiduspider-111-206-198-69.crawl.baidu.com has address 111.206.198.69

原文链接地址:https://ziyuan.baidu.com/college/articleinfo?id=2855

杭州seo公司-SEO相关(1)

在网站seo优化技术操作当中,内链优化是一个非常重要的网站优化环节。今天为朋友们分享关于首页seo内链优化的规则是怎样的,一般来说首页内链优化需要遵循固定优先和活跃优先两个方面的原则,具体解析如下:

1、固定优先

对于网站的首页来说,只有更新内容的时候,首页链接才会出现相应的变化。也就是说把更新的最新内容布局在首页的一个位置,只有这一个位置是根据网站更新内容在变动的。其他首页布局要固定下来,首页内链固定原则是根据针对用户需求的先后顺序来进行排列的。用户需求的主次顺序一般为从上到下,从左到右进行合理的布局,把用户最大的需求内容放在首要位置。

2、活跃优先

对于活跃优先的概念可能很多朋友还不是很理解,其实(杭州seo公司)活跃优先是要根据网站流量的数据分析得出来的。比如把用户浏览量最多的网站内容页,放在首页的主要位置。当然很多时候浏览量多只是其中的一个主要因素,衡量活跃度的因素还有用户最大需求、用户最新需求、内页排名最好、内页关键词与首页关键词的相关性等等众多因素所决定的。

对于首页seo内链优化规则的活跃优先原则,是要建立在有一定流量的基础之上才可以进行seo技术操作的,也就是说针对网站关键词有了一定的排名,根据百度统计工具来对网站流量进行详细的分析,所得出的受众最高的网站内页,并把这些网站内容合理的布局到网站首页内链当中。

不管是固(杭州seo公司)定优先还是活跃优先,主要目的还是为了合理的布局网站首页内链,从而使得网站首页获得更好的权重得分。在之后的博文当中,小凯会继续和朋友们分享关于网站栏目页和详情页的内链优化规则,希望朋友们多多关注。

杭州seo公司-SEO相关(2)

今天转载一篇来自百度站长平台最新发布的关于链接提交中的JS代码推送的内容,针对百度站长平台提供链接索引的自动提交JS脚本的进化版的发布。正文部分如下:

百度站长平台提供链接索引的自动提交JS脚本已经有一段时日了。用百度自己的话讲:JS链接推送代码以网页为最小对象,服务于全平台多终端,PC站和移动站均可使用。安装代码的页面在任意平台(浏览器、微信、微博)被加载时,页面链接会被第一时间推送给百度,从而提高站点新内容的发现速度。

是不是很神奇?我们再来回顾一下,这代码长成这样:

(百度JS链接推送代码)

只要把这段代码放入你的每个页面中,每当用户访问这些页面时,就会通过这段脚本从百度下载一个1×1的gif,同时记录页面此时此刻的URL地址。

自动推送脚本的性能考虑

通过这段脚本我们可以看出:

1、它先是判断了目前的协议类型是https还是其他类型(如,http,ftp等)

2、然后下载了百度官方的一个js文件

3、再然后它将js文件的内容生成一个脚本块插入到当前页面中

4、最后会运行这个脚本块

我们可以访问这两个js文件查看其内容,也就是短短的一行。它会读取这样一个gif。

https://sp0.baidu.com/9_Q4simg2RQJ8t7jm9iCKT-xh_/s.gif 或者http://api.share.baidu.com/s.gif

同时将window.location.href等信息推送给了百度。

这里我们可以发现两个问题:

其一是(杭州seo公司)这段脚本先后会调用两个百度资源,这造成了冗余,不利于页面加载速度。

其二是该脚本会提交目前URL,但是许多URL会是动态URL,会带各种参数。虽然百度爬虫也有自己的判断方法,但无疑这增加了其负担。

于是,为了解决这两个问题,笔者咨询了好友柴云翔同时是前端开发的大牛。在大牛的帮助下,我们有了下面这个改良版本。

改良版本的百度索引自动推送脚本

这个改良的脚本长下面这样,如果你对js一窍不通,那么请用下图<script>…</script>部分(行6~30)替换原来百(杭州seo公司)度官方的代码。

(改进后的百度索引链接自动提交脚本)

在上图中已加入了注释,下面开始代码解说。

这个新脚本的作用是多了一步查看页面的canonical URL的步骤。我们知道canonical属性表示该页面纵有千种URL的花样,请搜索引擎只认准href中给出的URL值。这样一来就不会让搜索引擎为了同一个页面(或许已经索引了)多次检查你的推送页面具体内容。

这个新脚本的另一个更改是直接将上述两个js的内容拿了出来。由于这两个js中的代码其实是静态的,每次都去调用并不必要。另一方面,我们需要对r的值进行更改,将它更改为canonical URL的值,因此这样解决了我们上面的第二个问题。

最后,一点感想

自动推送是一个很实用的方法,它门槛低,容易部署,但是也有一些小问题。本文只是提供了一种方法来改进自动推送的效率和效果。

需要注意的是百度随时可能更新这两个js文件的内容,虽然该功能上线后一直没有更新不代表以后不会更新,因此需要手动及时更新代码。

转载内容地址:http://zhanzhang.baidu.com/college/articleinfo?id=1587

声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有误,请联系我们修改或删除。
 

关键词: 杭州seo公司
 
推荐图文
最新热点文章