祈雨其雨

壬旦至食日不雨?壬旦至食日其雨?食日至日外不雨?食日至日外其雨?外日至廓兮不雨?外日至廓兮其雨?

Robots协议不是重复网页保护伞

几个月前接受某个项目的时候,发现该项目网站普遍存在采集文章栏目。当时嘱咐负责的优化修改,对方竟然回我一句“用robots屏蔽了”,很固执地拒绝修改。今天又看到有人建议用robots.txt文件屏蔽一部分重复性质网页内容或者相似度很高网站内容,同时还可以屏蔽服务器中存放那些视频文件和图片文件,好像这样就能避免搜索引擎惩罚、降低网站带宽资源消耗,真是异想天开。

百度算是比较严格执行robots协议的,除了偶尔发现的一些标明“由于该网站的robots.txt文件存在限制指令,系统无法提供该页面的内容描述”字样的首页链接,再找不到其他明显与协议相悖的收录信息。但百度蜘蛛是否严格遵守了协议规则,坚决不爬任何协议禁止的目录呢?

阅读全文>>

北宫嬛于2013-3-30 22:43 Saturday  已有2626次浏览 0条评论
利用百度索引补全机制提高收录

有关百度搜索引擎规则索引机制的话题几乎没怎么见过网上讨论,大家关注比较多的是索引量这类结果展现,至于导致结果的原理过程,多半处于只能意会不能言传的状态。百度搜索研发部有一个介绍索引页链接补全机制的帖子,大意是说百度蜘蛛定期检查网站的索引列表,交叉比对前后两次抓取结果中相同和不同的部分。表面上和如何提高网站收录没有直接关系,仔细看还是能摸出点门道的。

如果没看懂的话,我来举个例子:某索引列表原有GHIJK这五条资源以及翻页块若干,更新后变成DEFGH这五条资源和翻页块,百度蜘蛛就会把ED当成新资源;如果更新后变成ABCDE,就会顺着翻页块提供的链接路径进入翻页序列,不仅把ABCDE作为新增资源收录,还会将翻页序列中的F也收录进来。

阅读全文>>

北宫嬛于2013-3-27 22:43 Wednesday  已有2424次浏览 2条评论
过去的低质量文章不能不处理了

手头上有个站,建起来几个月了,首页在百度上的排名越来越高,可内页一直没有收录。说没有收录也不完全对,百度索引量蛮多的,就是不放快照。其他诸如谷歌、搜搜、搜狗、360的收录都挺正常。光靠首页排名再好能有多少流量呢,每天的独立IP数量围绕10上下波动,绝大部分搜索词都是核心的医院词。同一个项目,原先在百度搜索第一页第一位的某个网站这周被降权到看不见,不想办法增加内页收录真的不行了。

调取网站日志查看,每天来访的百度蜘蛛是123.125.71.*这个IP段,优化行业内部解释是“抓取非原创或采集类文章的内页,权重较低,爬过此段的内页文章不会很快放出来”,被降权的那个和现在这个只有首页收录的网站都是这个IP段,真是太糟糕了。

阅读全文>>

北宫嬛于2013-3-2 23:23 Saturday  已有2672次浏览 4条评论
面向搜索引擎的网站设计技巧

如此庞大的命题绝非我本意,当时正在为今天给百度交啥作业而纠结,忽见某应届毕业生求助《面向搜索引擎的网站设计技巧》论文两万字初稿写作方法,灵机一动拿来用用。也不是白拿来用的,我也给了这位同学很有用的写作建议:两步走写毕业论文,第一步采集,第二步伪原创。

言归正传,说回网站设计上。既然是面向搜索引擎,网站代码是否能被搜索引擎蜘蛛快速读取、顺利掌握重要信息是设计的核心要求。如何实现?百度官方推出的《百度搜索引擎优化指南白皮书》将搜索引擎优化流程划分为前期准备(域名、服务器、空间)、优化建设(收录、排名、展现)、网站运营(转化率、流量分析、网站信任度、用户忠诚度)三大块,最后还谈到搜索引擎优化作弊与惩罚、网站安全维护。

阅读全文>>

北宫嬛于2013-1-5 23:00 Saturday  已有2807次浏览 5条评论
尝试百度搜索框刺激百度蜘蛛

如果方便的话建议大家给自己的优化站安装百度搜索框,可以刺激百度蜘蛛哦。今天一整晚都花在这上面,给西安妇科医生在线的所有页面都嵌入了百度搜索框,当然是支持站内搜索的版本。这样获得的搜索结果和“site:域名 关键词”一样,但是显示的搜索词就只是关键词本身,个人认为是一种增加有效搜索词的方法。下面把百度官方提供的搜索框代码优化了一下,喜欢的可以自取。

考虑到每个网站的模板风格各不相同,嵌入搜索框的样式也不一样,这里就不提供css样式表了。文内有西安妇科医生在线首页的百度搜索框截图。傲游浏览器和IE6浏览器彼此兼容性不太妙,特别是在调整button样式时往往无法兼顾。难怪强大的UI们都喜欢用图片覆盖整个按钮,非常明智的做法。

阅读全文>>

北宫嬛于2013-1-4 23:48 Friday  已有2861次浏览 3条评论
导出外链让蜘蛛来回狂窜吧!

网站排名持续好转,流量持续上升,然而预约、到院的人一个也没有,这究竟是为神马为神马!利用百度统计提供的权限账户管理功能,让组员把所有网站的统计报表分享到我的统计账户里,每天刷着三十多个网站报表那叫一个烦躁,搜索核心关键词过来的用户很多,但是搜索长尾关键词过来的用户少得可怜。

还有那个莫名其妙的百度siteapp把所有的内部链接全部重新转码,包括咨询页面也转码了。每天面对统计工具中不断增加的访客量和永远是零蛋的咨询量我的心都在滴血好吗!刚才把帮助文档和常见问题页面仔仔细细读过去,终于确认只有内部链接才会转码,至于外链“将以新窗口的形式打开”。经过测试确实如此,于是目前西安妇科医生在线被我加了全站nofollow外链指向另一个优化站的咨询页面。

阅读全文>>

北宫嬛于2012-12-18 23:51 Tuesday  已有2523次浏览 4条评论
快照描述和301重定向的疑义

明天又是星期四,今天给组员布置了修改网页头部信息的任务,酝酿一天明天正式动手刺激百度蜘蛛。通过最近一段时间的观察中发现,site新站域名得到的首页快照描述文字一般情况下都是网页中最具个性特色的部分,有时候是description描述,有时候是头部导航信息,有时候是侧边栏日期……“最原创”到这份儿上真是不好意思,还是早早改过来的好,改好了还能提升搜索引擎抓取效率。

最近听闻关于301重定向的两则案例。,都是网站从老域名重定向到新域名。一个是没有百度快照但是蜘蛛经常来爬的旧域名,重定向后百度很快放出新域名快照,索引量稳步增长;另一个老域名早有大量快照放出,重定向后老域名快照减少索引量下跌,新域名虽有收录却一直停滞不前。

阅读全文>>

北宫嬛于2012-11-28 23:32 Wednesday  已有2900次浏览 5条评论
做好前期准备刺激百度蜘蛛

早上到公司打开电脑一看,果不其然昨晚的更新收录都被百度拔毛了,经验人士表示这是网站开始正常收录前的必经阶段,所以我也淡定……淡定个头淡定!百度贴吧再次强化审核规则,昨天还能发的顶级域名今天全部遭秒删,更气人的是就在我放弃发百度贴吧外链准备专心改网站模板的当口,公司所在办公楼的电压器坏掉了,这场大停电一直持续到下午三点,原先预定的计划几乎都没完成。

给那么多半死不活的网站改版,一个月下来也总结了一些心得。本人手里没有够称得上精品的网站,半死不活的倒占了绝大部分,因此网站改版的主要目的是刺激百度蜘蛛抓取收录,改动方向自然是怎么“刺激”怎么来,不怕改完即刻被K,就怕改完蜘蛛依旧视而不见。

阅读全文>>

北宫嬛于2012-11-23 23:43 Friday  已有2911次浏览 10条评论
百度真爱:空白过期错误页面

规规矩矩更新内容、添加友情链接的网站持续被百度下压,暂时关闭的503页面、错误或者过期的404页面以及空空荡荡没有一篇文章的白板网站居然占据着搜索引擎排名前几页。这两个月来公司QQ群内哀嚎、暴走不断,有些人依然寄希望于百度哪天大发慈悲放医疗SEO一条生路,有些人则坚信情势只会越来越恶劣。大家观点没法统一,可都得在这行坚持干下去,真是悲了个催的。

同事手上有那么一个很神奇的网站,每每卸除域名解析就能获得百度放出来的快照,一旦把域名解析重新做好,百度快照就会不翼而飞,难道这年头就连无法连接的网站都比正常维护更新的网站受百度欢迎啦?果然真爱是不需要理由的,空白、过期、错误页面就是百度的真爱啊比真金还要真的真爱啊口胡!

阅读全文>>

北宫嬛于2012-11-21 22:43 Wednesday  已有2892次浏览 6条评论
奇妙的百度移动搜索标注协议

百度移动搜索标注协议效果图在群里抱怨百度SiteApp功能太过“傻瓜”只能编辑首页无法修改内页遭到同时反驳,对方建议我研究一下百度的移动搜索优化标注协议,据说通过标注可以让百度移动搜索自动识别网页上哪些元素需要展现、哪些元素需要隐藏。虽然从没接触过但是好像很有趣的样子,通过同事提供的链接进入顺利摸到《百度标注协议使用白皮书》下载地址。

这里抱怨一下百度的抠门,移动搜索标注协议代码居然是用图片形式展示,无法直接复制粘贴使用。没办法我只好对着屏幕做手敲党,其间不小心敲错某些语句导致标注失败。幸好及时改正,现在把基本的移动搜索标注协议代码放出来……非常奇妙的。

阅读全文>>

北宫嬛于2012-11-13 23:00 Tuesday  已有4112次浏览 2条评论