网站地图(站点地图)工具及制作方法

jiayizhen
jiayizhen
jiayizhen
345
文章
2
评论
2019年12月6日19:07:52网站地图(站点地图)工具及制作方法已关闭评论 4,451

网站地图站点地图)工具及制作方法
什么是网站地图
网站地图,又叫站点地图,它就是一个列出了你网站上所有页面地址的清单文件,一般来说分为2种,一种是给搜索引擎看的,一种是给用户看的,前者帮助搜索引擎更好地收录你的网站,后者帮助用户更好的了解你的网站整体结构、更快的找到他们想要找的内容。本文讲的主要是前者。
站点地图格式
一般有3种格式,txt、xml、html,绝大部分情况下都是用xml格式,百度、谷歌都是支持xml格式。下面简单介绍3种格式。
2.1. txt格式
这种格式最简单,一般较少采用,示例如下:

  http://liuxianan.com/
  http://liuxianan.com/link.html
  http://liuxianan.com/msgboard.html

注意事项:
文本文件每行都必须有一个网址。网址中不能有换行。
不应包含网址列表以外的任何信息。
您必须书写完整的网址,包括 http。
每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
文本文件需使用 UTF-8 编码或GBK编码。
2.2. xml格式
示例sitemap.xml如下:

  <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
  <loc>http://liuxianan.com/</loc>
  <lastmod>2016-09-06T00:00:16+08:00</lastmod>
  <changefreq>daily</changefreq>
  <priority>1.0</priority>
  </url>
  <url>
  <loc>http://liuxianan.com/link.html</loc>
  <lastmod>2016-09-06T00:00:16+08:00</lastmod>
  <changefreq>daily</changefreq>
  <priority>0.8</priority>
  </url>
  </urlset>

其中:
loc表示完整网址,必填项,长度不得超过256字节
lastmod表示本网页最后修改时间,必须是ISO-8601时间格式,具体这个格式是什么样的没整清楚,根据我的理解,反正就当成是:yyyy-MM-ddTHH:mm:ss+08:00,最后面的+08:00应该表示的是东八区;
changefreq 表示更新频率,可选值:always、hourly、daily、weekly、monthly、yearly、never
priority 用来指定此链接相对于其他链接的优先权比值,可选值 0.0-1.0,一般来说网站首页1.0,然后二级三级页面依次降低,具体这个属性有多重要不太清楚。
以上4项中,除了loc是必填项之外,其它3个都不是必须的,但最好都写上。
一个sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的sitemap超过了这些限值,请将其拆分为几个小的sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。一个站点支持提交的sitemap文件个数必须小于5万个
下面从 百度站长平台 复制的几项QA:
Q:我提交时填写的周期是什么含义?
A:百度Spider会参考设置周期抓取Sitemap文件,因此请根据Sitemap文件内容的更新(比如增加新url)来设置。请注意若url不变而仅是url对应的页面内容更新(比如论坛帖子页有新回复内容),不在此更新范围内。Sitemap工具不能解决页面更新问题。
Q:Sitemap提交后,多久能被百度处理?
A:Sitemap数据提交后,一般在1小时内百度会开始处理。在以后的调度抓取中,如果您的sitemap支持etag,我们会更频繁抓取sitemap文件,从而及时发现内容更新;否则抓取的周期会比较长。
Q:提交的Sitemap都会被百度抓取并收录吗?
A:百度对已提交的数据,不保证一定会抓取及收录所有网址。是否收录与页面质量相关。
Q:我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩?
A:可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 应该小于 10MB(10,485,759字节)。
Q:XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?
A:不会。sitemap中的priority提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。
Q:网址在 Sitemap 中的位置是否会影响它的使用?
A:不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。
Q:Sitemap中提交的url能否包含中文?
A:因为转码问题建议最好不要包含中文。
2.3. html格式
本小结暂待补充。
2.4. sitemap索引格式
如需提交大量sitemap文件,则可将其列在sitemap索引文件中,然后将该索引文件提交。
因为这个我几乎不会用到,所以懒得研究,有兴趣的参考这里。
如何制作网站地图
可以采用一些第三方工具来制作,也可以自己写个简单的爬虫去爬自己的网站,如果网站内容链接比较单一,也可以自己直接查数据库拼接。
因为我需要网站有内容更新时自动更新网站地图,而且存在多种二级域名,很多第三方工具都无法满足,所以我还是自己来生成比较好。方法就是先将已知的链接放入一个集合,然后再将博客所有列表页面、标签页面、分类列表页面、所有文章链接全部通过查询数据库一次性得到并最终自己拼接字符串生成xml文件,然后放到网站根目录。当然,并不推荐这种做法。
由于我没有找到比较好用的、能满足我需求的生成工具,所以这里就不推荐了,大家有好用的值得推荐的欢迎评论指出。
提交到搜索引擎
生成好后最好还要主动提交给搜索引擎,增加被收录的概率和速度。
4.1. 百度提交站点地图
百度提交sitemap地址:http://zhanzhang.baidu.com/linksubmit/index

网站地图(站点地图)工具及制作方法

网站地图百度提交搜索方法

 

weinxin
扫一扫微信联系我
营销推广问题,请加我微信
jiayizhen
  • 本文由 发表于 2019年12月6日19:07:52
  • 转载请务必保留本文链接:http://www.heiweite.com/9432.html
站内优化之flash优化以及网站地图的优化方法 seo优化

站内优化之flash优化以及网站地图的优化方法

站内优化之flash优化以及网站地图的优化方法 1、flash的优化 现在还是有很多网站采用flash的形式来建站,尤其是一些知名大品牌的官方企业站点,这样的网站虽然好看但不利于蜘蛛爬行和抓取,这些技...
百度统计异步代码与同步代码、统计后台的垃圾广告 seo优化

百度统计异步代码与同步代码、统计后台的垃圾广告

最近看到很多关于统计后台代码安装问题与统计到的全部是垃圾广告问题,同时我自己网站也遇到这样问题,果断百度,下定决心把他解决掉   怎么屏蔽网站统计后台的垃圾广告?(下面的方法转账至网络(学做...
网站被黑或K权重恢复的操作方法 seo优化

网站被黑或K权重恢复的操作方法

站点被黑或K权重恢复的操作方法 网站被黑之后,或多或少都要受到影响,严重的甚至K站。这时我们的处理步骤就显得极为重要了: 1、有被安全联盟提示风险的网站,需先去申请解封 被安全联盟检测到网站被黑之后,...