分享好友 最新动态首页 最新动态分类 切换频道
百度Sitemap格式-百度站点地图格式
2024-12-29 18:29

百度Sitemap支持哪些格式

百度Sitemap格式-百度站点地图格式

百度Sitemap协议支持文本格式和xml格式,可以根据自己情况来选择任意一种格式组织sitemap。具体格式说明及示例如下

格式一:txt文本格式

在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过搜索资源平台进行提交    
http://www.oseo.cn/a/60.html
http://www.oseo.cn/a/61.html

http://www.oseo.cn/a/62.html

此文本文件需要遵循以下指南:
· 文本文件每行都必须有一个网址。网址中不能有换行。
· 不应包含网址列表以外的任何信息。
· 您必须书写完整的网址,包括 http。
· 每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
· 文本文件需使用 UTF-8 编码或GBK编码。

格式二:xml格式

单个xml数据格式如下:
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8编码-->
<urlset>
<!--必填标签-->
    <url>
        <!--必填标签,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面,这是必须的 -->
        <loc>http://www.yoursite.com/yoursite.html</loc>
        <!--必填,URL链接地址,长度不得超过256字节-->
        <lastmod>2009-12-14</lastmod>
        <!--可以不提交该标签,用来指定该链接的最后更新时间-->
        <changefreq>daily</changefreq>
        <!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 -->
        <priority>0.8</priority>
        <!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间-->
    </url>
    <url>
        <loc>http://www.oseo.cn/skill.html </loc>
        <lastmod>2010-05-01</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>
上述Sitemap向百度提交了一个url:http://www.oseo.cn/skill.html 


若有多条url,按照上述格式重复<url></url>之间的片断,列明所有url地址,打包到一个xml文件,向搜索资源平台进行提交。


创建sitemap注意事项

第一,一个Sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的Sitemap超过了这些限值,请将其拆分为几个小的Sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。

第二,一个站点支持提交的sitemap文件个数必须小于5万个,多于5万个后会不再处理,并显示“链接数超”的提示。    

第三,如果验证了网站的主域,那么Sitemap文件中可包含该网站主域下的所有网址。

第四,搜索资源平台sitemap文件提交已不再支持索引型文件形式,历史提交的索引型文件已不再进行抓取,建议站长及时删除,重新进行资源提交。


如何提交Sitemap

第一步,将需提交的网页列表制作成一个Sitemap文件,文件格式请阅读百度Sitemap协议都支持哪些格式。
第二步,将Sitemap文件放置在网站目录下。比如您的网站为example.com,您已制作了一个sitemap_example.xml的Sitemap文件,将sitemap_example.xml上传至网站根目录即example.com/sitemap_example.xml
第三步,登录百度搜索资源平台,确保提交Sitemap数据的网站已验证归属。
第四步,进入Sitemap工具,点击“添加新数据”,文件类型选择“URL列表”,填写抓取周期和Sitemap文件地址
最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。


什么是移动Sitemap协议,如何提交Sitemap协议

百度推出了移动Sitemap协议,用于将网址提交给移动搜索收录。百度移动Sitemap协议是在标准Sitemap协议基础上制定的,增加了<mobile:mobile/>标签,它有四种取值:
<mobile:mobile/> :移动网页
<mobile:mobile type="mobile"/> :移动网页      
<mobile:mobile type="pc,mobile"/>:自适应网页
<mobile:mobile type="htmladapt"/>:代码适配

无该上述标签表示为PC网页

下方样例相当于向百度移动搜索提交了一个移动网页:http://m.example.com/index.html,向PC搜索提交了一个传统网页:http://www.example.com/index.html,同时向移动搜索和PC搜索提交了一个自适配网页http://www.example.com/autoadapt.html:
<?xml version="1.0" encoding="UTF-8" ?> 
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/"> 
<url> 
<loc>http://m.example.com/index.html</loc> 
<mobile:mobile type="mobile"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
<url> 
<loc>http://www.example.com/index.html</loc>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
<url> 
<loc>http://www.example.com/autoadapt.html</loc> 
<mobile:mobile type="pc,mobile"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
<url> 
<loc>http://www.example.com/htmladapt.html</loc> 
<mobile:mobile type="htmladapt"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
</urlset>

按照移动Sitemap协议做好Sitemap后,在Sitemap工具点击添加新数据提交,与提交普通Sitemap方式一致。


常见问题

1、我提交时填写的周期是什么含义?

百度Spider会参考设置周期抓取Sitemap文件,因此请根据Sitemap文件内容的更新(比如增加新url)来设置。请注意若url不变而仅是url对应的页面内容更新(比如论坛帖子页有新回复内容),不在此更新范围内。Sitemap工具不能解决页面更新问题。

2、Sitemap提交后,多久能被百度处理?

Sitemap数据提交后,一般在1小时内百度会开始处理。在以后的调度抓取中,如果您的sitemap支持etag,我们会更频繁抓取sitemap文件,从而及时发现内容更新;否则抓取的周期会比较长。

3、提交的Sitemap都会被百度抓取并收录吗?

百度对已提交的数据,不保证一定会抓取及收录所有网址。是否收录与页面质量相关。

4、XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?

不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。

5、网址在 Sitemap 中的位置是否会影响它的使用?

不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。

6、Sitemap中提交的url能否包含中文?

最新文章
AI模型变身文豪:“看懂”新闻报道,命名图片更有文采
智东西5月21日消息,“一只狗在叫”、“一个男人坐在长凳上”,这是AI模型自动为新闻图片生成的标题,这些标题看起来更像是学生习作,而不是专业记者的文笔。尽管目前已经有许多自动生成图片标题的AI模型,
AI智能写作助手小程序:一键,全面覆自动写作需求与指南
在数字化时代的浪潮中人工智能技术正以前所未有的速度改变着咱们的生活。文字创作领域也不例外智能写作助手小程序应运而生,为广大创作者带来了革命性的便利。这款小程序不仅可以一键生成文章、报告、简历等多种文本,还能全面覆自动写作的
AI配音:一种新型的语音创作工具
在当今数字化的世界中,人工智能(AI)正在不断地改变我们的生活和工作方式。其中,AI配音就是一种由AI技术驱动的新型语音创作工具。它为视频制作、广告宣传、教育娱乐等领域提供了全新的声音表达方式。本文将详细介绍AI配音的概念、应用场
AIGC|利用大语言模型实现智能私域问答助手
目录 一、模型选择 二、向量数据库 三、LangChain 四、总结 随着ChatGPT的爆火,最近大家开始关注到大语言模型(LLM)这个领域。像雨后春笋一样,国内外涌现出了很多LLM。作为开发者,我们通常会关注LLM各自
03-分布式链路追踪系统简介
APM系统:即应用性能管理。 早期APM工具功能比较单一,主要监控CPU使用率,I/O,内存资源,网速等网络基础设施,后来随着中间件技术不断发展,APM也开始监控缓存,数据库,MQ等各种
C语言课程设计——航班信息管理系统
身份验证信息遍历查找航班信息编辑航班信息整理信息顺序预订航班通过此系统可以实现如下功能:(1):管理员用户可以录入航班情况,数据存储在一个数据文件中;(2):可以查看某一
2024年《财富》世界500强排行榜揭晓
排名公司名称国家1沃尔玛美国2亚马逊美国3国家电网有限公司中国4沙特阿美公司沙特阿拉伯5中国石油化工集团有限公司中国6中国石油天然气集团有限公司中国7苹果公司美国8联合健康集团美国9伯克希尔-哈撒韦公司美国10CVS Health公司美国11大
3. 数据库安全及备份恢复
身份鉴别b)操作系统和数据库系统管理用户身份标识应具有不易被冒用的特点,口令应有复杂度要求并定期更换;整改方法:修改配置策略:f)应采用两种或两种以上的组合的鉴别技术对管理用户进行身份鉴别。••访问控制a)应启用访问控制功能,依
Adobe Illustrator制作素描效果详解:从图片到文字的全方位教程
在数字艺术的世界里,Adobe Illustrator无疑是一款强大的图形设计工具它不仅可以制作精美的矢量图形,还能通过一系列技巧实现令人惊叹的艺术效果。素描效果作为其中的一种,可以使图片呈现出一种独有的艺术魅力。本文将为您详细介绍怎样采
2015年增加网站外链的方法总结
做网站优化的都知道,外链为王,内链为皇,从这句话中可以看出,外链对网站优化的重要性。外链是网站推广重要的一个部分,外链的多少和质量等同于你网站的知名度。但获得大量外链不是一两天能搞定的,只有持之以恒才会有一定量外链。因此对
相关文章
推荐文章
发表评论
0评