如何构建SEO关键词资源库
所谓的关键词资源库,指的是一个网站在搜索引擎中从首页第一位至第五十位的搜索关键词排名。通常构建SEO关键词资源库的方法包括以下几点:
1、运用多种关键词挖掘工具,如主词、长尾词的挖掘,并建立分类表格,目前常用的工具有:站长工具、5118、爱站网、词库网、百度关键词规划师、百度下拉、搜索相关关键词等。
2、根据网站的具体情况,将指数较高的关键词放置于首页,一般3至5个,然后将分类好的关键词自然分布到栏目页、内页等。
3、关键词资源库的建立,需要通过后期不断优化,将站内各关键词从排名100名之外提升至首页排名一至五十名以内,从而形成关键词资源库。
如何运用聚合页和关键词资源库提升SEO流量
对于大中型网站的SEO工作,人工分类仅能解决中短尾词的着陆页需求,可能形成分类列表,也可能制作专题页以抢占关键词排名。
然而,对于大量的长尾搜索需求,该如何覆盖呢?
常规做法是制作长尾词聚合页。
聚合页是什么?
以阿里巴巴产品聚合页为例:
通过关键词在站内搜索出一些结果,制作成SEO友好的静态化页面。
聚合页面之间需要建立内链,并在网站高权重页面增加索引入口,以加快收录,从而获得大量长尾流量。
这种做法对于B2B和分类信息网站来说都是常用手段。
搜索引擎也会不时打击此类页面类型,但如果网站内容丰富,搜索相关性合理,内容足以支撑页面,这种优化方法仍需进行。
关键词资源库搭建
由于聚合页是由大量长尾关键词自动生成,因此关键词资源库的质量直接影响到搜索流量。
如何获取大量长尾词?
使用金花关键词工具、战神关键词工具、5118关键词拓展等工具,可以获取大量长尾关键词,以便于后续的研究分析。
关键词资源库清洗
虽然可以通过第三方工具获取大量关键词,但需要进行数据清洗,如过滤违法词,或对关键词进行文本分析、替换或删除。
如果关键词量巨大,动辄百万甚至千万,常规的文本编辑器难以处理时(如sublime、editplus等),需要利用编程手段辅助处理,或使用Linux下的强大文本处理指令,如Sed或Awk。这些工具在Mac上也是默认支持的。
例如,从300万词中提取纯关键词,不包含地区名(主要是城市名)、不包含“供应”、“价格”、“批发”等,最好是一个专有名词,不包含其他修饰词或组合。
例如,“石家庄小松挖掘机价格”,处理后的“纯词”应为“小松挖掘机”。
这样方便以后拓展,比如为了抢产品的价格和报价,我们可以组合词“小松挖掘机价格”、“小松挖掘机报价”等长尾词,这样页面设计和SEO元素都会更加精准,页面质量也可以更高。
如果想做图片词聚合页面,使用“纯词”另外组合出“小松挖掘机图片”即可。
为了实现这样的效果,需要简单学习一些sed命令。
删除包含某个关键词的行
例如,删除包含“美女”关键词的行。
sed-i.bak'/美女/d' filename
这个命令可以删除包含“美女”这个关键词的行,直接更新当前文件,并对原始文件进行备份,扩展名为.bak。(filename.bak)
关键词替换
例如,将所有关键词中包含的“出口”替换为“进口”。
sed-i.bak's/出口/进口/g' filename
s字符代表替换,g代表全局替换,如果只替换第一个出现的“出口”,则可以去掉。
关键词删除
删除操作也是一种替换,即将符合的词替换成空。
例如,删除所有关键词中开头包含的“供应”。
sed-i.bak's/^供应//g' filename
s字符代表替换,“^供应”代表以“供应”开头的关键词(支持正则),g代表替换所有“供应”,如果只替换第一个出现的“供应”,则可以去掉。
如果删除所有关键词中结尾包含的“厂”。
sed-i.bak's/厂$//g' filename
“厂$”代表以“厂”结尾的关键词
根据关键词长度过滤词
删除小于等于三个字符的关键词
sed-i.bak-r'/^.{,3}$/d' filename
注意:这里不是按字节算的长度,比如即使是UTF-8格式,每个汉字也算1个,而不是算3。
删除大于等于十个字符的关键词
sed-i.bak-r'/^.{10,}$/d' filename
当然,也可以指定字符长度区间。