注:文章转自别人微博

昨天给大家安利了3款很实用的软件,修改版wps,学英语,赏诗词,小手点击→3实用APP

【SEO学习之路】大中型信息网站SEO技巧总结

无论分类信息还是B2B网站,都属于UGC(用户产生内容)信息发布平台。

这类网站有个明显的特点就是分类多、地区多,而且层级也不少。

正因为这个原因,让SEO有很大的发挥空间,也有很多容易出错的地方。

下面仅从个人经验角度做一个简单分享,内容如有纰漏,希望大家指出交流。

你知道 zhihu 曾是一家虚假网络广告骗子公司吗?

本来昨天就想写这篇的,但是发现3个小时还没有基本完成,所以就拖到了今天

大中型信息类网站URL结构设计

你知道如何通过一张被裁剪过的图片,看到完整图片吗?(美国一位女星因此裸照流出)

我一直觉得授人以鱼不如授人以渔,现在是互联网的时代,学会搜索这个技能,可以节省你很多时间。

子域名选择

对于分类信息网站,以地区划分,分类是次级组织维度;对于B2B网站来说,以分类划分,地区起筛选辅助作用。

分类信息网站往往对地区使用子域名。比如
http://bj.58.com
B2B网站往往对行业分类使用子域名。比如
http://jixie.huangye88.com

选择的根源在于产品和服务是否和地区强关联?

分类信息中很多是生活类服务。比如搬家,北京的搬家公司无法服务上海地区的用户。

而对于B2B行业则不同,地区差异不敏感,一般都是通过物流运输解决,行业差异才是问题。

如何设计子域名,要根据行业特点来选。

子域名建议使用拼音(全拼或简拼)或英文,但具体用什么,要考虑目标用户认知,最好一眼能看懂,而且看起来专业。

比如皮革英文单词是leather,中国皮革网就叫chinaleather.org,皮革人才网叫
leatherhr.com,业内人士一看就懂。

如果子域名用 pige.huangye88.com,用户也能懂,但略显得Low。

注意:子域名的好处是可以分散网站风险,但不要滥用子域名:如果子域名下内容不够丰富,强行大量使用,滥用泛域名解析,可能被搜索引擎干掉。

你知道如何看被删掉的帖子、被关闭的网站吗?

关于搜索技能,我已经写过很多了,比如百度搜索,谷歌搜索,微信搜索,B站搜索,精准快速搜索。

URL目录层级最多不超过3级

对于SEO来说,大家都知道目录层级越浅越好,一方面有利于传递权重,另一方面也便于搜索蜘蛛抓取、收录。

对于大型信息类网站来说,行业分类层级很多,地区也有省市区县(镇),再加上各个行业的不同属性参数,排列组合下来就变的十分复杂。

从URL目录层级设计上来说,要尽量恪守不超过3级目录这个原则。

如果各种子地区、属性筛选超过3级,为了页面静态化,可以使用属性ID组合URL:

http://bj.58.com/haidian/sanxing/pve\_5537\_501\_1000/

图片 1

15026993185111.jpg

如果分类或地区过多,使用拼音做URL时可能重复,这时可以用全、简拼做区分,依然重复可以考虑在拼音后加数字。

以前试验用过中文URL,虽然百度识别问题不大,但依然不推荐使用,容易出现BUG,用户体验也不佳(URL转码、URL截断等问题)

你想像微博 @博物杂志
那样能够凭借一张羽毛照片找到该羽毛所属鸟类的名字吗?

点击查看→精准快速搜索

URL结尾

对于分类页面来说,建议使用”/”结尾
对于详情页面来说,建议使用.html或.htm结尾

“/”结尾,搜索引擎会倾向于认为这是一个目录,预期下面会有很多文件内容。

当蜘蛛爬行斜杠结尾的URL时,会认为是一个目录,默认去找下面的缺省主页。
而爬行不带斜杠结尾的URL时,会认为是一个文件,默认找这个文件,当找不到时才去找目录下的缺省主页。

所以分类目录一定要带斜杠结尾,这样可以减少蜘蛛抓取的时间损耗。

不带斜杠目录也需要做301跳转到带斜杠的页面下。

即 domain.com/abc 301跳转到 domain.com/abc/

这样让权重更集中,也不怕别人转URL时写错。

详情页面使用.html结尾即可,即使动态页面也建议通过伪静态重写页面URL。

如果使用文件形式或者其他个性扩展名,即使搜索引擎能识别抓取,因为不符合常规,用户理解起来有问题,点击时也可能有疑虑。

你知道你的电话、个人经历、邮箱、住址其实已经不知不觉间被你主动上传了吗?

其实微博也是个神奇的东西,也可以搜索找到很多学习教程,自己需要的内容,而不只是娱乐新闻。不信你尝试搜索下:“PPT模板
密码”或者“office教程 密码” 看图片

大中型信息网站如何解决重复信息

搜索引擎不喜欢重复信息,不但有可能不收录,还可能认为站点内容质量低,影响整站流量。
尤其对于大中型信息发布网站,内容一般是用户UGC产生,质量很难控制,重复信息也很多。

为了减少重复信息对网站SEO的负面影响,需要从产品、技术、运营三个方面来做处理。

你想找到那个在论坛上和你聊得火热的网友住哪吗?

图片 2

产品角度

  1. 信息发布页面告知用户发原创信息有利于收录。(标题和内容引导)

图片 3

15027064409764.jpg

  1. 增加属性填写框,引导用户输入属性字段。

图片 4

15027065186570.jpg

  1. 对信息内容前120字做相似度判断,超过80%重复降低信息质量评分。
  2. 重复信息换模板发布到地区行业分类目录。
  3. 提供标题生成工具和伪原创工具。

图片 5

15027065785099.jpg

标题生成器
http://biaoti.huangye88.com

互联网上有大量半公开信息,这些信息一般情况下不会显示出来,但是它们也没有被加密或隐藏,你并不需要精通黑客知识就能获取这些信息。唯一所需的就是一点小小的技巧。

这次先不说这些,今天给大家说下怎么用网站去搜索,在某种程度上比你直接百度效率更高。

技术

使用余弦相似度算法计算用户发布信息的相似度,如果相似度高于85%则自动删除。

余弦相似度算法
http://www.ruanyifeng.com/blog/2013/03/cosine\_similarity.html

以下所有内容,根据情况,请自备梯子,自学英语。不再赘言。(以下技巧的用词描述可能不是百分之百准确,大家明白我意思就好。欢迎在评论中指正)

因为别人已经给你整理好了。

运营

虽然每日新增信息可能有十多万,但发信息人数是很固定的。

如何从审核每条信息变为审核发信息的人,这样工作量就会减少很多。

用户的行业和发布信息领域是相对固定的,如果用户以往发布的信息质量高、重复信息少,资料填写完善、真实。那么可以设置该用户几天内信息免审,从而进一步降低人工审核的成本。

一. EXIF

微信搜索,微博搜索,知乎搜索,简书搜索,B站搜索,特定网站搜索,某种程度上真的可以放弃搜索引擎了

空页面问题

对于大中型信息类网站,因为地区、分类、筛选组合过多,这样容易诞生另一个问题:空页面

比如分类信息里选择小城市的具体分类可能是没有内容的。

如果有大量这样的空页面,对SEO就有可能造成严重的负面影响。

为了避免这种情况,需要制定一套规则,当页面信息丰富起来后再打开页面。

图片 6

15027660949246.jpg

比如要求:

  1. 分类需要有至少5条信息才会打开,之前可发布到该分类,但信息没有列表入口展示。
  2. 当信息不够数量时,可以从其他分类调用相关、相近的信息作为页面模块。
  3. 不做伪静态处理,使用动态的搜索结果动页面。

目的:减少空页面数量和链接入口,避免搜索引擎认为网站内容低质、重复。

你每拍一张照片,你的相机或手机都会储存大量信息在照片的 EXIF
中,这些信息不会显示在图片中,但是内容极其丰富。

这些网站特点都很鲜明,目标都很精准,收藏到浏览器书签栏,用到的时候自然会节省时间。

链接建设

对大部分人而言无用的 EXIF 信息包括拍照时的光圈、ISO
感光值之类的,我也不知道这些到底是啥玩意……

其实很多之前都推荐过了,如果你每次都看文章的话肯定不会错过,这次来一次复盘吧

外部链接建设

链接算法一直是SEO排名的核心依赖。

链接解决了一个问题:“互联网信息那么多,到底该信谁的?”

链接是一个相对民主的网站和页面质量投票评估方法。

比如要在众人中认出谁是“罗胖”(得到APP的罗振宇老师),就让大家投票,得票多的就是真罗胖。

具体到搜索网页,投票就是用指向某一个网页的相关超级链接和链接上使用的文字作一个表决。

但这里有一个问题,一人一票计算总数有些不公平,那些跟罗振宇熟悉的人和有影响力的说的话可信度更高,应该给更高的权重,而且其他人的话权重要低些。

对应到外链建设就是让专业权威站点、甚至同行站点为你的网站背书(加链接),这如何做到?

初期做法

  1. 刷脸找关系,比如黄页88网之初有易登网的外链支持。
  2. 自己造外链,比如当时我们使用类似“国内B2B网站大全”、“免费发布信息网排行榜”等标题来写一些带网站链接的文章,把自己网站排在最后一位(显得榜单客观),但你可以倒着写排行榜,从第10名开始写一直到第1名“阿里巴巴”。然后发布到各个博客、百度文库等地方。
  3. 友情链接平台和QQ群交换链接。比如早期用过go9go.cn等
  4. 付费链接。

还有比较好的方法就是做自己行业的垂直网站导航站。

图片 7

15027682803823.jpg

一旦业内人士看重的关键词做上去,大量行业网站都会主动找你交换链接。

比如当黄页88成立头几年把B2B这个关键词做到百度第一页第一位时,慧聪网等老牌B2B网站就主动找过来交换友情链接。

后期做法

群众的力量是无穷的,一定要调动用户的积极性。

想要持续稳定的增加外链,就需要引导用户给你加外链。

图片 8

15027687430183.jpg

图片 9

15027687782091.jpg

虽然用户的网站权重一般不高,但是都是垂直专业网站,相关性很好,通过一些激励措施让用户在自己的官网和第三方商铺添加链接指向你的对应页面。

但是 EXIF
中还包含了很多有用信息——拍照时间、拍照地点的经纬度(开了GPS的手机和部分高端相机可能会包含该信息)、相机的
Serial 号码(可以根据该号码查找到该相机拍的其他照片)、照片的缩略图等等

先说一个之前安利过的导航网站吧,绝对不是360导航那种没什么用的导航。

内链建设

内部链接基础原则

  • 新的内容建议包含4~5个旧的内容链接。对旧页面的更新和排名有帮助。

  • 让旧页面更新,除了增加新的段落外,添加几个新的内部链接,有助于旧页面的排名提升。

  • 在内容中创建链接,添加对用户有价值的链接。

  • 不用添加Nofollow链接。

  • 建议每页(内部和外部)的总链接数不超过100个。(谷歌建议75-100)

  • 为排名较好的重点页面添加更多内链。

  • 避免错误404链接。

  • 内容正文链接不要超过3个。

  • 使用HTML链接,而不是Javascript脚本或Flash菜单。

  • 根据用户的搜索行为和产品结构来规划内链结构。

  • 使用面包屑导航。

内部链接锚文本原则

不要大量使用精准匹配锚文本链接指向目标页面,部分匹配即可。

建议使用描述性锚文本,不要使用“点击这里”。

不要链接整个段落,看着笨拙,而且用户体验也不好。锚文本使用几个字或短语即可。

内部链接结构

可以尝试“仓筒”结构:把网站的内容根据主题严格分开,主题间不互相链接,让主题更聚焦。

根据页面的层级(首页、二级、三级等)、类型、页面流量、百度收录与否等参数,对于不同页面,自动添加对应数量和级别的内链。

更多内容见:https://zhuanlan.zhihu.com/p/27130817

我曾经看过一个帖子,作者详述了自己如何通过 EXIF
中的信息结合地图软件,查找到某国产艳照门的拍摄地点……可惜我不记得这个帖子说的是哪个艳照门了……

沃客导航是我最喜欢的的一个导航网站,特点就是资源丰富,内涵学科广泛,简单好用,配色也不丑。

SEO知识融入到产品中

对于大中型信息发布平台,无论分类信息还是B2B网站,作为平台运营方肯定都知道SEO的价值,会按照SEO原则来开发网站和组织内容。

但是对于用户来说,他们不懂什么是SEO,也不知道如何做是符合SEO。

所以需要在产品中融入SEO,让用户的行为能对网站SEO起到帮助作用。

比如,黄页88用户中心的每条信息下面都有一个SEO优化链接。
页面里会建议用户把信息链接主动提交给搜索引擎、让用户使用referer词发新信息,让用户主动去发外链等等。

图片 10

15027689381365.jpg

还有个功能让用户诊断自己的信息质量,自动给一些优化建议。

基本都是从信息更新频率、信息数量和完整性角度去引导用户,这些对网站SEO都有潜在的帮助作用。

图片 11

15027692457956.jpg

用户发布信息填写标题时,会出现下拉词,这里使用百度下拉JS代码,这样既不耗费自己服务器资源还可以让用户输入有一定SEO价值的关键词。

图片 12

15027692949988.jpg

2003年,美国一位女主持人 Catherine Michelle Schwartz
将自己的一张裸照裁剪到只剩下眼睛,然后上传到自己的博客,但是裁剪后的照片仍然保留了完整的
EXIF 信息,网友根据 EXIF 中的原始图片的缩略图看到了这位女主持人的裸照。

图片 13

HTML代码优化

不过,包括微博在内的很多社交网站都会自动删除 EXIF
信息,如果使用了压缩软件压缩图片, EXIF
信息也基本会被删除。而且随着人们的隐私意识提高,很多人会主动想办法删除
EXIF。但是如果你想查找某张照片的相关信息,第一步先去查 EXIF
说不定会有意外惊喜

沃客导航:www.9178.work

标签优化

H标签:常见的用法是:主标题用H1,副标题用H2、模块名或小节标题用H3。甚至跳过H2,只用H1和H3。

Meta标签

Keywords标签写页面主关键词,一般是5个词左右,用英文逗号分隔。
Description标签写页面的简介描述,一般在110字以内。(Google的话120字以内)

特殊Meta标签
对于多数网站来说,为了让网页打开更快,用户体验更好,应该启用Webkit内核。
<meta name="renderer" content="webkit">

还有百度禁止转码和好搜智能摘要,更多详情见:https://zhuanlan.zhihu.com/p/27050591

CSS样式命名
使用可读性强的CSS命名规则。

Nofollow标签
对SEO价值不高,与当前页面的关联度不大的链接添加Nofollow标签,引导蜘蛛抓取更重要、更希望它收录的内容。。

CSS和JS优化
文件合并、减少请求数。

HTML标签中还有很多需要注意的,比如非装饰性图片,都需要添加Alt标签,便于搜索引擎识别图片内容,而且这里的文本会计算到关键词密度中。

还有一些特别的技巧,比如代码的书写顺序和实际显示顺序,借助CSS相对定位和绝对定位,让重要的内容主体尽可能的接近body标签出现。让页面中出现在头部,但不重要的的内容,在代码靠后的位置出现。

总之,核心目标是引导帮助搜索引擎蜘蛛识别你的页面主题和内容,把页面所有重要的信息信号,用合理的标签展示出来,在不作弊的前提下,对页面做降噪处理。

至于如何查看 EXIF
信息,随便百度一下,相关网站、软件很多,我就不啰嗦了。火狐和 Chrome
也有相关插件

图片 14
图片 15

页面速度优化

对于网站来说,页面打开速度越快越好,可以分前、后端两部分进行优化。

前端速度优化:

  • 避免 内联式/嵌入式 代码
  • 样式在上,脚本在下
  • 压缩合并CSS、JS
  • 使用CSS Sprites
  • <img>标签指定宽高
  • 压缩优化图片

更多内容见:https://zhuanlan.zhihu.com/p/25550395

后端和硬件优化:

  1. 减少网站SQL慢查询数量
  2. 使用DNSPOD域名解析
  3. 使用高质量CDN服务。比如帝联、网宿、蓝汛等

DNSPOD支持线路设置,与CDN结合使用,让搜索引擎抓取直接回源站,这样可以避免缓存造成使用CDN后页面更新不及时的问题。

图片 16

15027706076421.jpg

另外,我强烈建议大家在任何情况下都要删除图片 EXIF
信息,如果你的手机丢失了,相册中的照片蕴含的个人隐私远超你的想象。至于怎么删除,请百度

我想先说下学术搜索。没办法,我们总会有写论文的时候。

聚合页做法

对大中型网站的SEO工作来说,人工分类只能解决中短尾词的着陆页需求,可能做成分类列表,也可能做成专题页来抢占关键词排名。

词库搭建

工具:金花关键词工具、战神关键词工具、5118

词库清洗

数据量大时可以通过编程或awk、sed等命令行工具做处理。

还需要考虑非标准词、敏感词的处理。

更多内容见:https://zhuanlan.zhihu.com/p/26755718

二. 搜索引擎

。谷歌学术

总结

以上仅是自己总结提炼的部分经验,对于B2B和分类信息行业的SEO优化,其实还有很多不便公开的技巧,欢迎大家加我微信交流:vista8

下面是这半年来总结的与SEO有关的所有文章,除了是自己的思考记录,还希望对大家有帮助。

【SEO学习之路】利基主题法拓展长尾关键词 – 知乎专栏
https://zhuanlan.zhihu.com/p/27892923

【SEO学习之路】网址URL如何定义SEO效果最优? – 知乎专栏
https://zhuanlan.zhihu.com/p/27689264

SEO学习之路:内部链接的作用和结构策略 – 知乎专栏
https://zhuanlan.zhihu.com/p/27130817

SEO学习之路:SEOer必须要懂的HTML代码标签 – 知乎专栏
https://zhuanlan.zhihu.com/p/27050591

SEO学习之路:搜索结果页优化技巧,让点击和排名自然上涨 – 知乎专栏
https://zhuanlan.zhihu.com/p/26940786

SEO学习之路:能增加SEO流量的六种标题技巧 – 知乎专栏
https://zhuanlan.zhihu.com/p/26834683

【SEO学习之路】想获得几十万流量?先把聚合页和词库做好 – 知乎专栏
https://zhuanlan.zhihu.com/p/26755718

揭秘Google排名的205个因素(百度80%管用)完整版列表 – 知乎专栏
https://zhuanlan.zhihu.com/p/26610935

2017年值得尝试的SEO策略,用户体验对流量影响巨大 – 知乎专栏
https://zhuanlan.zhihu.com/p/25838521

2017年最影响SEO排名的关键因素(必须掌握) – 知乎专栏
https://zhuanlan.zhihu.com/p/25819385

一个迅速提升网站用户体验和SEO效果的方法(实证有效) – 知乎专栏
https://zhuanlan.zhihu.com/p/25550395

SEO学习之路:新网站百度不收录?老司机教你三个套路 – 知乎专栏
https://zhuanlan.zhihu.com/p/24853063

SEO学习之路:揭秘百度权重核心算法与价值 – 知乎专栏
https://zhuanlan.zhihu.com/p/24344078

实例讲解如何借助SEO思维去分析用户需求、做网站、做营销推广 – 知乎专栏
https://zhuanlan.zhihu.com/p/23008572

善用搜索引擎的各种功能,可以快速找到想要搜索的内容,甚至能帮你找到普通情况下找不到的信息

scholar.google.com.hk

以下以谷歌为例举几个例子。

说学术搜索,就不得不提谷歌学术了。谷歌学术上的学术文献资料非常丰富,高级检索,精确定位,尤其是英文文献

1. 查找个人隐私、网站密码

国内无法访问谷歌,正常访问谷歌,使用谷歌学术有两个方法:

很多人在使用社交网站的时候会小心翼翼,尽量不透露自己的个人隐私,殊不知自己的隐私已经在不经意间主动流传出来了——简历

第一个方法我已经安利很多次了,安装一个谷歌插件,谷歌访问助手。你就可以正常使用谷歌搜索了。

互联网上的简历信息可谓是个人隐私大宝库,上面有你的姓名、头像、电话、个人经历等等。

下载插件和谷歌浏览器点击→谷歌访问助手

我在写这个回答的时候,随手在谷歌上搜索 “简历
filetype:pdf”(没有双引号),即限制只搜索 PDF
文档,找到了一位同学向华为投递的简历,上面有电话、邮箱、出生日期、本科学校、工作经验、爱好游泳健身,过了六级

第二个方法就是用谷歌学术的镜像网站。给大家安利一个谷歌学术镜像网站:

如果你直接输入这个简历所在网址,只会显示 403
Forbidden,然而通过谷歌的搜索语法,却可以获取该简历

scholar.glgoo.org

如果你想搜索具体某个人的简历,可以试试 “未某人” 简历 filetype:pdf
,此处双引号要保留。加上双引号表示强制搜索完整词组,而不是搜索拆开的
未、某、人三个字。

在谷歌学术镜像网站上可以正常搜索论文文献

如果不搜简历,转而搜 password
呢?我只能说很多网站的安全措施(包括很多大型网站)比你想象的薄弱很多

关于如何高效使用谷歌学术,可以看下知乎这个帖子:www.zhihu.com/question/39852481

2. 搜索个人博客

关于谷歌学术的一些规则,可以看下知乎这个帖子:www.zhihu.com/question/39852481

谷歌原本有提供单独的博客搜索入口,后来和新闻搜索合并了,入口隐藏得很深。搜索关键词后,点击
news 分类,点击 search tools,点击 all news 在下拉菜单中点击 blog

。沃客学术导航

除此之外,在 search tools 下还能指定搜索特定时间段内的博客、新闻

www.9178.work/xueshu.html

3. 图片搜索

沃客导航的一个分支,学术网站收集的非常丰富,涵盖产业共学术搜索网站,数据库,学位论文,期刊,基金项目,学术会议,专利,博客论文等等

又回到图片这个话题……如果没有 EXIF
信息,下一步便可以用谷歌搜索特定图片的类似图片。

图片 17
图片 18

打开http://image.google.com,点击搜索框旁边的的照相机按钮,就可以上传本地图片,搜索类似图片

。虫部落学术搜索

或者直接在搜索框输入图片地址进行搜索

scholar.chongbuluo.com

这个功能用处非常大,例如根据影片截图搜索影片名称、风景照有望找到是何处景点、根据动物照片搜索动物的名字、找图片中明星姓名等等

聚合了大量的学术网站,你知道的你不知道的,它都有。我数了下,总共有39个学术网站

对某个微博微信论坛用户头像进行相似图片搜索,或许能找到该用户在别的网站上的账号

图片 19

例如你想找这个美女的名字

。学术网站大全

通过相似图片搜索,可以轻松查到她是韩国女星 eunsol bambino

dir.cnki.net

除了百度和谷歌提供这个功能外,http://tineye.com也有以图搜图功能。推荐一个火狐插件,叫做
search image everywhere,同时为你在4个搜索引擎上搜索某张图片的类似图片

学术资源网站非常多。下面的图片是其中一部分。

另外,图片搜索也支持搜索语法,在http://image.google.com上搜索
site:http://jandan.net/ooxx
可以搜到该网页包含的所有图片

图片 20

在http://image.google.com的
search tools
下你还能搜索特定大小、特定主色调的图片,甚至可以按照有无人像、是否手绘来进行过滤,得到更准确的搜索结果

免费下载论文的网站我也分享过几个

另外提醒一下,利用 google image
搜索儿童色情图片的类似图片是违反美国法律的,因为这相当于向谷歌散发儿童色情图片

iData:www.cn-ki.net

更多的搜索引擎技巧我就不详述了,推荐一个谷歌搜索技巧教程和练习网站http://www.powersearchingwithgoogle.com

上海研发公共服务平台:

三. 找回被删除帖子、关闭的网站

lib.sstir.cn

互联网上每天都会有大量帖子被删除,大量网站关闭,然而这些帖子被删、网站被关之前,很有可能已经被一些网站给存档了

国家哲学社会科学文献中心:

提供存档的网站有不少,其中两个比较出名的是http://archive.is/和https://archive.org/web/web.php

www.ncpssd.org

在https://archive.org/web/web.php 上搜索知乎的域名
zhihu.com,发现该网站在2001年2月24号对该域名进行了存档,原来 zhihu.com
曾是一家叫做智狐机械的公司的企业网站域名

图片 21

(此处解释一下,评论中有些同学误会了。我不是说知乎曾是骗子公司,而是知乎使用的网站域名http://zhihu.com曾经是一家疑似为骗子的公司所拥有。这家公司和知乎应该没有任何关联)

沃客学术搜索里面也有很多数据搜索网站。

顺带一提,谷歌了一下智狐机械这个词,第一条返回结果是新浪的一条新闻,原来智狐机械是“上海市首例网络虚假广告案”,“制造了许多虚假的获奖内容,借此吸引客户,从事无照经营”

我再给大家安利一个大数据导航

想不到你是这样的 zhihu

hao.199it.com

到了2004年,http://zhihu.com又变成了一个叫做
知乎书坊
的加盟店的主页(总部在上海)……不知道上海的同学有没有人对此有印象的。

里面有不计其数的数据搜索网站,没有夸张,这里的数据涉及方方面面,看动图

谷歌也会保留索引过的网页内容,谷歌上搜索关键字后,点击图中三角箭头,再点
cached,就可以看到谷歌在自己的服务器上保留的该网页内容,就算该网页已经被删除,仍然有机会看到网页内容

图片 22
图片 23

百度也有类似功能,叫做百度快照,大家自己百度一下去了解吧

维基百科是一个非常专业的百科搜索平台,编纂要求很高,词条通过率低,所以内容质量非常高

答主在悉尼一家中文报社做编辑,曾经在工作时看到一篇英文新闻,说悉尼一家小学发布了一则新闻简报(newsletter),要求学生在晨会上不要鼓掌,而是以“原地挥拳”“扭动”“做出兴奋的表情”等方法表示激动,以照顾那些对声音非常敏感的其他同学。该新闻中还配了该简报的截图。但是我在该学校官网上却没有找到该简报,不过在谷歌上搜索
clap site:官网地址 filetype:pdf
后,果然获得了谷歌在三天前保存的该简报,并看到了内容。可以确定是该校在新闻爆出后删掉了该简报。然而仅仅
1 分钟不到的谷歌搜索就让我找到了原始内容

维基百科偏向学术性,权威性比百度百科高,如果你需要这方面的内容,你就可以选择维基百科。

四、查某站长拥有的其他网站

如果小伙伴需要一些生活性的,比如国内的城镇信息,你就可以用百度百科,二者的适用范围不同

很多网站都会使用百度统计、google
analytics等服务统计网站流量,或使用亚马逊、谷歌广告服务赚收入,一个站长拥有多家网站时,往往这些网站会共用一个
google analytics 账户,这样我们便可以据此找到哪些网站其实是同一个人所有

维基百科:zh.wikipedia.org/wiki

一个比较方便的网站是SpyOnWeb.com Research
Tool。以大名鼎鼎的煎蛋网和小众软件为例

百度百科:baike.baidu.com

共有 6 个网站共用一个 google analytics

图片 24

账户,其中http://hox.in与http://janbao.net都是和煎蛋网有关的网站,有趣的是[服装搭配

衣橱必备单品!](

和小众软件共用一个 google analytics 账户的网站有 3
个(不含小众软件本身),其中两个已经无法访问了,但是从域名http://cancertype.me还是能看出来是个医疗癌症方面的网站。还有一个还能访问,伟德betvictor1946_m88.com_m88明升备用该网站与小众软件不但共用
google analytics 还共用 google adsense 账户。

那这个网站是干嘛的呢?是一个祛疤医疗网……

我当然很难相信小众软件站长还兼职做虚假医疗广告,其中应该是有什么技术问题或是误会我不太了解。

SpyOnWeb.com Research
Tool只支持搜索 google analytics
等国外常用的一些服务。如果你感兴趣的网站使用百度统计等国内服务,那么需要懂一点相关知识,在目标网站的
HTML 代码中找到百度统计账号 ID,然后去 search.nerdydata.com
这个网站进行搜索

五、其他

可以获取普通人难以获得的信息的各种乱七八糟小技巧还有很多,例如

谷歌地球和谷歌街景可以查看某地的过往照片

https://www.freemaptools.com/,
可以在地图上随意勾选一块区域然后计算出该区域面积

Facebook, Twitter, LinkedIn, Instagram
也有很多获取信息的技巧,不过这些网站在国内并不存在

互联网上还有一种搜索引擎叫 people search
enging,搜人引擎,只要输入人名/邮箱/电话等,就有一定可能找到你的个人信息,不过这些网站大多依赖各种个人信息数据库,因此搜索到外国人(特别是美国人)的几率比较大。知乎上有个提问是根据一个手机号能获得多少信息,在这些搜人引擎网站上,输入一个美国人的手机号后,1
分钟内,说不定他的小学在哪上、小学同学有哪些、当前个人收入大致范围都能找到​

​哎,我上一个两千赞的帖子是写英语的,好几个星期才慢慢到两千赞,这个回答虽然也预料到会有不少赞,但是24小时内破
2000 赞,我只能说你们这些爱窥探的宝宝啊~~

既然如此,我就再更一点吧~哈哈哈哈哈哈

有些同学在评论中表示我写的这些内容如果散播开会不会不太好。

同学,当然是不好了……大家都学会了,我就要花更大精力找新的技巧了……

其实这些技巧用在黑客攻击方面,勉强可以算是社会工程学的基础内容;如果用在犯罪调查取证方面,则是
digital forensics 的内容。(维基百科把 digital forensics
翻译为数位鉴识,感觉是台湾人的翻译,不是很喜欢,直译就是数字法医学,此处法医不是指检查尸体那个法医,而是统称犯罪调查中用到的科学技术)

给大家推荐一本书,以上我写的很多内容就是来自这本书

《Open Source Intelligence
Techniques》,全书都是在教你如何在网上搜索定位公开信息(严格来说,我觉得应该算半公开信息)。作者是一位受雇于美国政府的电脑犯罪调查员。全书干货满满,简直满到过头,每次读书翻页都要慢慢翻,以免干货太干着火……

不说别的吗,这样一本小众的书,能出到第五版,就知道内容有多强了。

下面这张图是作者在书后附的一张流程图,记录了如果手头只有调查目标的手机号,会用怎样的步骤在网上搜索这个手机号的相关信息。除了手机号外,还有别的流程图告诉你如果只有姓名、只有邮箱
等极少信息时如何进行调查

(我拍的这张照片自己都没有删除 EXIF 信息,哈哈哈哈。暴露了我在使用三星
NOTE 4
的事实。多谢评论提醒,但是我就不删这张照片了,作为对后来人的一个提醒吧。)

当然了,这本书作者由于是美国人,所以里面有很多内容是和 Facebook, Twitter
等内容相关。无法直接应用到中国,但是其思路却是非常有启发性的。

(有些同学在评论中问我这本书在哪买。我虽然回复了在哪能买到,但是看了上面那么多内容,想找哪有卖这本书时,竟然还要问我,而不是谷歌,连百度都能找到这本书哪有卖)​

​ 一天两更……感觉自己在写网络小说……

大家用谷歌搜索的时候要注意一个地方,随便搜索一个词,然后再搜索结果页面右上角点击那个齿轮,然后看看下拉菜单中有没有
Turn on SafeSearch 字样

SafeSearch
用于过滤含成人内容的搜索结果,如果下拉菜单中显示的和我的截图一样,是
Turn on SafeSearch,说明这个功能被关闭了;如果是 Turn off
SafeSearch,说明这个功能开启了

至于你到底是想开启还是关闭 SafeSearch,取决于你自己了。

这个 SafeSearch
功能开启后也会应用到图片搜索和视频搜索上。毕竟如果你是设计师,在公司用谷歌搜图片的时候,你也不想半个屏幕的图片都是言语不适当描述的内容吧

以下是打开 SafeSearch 后再图片搜索中搜索 NUDE(裸)
的结果。从结果来看,主要搜索到的内容恐怕是与 nude makeup(裸妆)有关

以下是关闭 SafeSearch
后的搜索结果(名誉担保,绝对没有打马赛克,如果你看到马赛克了,说明你家电脑显示屏有问题)

我建议大家在私密场所使用电脑时,最好还是关掉这个功能(如果你成年了的话),因为你很难判断它到底给你过滤了哪些内容。

我以 F**K (大家自己脑补中间的两个字母)为关键词搜索网页,开启
SafeSearch
后把维基百科中的该词条搜索结果给过滤掉了,http://dictionary.com这个字典网站对该词条的解释也给过滤掉了,这样的搜索结果明显并不适合大多数成年人

=======================================================================

​好吧,既然破 4000 了再写一点点。

我在上面介绍如何查看已经被删除的帖子、被关闭的网站时提到了一个网站http://archive.org

http://archive.org这个网站的内容非常丰富,其自身定位是对整个互联网进行存档,所以在上面你能找到很多视频、音频、文本等等,而且都已经分类整理过了,可以任意下载观看。

在这里,你能找到 1992 年出版的盲文版的
《Playboy》https://archive.org/details/playboybraile00nlsu,
是不是看得很兴奋?

有 1956 年出版的《新疆综合考察报告》,还是内部刊物哦

有对美国内利斯空军基地指挥官就大名鼎鼎的 51
区进行的采访的视频https://archive.org/details/NellisAfbCommanderDenyUfo-AnthonyJHilder

还有美国政府公开过的各种机密档案,包括美国空军进行的UFO调查项目 Project
Blue Book。

这些资料你只要用心去找,也许用谷歌都能找到,但是http://archive.org帮你整理好了,打包好了。​​

=======================================================================

​我之前承诺破 7000 赞后会考虑放个大招,现在破万赞了……

但是我不是来放大招的,只是来说一下大招的计划:

我打算从评论本文的知乎网友中选一名,试着能不能从网上尽我所能挖掘到他/她的个人信息。然后我会大致分享一下我的搜寻信息流程,以及能挖掘到什么程度的信息。

以下几点我要说明一下:

我只是说会试着去挖掘他/她的个人信息,并不一定会成功,如果第一个人不成功,我会再选一个。总之,如果一直不成功,最多也就试3、4个评论用户,不太可能试太多(我还是有真实人生要过的)

我个人对于能挖掘到多少信息没有太大把握,毕竟我并不懂黑客技术,也不太了解社会工程学,而且我所掌握的所有技巧更多只是理论,实践不多。所以估计成功几率不会太高

如果侥幸成功,我也不会详细写挖掘过程,只会大概说一说。更加不会详尽公布我挖掘到的个人信息,也是只说大概,例如住址我就只会说到城市名

不会公布我试着挖掘了哪些评论者的信息

我也不确定啥时候会开始这个大招……可能两三天后把(8月20日前后)

放大招之前,这两天还会再提供一些小招

===============================================================================

8月17日更新

昨晚试着初步挖了评论中一位同学的信息,找到了他/她/它的中学学校、大学所在学院,以及一些可能会有更多信息的线索,本来打算今天追着这些线索继续的。但是我决定不再继续挖这个同学,转而换一个在评论区自愿被挖的同学。

对于那位昨晚被我试着挖掘信息的同学,我想说,我很抱歉。

不知道有多少同学注意到,今天在这个问题下还有一个答案也获得了万赞,而且评论数比我的这个答案的评论还多,一度超过我的这个答案成为顶条回答。

在那个答案中,该匿名答主通过王宝强经纪人宋喆的微博找到了他的邮箱,接着又利用网上黑客公开的一些数据库获得了他的身份证、开房信息等资料。而且截图打的马赛克并没有完全遮盖住宋喆的个人信息。

然而这个答案现在已经不在了,不知道是那个答主自己删除了,还是知乎删除的。我毫不怀疑,如果这个答案没有被删除,用不了一天时间,该答案点赞数就会超过我的这个回答

这样的网络狂欢真的好吗?

所以,再次向那位昨晚被我试着挖信息的同学道歉。虽然你可能还不知道自己经历了啥。

另外,我昨晚还试着对知乎网(不是智狐机械……)进行挖掘,发现了知乎某初期高管的个人博客(至于怎么发现的我就不说了,反正是用了上面没提到的一些合法方法),该博客已经关闭。

2007年6月15日,知乎买下了现在这个域名

http://zhihu.com

2010年10月23日,该初期高管发了一篇博文,说正在创业中,新产品即将上市

2011年1月26日,知乎正式运营

当别人在创业,试图完成人生梦想的时候,我却在挖个人信息……

当我一开始写下这个答案的时候,目的主要是分享一些网络信息获取技巧,特别是谷歌搜索语法。部分内容以搜个人信息为切入点只是为了“哗众取宠”,没成想我自己反而都偏离了本意。

所以,这两天我只会试着挖掘评论中自愿报名的同学的信息(选一两个),然后大致分享一下结果,算是履行了诺言。希望大家也不要再过度关注如何搜索个人信息了。

====================================================================================

顺带一提,在搜索知乎的信息的时候,我发现了几个也是知乎曾购买过的域名,这些域名的购买时间都是在知乎正式运营前几个月,也就是说,我们大概可以了解知乎的创始人们当初想了哪些名字

http://dashengwen.com

大声问

http://fanquanquan.com

饭圈圈?

http://naoxibao.com

脑细胞

http://shiyige.com

屎一个?十一哥?

http://zhihuzhe.com

知乎者

不知道大家更喜欢哪个名字。

既然知乎把

http://zhihuzhe.com

都买下了,那

http://zhihuzheye.com

呢?现在输入该网址会自动导向一个郝鹏工作室的网站,似乎是做域名交易的,从网站风格来看,应该多年未更新了。然而在
2011 年 2 月时,也就是知乎刚成立不久时,

http://zhihuzheye.com

是属于一个婚纱礼服店的网站。似乎都和现在的知乎关系不大。

另外在2014年9月某天,知乎注册了

http://ruhekan.com

http://ruhekandai.com

两个网站,可见知乎早就有准备要推广“如何看待……”“如何看……”“……是一种怎样的体验”这样的问题,或者也有可能只是为了抢注。

另外,我在搜索知乎的信息的时候,发现乌云网(一家专门公布各大网站/软件安全漏洞的网站,已经很长一段时间处于升级状态,无法使用)上曾有一篇文章,是一个匿名用户公布的他如何通过一些技巧,获得知乎员工信息的。也正是看到这篇文章促使我停止继续搜索知乎相关信息……

=======================================================================

试着搜了几位评论里自愿被搜索的同学。

其中一位同学,找到了他在多家国内外网站的账号,其中部分网站可以查看该账号的过往曾有名,搜索曾用名获得了更多网站账号,以及该同学的个人邮箱。确认了他的高中和大学学校。该邮箱所用网站曾经被黑客攻击,大量密码泄露,理论上有希望查到他的邮箱密码。但是懒得继续了……

还有一位同学,发现了他的中学和大学。中学获得过县级优秀学生。查到了他爸爸的名字、年龄和工作地,以及疑似为他爸爸的母校

还有一位同学,查到他的微博后,发现这位同学自己上传的个人信息太多,所以决定放弃了,完全不用查,自己就报告了……

如果有足够耐心,一条条看别人的微博和他朋友的微博,理论上完全有可能发现更多。知乎上互相关注、
微博上互相留言的往往是现实世界中认识的人。你能控制好自己不泄露隐私,不代表你的朋友也可以。

基本上来说,中学和大学在哪上的已经算不上什么隐私了,很多人自己就会在社交网站上公布,你不公布,你的朋友也会公布,只要看看你的社交网站上的朋友主要在哪些学校,就能确定你的学校

只要一条条仔细读你的社交网站信息和你的朋友的社交网站信息,还有你上传的图片,对你的了解就已经能够达到一定程度

一旦知道了你的名字或者邮箱,在你的学校/公司网站上搜索你的名字或邮箱,搭配上谷歌搜索语法,有一定几率就会找到你的其他信息,特别是安全措施做的不好的网站。

另外,很多人会在不同网站上用同一个用户名,稍微谷歌就能发现其他网站账号,获得更多信息

另外
58同城、豆瓣这样的网站也是个人隐私集散地,结合其他信息,也会暴露很多。

不过话又说来,即便如此,其实如果你想找特定的某个人的信息还是不容易的,评论中有些同学好像误会了,误以为搜索
简历 filetype:pdf 能搜索到任何上传的 PDF
格式简历。事实上并非如此,只有当你上传简历的网站的安全措施做的不好时,这些信息才会被谷歌检索到,你才能搜索到。对于安全措施做的足够的网站而言,你是搜索不到的

===========================================================================

我突然想起来自己收藏的一个网站

http://www.doulaig.com/

, 大家不用试着登录这个网站了,已经关闭了。

这个网站有一个功能,输入 QQ
号就能告诉你这个号码的主人的真实姓名。免费用户会告诉你 5 个名字,1 真 4
假,付费用户能直接获得真姓名。我用我自己的QQ
和几个朋友的QQ试过,准确提供了所有尝试的 QQ 的主人真实姓名

我估计信息来源是QQ数据库被黑泄露。对于真正的黑客而言,只要你经常上网,早就没有什么个人隐私可言了。

============================================================================

又更新了

NASA 已经宣布公开所有自己赞助的研究

Public Access to Results of NASA-Funded
Research

http://www.ncbi.nlm.nih.gov/pmc/funder/nasa/

还不知道怎么找PPT教程,PPT模板,PPT工具,PPT灵感,PPT资源?一个HiPPTER就够了,比你百度搜索快多了,因为别人都给你整理好了,上动图。

图片 25

HiPPTER:www.hippter.com

关于可以免费下载部分PPT模板,我很喜欢优品PPT,演界网和柚墨PPT,安利很多次啦

图片 26

我们在制作汇报工作等等需要制作PPT的时候,会需要一些图片素材,你是直接百度吗?不会高级筛选的话,内容会很差,而且版权还不能保证。

Unsplash是一个无版权符合CC0协议的图片网站,这些图片可以免费下载使用,还可以商用

Unsplash:unsplash.com

图片 27

直接英文搜索就完事啦,涉及面非常广,图片质量很高,是我的首选素材库。

图片 28

关于无版权图片网站,我之前安利了有10几个吧。

点击查看→无版权图片网站

图片 29

也许你需要查询一些企业信息,那你就可以尝试下天眼查,很好用的查询企业网站

天眼查:www.tianyancha.com

图片 30
图片 31

也许你在做产品运营,需要了解一些信息,那么你就可以尝试下产品大牛的导航。

产品大牛导航:

www.pmdaniu.com/navigate

里面全是和产品运营相关的内容,比如一些原型工具,一些第三方服务,一些做产品需要的科技资讯,毕竟不是闭门造车

图片 32

关于产品的干货,比如工具,网站,灵感,提升,教程,我之前安利过,总结的很全面。

点击查看→产品经理实用工具网站

图片 33

也许你是一名设计师,需要找灵感,找图片,找工具,找配色,找字体,找规范,那么优设导航能帮助到你

优设导航之前也安利过,是一个设计师必备导航,里面都是设计内容,涉及面很广。

优设导航:hao.uisdc.com

图片 34

设计师灵感网站,配色网站,字体网站,工具网站,我之前也安利过很多,里面还有一个设计导航文章链接,总结的很全面。

点击查看→设计师必备实用网站工具

图片 35
图片 36

程序员导航:code.giffox.com

图片 37

程序员工具箱:tool.lu

图片 38
图片 39
图片 40

鸠摩搜索:www.jiumodiary.com

图片 41

如果鸠摩搜索找不到你要看的书籍,可以看下我之前分享的十几个书籍搜索下载网站,没有你下载不到的电子书。

点击查看→10几个电子书下载网站

图片 42

也许你需要一些学习教程,比如PS学习教程,如果你直接百度PS教程,出现的内容会和理想中差距很大,首先是大量报班广告,接着是一些质量不高的百家号文章

资源搜索网站我安利过很多,比如云盘精灵,爱搜云盘,小白盘,云盘恶魔等等,有10几个吧。

点击查看→10几个资源搜索网站

你直接在这些网站里搜索你需要的教程就行啦,都是以百度网盘形式分享,你可以在百度网盘看,也可以下载到电脑上看

终于写完啦…累skr

。我是尾巴

这次的高效搜索网站都有它特定的功能,在某种程度上你都不需要搜索引擎。打开需要的网站就是一顿操作。快把这些网站收藏起来做好标签吧~

快来文章底部留言造作啊~谁是沙发呢???

文章首发个人公众号:助手小伙伴,专注于实用技巧,学习资料,效率软件,软件安装,实用网站和APP,一个可以提升自己的地方!

相关文章