首页 > 编程知识 正文

搜索引擎蜘蛛爬虫技术,程序员专业知识技能有哪些

时间:2023-05-04 07:17:23 阅读:42466 作者:3415

译文: gavinzhang(gavinbuildsomething )如果你投票选出近20年来最伟大的发明,我相信搜索引擎一定会占据不可小觑的位置。 那不仅仅是发明,也是最大限度消除信息不平等的成果。 既然每个人都可以访问海量的信息,衡量信息财富多寡的唯一标准就是技术。 运用搜索引擎是信息时代的有钱人,而不了解搜索引擎的是信息时代的负翁。

像程序员一样需要终生学习的职业,搜索引擎是我们的wqdny。 了解搜索引擎是我们的基本功,不,应该是少年的工作。 只是,大部分初学者对搜索引擎使用过于粗放,花几分钟了解搜索引擎的技巧和语法,就能让自己的信息财富大跃进,不是很划算吗?

对于技术类问题的搜索,谷歌的表现水平一定要在百度上做一些回顾; 因此,利用搜索引擎的首要原则是像往常一样毫不犹豫地使用谷歌。 对程序员来说,随时随地访问谷歌是最基本的技能,花点钱也是值得的。 那么,除了百度,我们来谈谈使用谷歌的小贴士吧。

完全匹配位于谷歌的输入框中,所有空格都被理解为加号。 如果输入mysql foreign key,则返回的搜索结果中可能同时存在mysql和foreign key,但不一定存在mysql foreign key。 另外,过于常用、单独没有意义的词语,如the/a/that等,经常被忽视。

如果要查找包含短语mysql foreign key的文章,必须在搜索词前后加上引号,然后输入“mysql foreign key”。 无论使用全角字符“或”还是半角字符“”,谷歌都可以正确处理。 这就是引号的作用。 返回完全匹配的结果。

为了进一步过滤搜索结果,需要学习其他符号

— 减号(-)。比如,"mysql foreign key" - "nodejs"就要求Google返回含有mysql foreign key但不存在nodejs的文章。

通配符

另外一个程序员耳熟能详的符号是正则里最常露脸的星号,看到星号就下意识的想到通配符,在Google的搜索规则中也是如此,输入"mysql connect error *"就会返回所有已知的关于MySQL连接错误的文章。

站内搜索

最后推荐一个威力无穷的语法,让你有机会再对搜索结果做一次筛选。比如针对程序员查bug,stackoverflow是我个人觉得可信度最高也最全面的一个网站,所以我就经常使用site的魔法,像"mysql foreign key" site:stackoverflow.com就会返回对应网站内所有关于mysql foreign key的文章。

语言和日期

像2shou叔这种英语阅读能力不过关的人,遇到急事就不能一篇篇翻原版文档了,不得不求助国内的二手货;这时,Google界面上的一个小按钮就帮上大忙了:点击搜索工具 - 不限语言,下拉选择所有简体中文网页,一下子就回到了祖国母亲的怀抱。有时用新出的库版本,别忘了隔壁那个不限日期按钮,可以帮你找到最最新鲜的技术文章。

Tab,以及宅男福利

只限Chrome的一招:输入某个网址,再点击Tab,会能直接使用这个站点的站内搜索了,比别人快个几秒,关键时刻也很管用不是么。

最后留个福利吧,曾经被人偷偷问过,谷歌的安全搜索怎么关闭;网上有一些繁复的攻略,对我们程序员,搜索网址加个参数:&safe=off,一招就可日天。

祝大家Google快乐。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。