优秀开源的github搜索引擎项目searX

你是否曾因需要在互联网上搜索信息而感到困扰?谷歌在搜索引擎领域表现出色,但由于一些原因,我们有时候不得不转向百度。此外,还有一些其他搜索引擎,如Bing、搜狗、360等,各自具有特色和支持不同的功能。例如,搜狗支持搜索微信中的内容,如公众号文章等。

然而,除了这些主流搜索引擎外,还存在一些小众但强大的搜索引擎,如基于智能AI技术的Magi和注重隐私的DuckDuckGo等。

在工作时,你可能使用谷歌搜索,但回到家时,你可能更愿意使用微软的Bing搜索引擎。有时候,如果在Bing上找不到满意的结果,才会回到百度。

那么,是否有一种搜索引擎可以智能地汇总所有搜索引擎的结果呢?答案是肯定的!最近,我发现了一个免费的开源项目——searX,它可以完美解决你的搜索烦恼。

searX搜索引擎
searX搜索引擎

searX简介

searX是一个基于Python的完全开源免费搜索引擎平台,可以提供来自Google、Bing、Yahoo等70多种搜索服务的结果,包括文件、图片、地图、音乐、新闻、学术、社交、视频、磁力等网站结果,并对搜索结果进行优化。与此同时,searX不会存储你的任何搜索信息,是一个完全免费开源、尊重隐私的搜索引擎平台。

使用searX时,它会将设置好的所有搜索引擎的结果进行整合,然后按优先级排序,呈现在一个页面中。整个搜索页面干净清爽,支持查看页面缓存。它还提供搜索建议、下载搜索结果和RSS订阅功能。

你可以使用searX搜索文件、图片、地图、音乐、新闻、学术、社交、视频等,这里不再详细演示,因为本文的重点是如何部署一个完全属于自己的searX。你可以通过searX传送门进行搜索体验!

searX首选项和搜索自定义设置

searX不仅提供基本设置,还支持丰富的自定义设置,以使搜索体验更符合个人需求。你可以设置默认的搜索语言、界面语言、自动补全字词、安全搜索过滤、主题风格、主题样式、在新标签页中打开搜索链接等。

除了基本设置,searX还允许你为综合搜索、文件搜索、图片搜索、视频搜索等每个搜索类型单独设置搜索引擎,这是非常强大的功能。

此外,searX还提供了插件设置,支持开启强制HTTPS链接访问、自动加载下一页搜索结果、搜索类别选择、移除跟踪链接、Vim快捷键等功能,根据需求进行设置即可。

searX部署教程

要拥有自己的searX搜索引擎网站,你需要一台服务器,并且如果需要支持Google等服务,服务器最好是国外的。下面是searX的部署教程:

安装pip

在CentOS和Ubuntu系统上安装pip的命令如下:

# CentOS 6.x 32位
rpm -ivh http://dl.fedoraproject.org/pub/epel/6/i386/epel-release-6-8.noarch.rpm
yum install -y python-pip

# CentOS 6.x 64位
rpm -ivh http://dl.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noarch.rpm
yum install -y python-pip

# CentOS 7.x
yum install -y epel-release
yum install -y python-pip

# Debian/Ubuntu系统
apt-get -y update
apt-get -y install python-pip

安装git

安装git是为了拉取searX的源代码,CentOS和Ubuntu系统上的命令如下:

# Debian/Ubuntu系统
apt-get install git -y

# CentOS系统
yum install git -y

安装searX

安装searX需要两步:下载searX的源码和安装运行所需的依赖包。以下是安装searX的命令:

# 拉取源码
git clone https://github.com/asciimoo/searx.git

# 安装依赖
cd searx
pip install -r requirements.txt

配置searX

完成安装后,需要修改searX的项目配置文件,如端口号、搜索语言等。配置文件位于searX/settings.yml,你可以使用任何编辑器进行编辑。

# 修改language,默认为中文搜索结果
sed -i 's/language : "en-US"/language : "zh-CN"/g' searx/settings.yml

# 修改secret_key
sed -i "s/ultrasecretkey/$(openssl rand -hex 16)/g" searx/settings.yml

#

 修改base_url,为你的服务器地址
sed -i 's/base_url : ""/base_url : "http://yourdomain.com"/g' searx/settings.yml

# 修改port,为你要监听的端口号
sed -i 's/port : 8888/port : 8080/g' searx/settings.yml

启动searX

现在,你可以启动searX并运行它了:

python searx/webapp.py

searX将运行在你配置的端口上(默认为8080),你可以在浏览器中访问它。

配置反向代理(可选)

如果你希望通过域名访问searX,并且希望使用HTTPS加密连接,可以考虑配置反向代理。这里以Nginx为例,配置文件如下:

server {
    listen 80;
    server_name yourdomain.com;

    location / {
        proxy_pass http://127.0.0.1:8080;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
    }
}

保存并退出配置文件,然后重新加载Nginx配置:

service nginx reload

现在,你可以通过访问http://yourdomain.com 来使用你的自己部署的searX搜索引擎了。

总结

通过部署自己的searX搜索引擎,你可以获得强大的搜索功能,同时保护了你的隐私。尽管部署过程需要一些技术操作,但一旦设置完成,你将拥有一个强大的搜索引擎,可以在搜索结果中智能地整合各种搜索引擎的结果。这使你能够根据自己的需求和偏好来自定义搜索结果,提高了搜索效率。

另外,searX的开源性质也意味着你可以根据自己的需要进行自定义开发和定制。如果你拥有一台服务器,并且想要更好地掌控自己的搜索体验,不妨尝试部署searX,享受更私密、多样化和自定义的搜索体验吧!

本文由作者 王大神 原创发布于 大神网的AI博客。

转载请注明作者:王大神

原文出处:优秀开源的github搜索引擎项目searX

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2022年2月14日 下午8:07
下一篇 2022年2月17日 下午4:55

相关推荐

  • 国内SEO环境的挑战与机遇

    在数字化时代,搜索引擎扮演着无可替代的角色,是人们获取信息、满足需求的首选工具。然而,近年来,随着社交媒体和短视频平台的兴起,一些人开始怀疑搜索引擎的地位是否受到威胁。本文将探讨国内SEO环境的挑战与机…

    2023年11月26日
    00
  • 如何解决网站索引页面数量下降的问题

    SEO(Search Engine Optimization)是网站运营中至关重要的一环,而网站的收录情况更是影响其在搜索引擎中排名的关键因素之一。谷歌站长工具(GSC)中的页面索引报告是每位关心谷歌优化的人都应该密切关注的工具之…

    2023年12月28日
    00
  • Bing超越百度,成为中国桌面端智能搜索引擎领导者——ChatGPT的成功应用与智能化的搜索体验

    2023年4月,中国桌面端搜索引擎市场发生了巨大的变革,微软旗下的搜索引擎Bing成功超越百度,以37.83%的市场份额首次登上领导者的宝座,而百度则跌至26.73%。这一时刻,不仅代表了市场竞争的胜利,更是微软多年来不…

    2023年6月9日
    00
  • 微软新Bing:AI革命下的搜索引擎保姆

    在数字化时代,信息搜索已经成为我们日常生活中不可或缺的一部分。然而,传统搜索引擎在满足我们需求方面已经显得力不从心,于是微软推出了全新的Bing,一款巅峰之作,搭载了强大的人工智能能力,使其不仅仅是搜索…

    2023年9月27日
    00
  • 如何正确配置Robots.txt文件来控制搜索引擎访问

    在网络的世界里,搜索引擎扮演着重要的角色,它们帮助用户找到他们需要的信息,也是网站流量的重要来源之一。然而,有时候网站所有的内容都不希望被搜索引擎收录,或者只想让特定的搜索引擎访问。这就是Robots.txt…

    2023年11月2日
    00
  • ChatGPT引领搜索引擎进化:探索新纪元的智能辅助

    ChatGPT的出现,不仅标志着生成式AI的崛起,更是对全球互联网、云计算、人工智能领域带来了前所未有的影响。特别是在搜索引擎领域,ChatGPT的影响尤为显著,尤其是对微软必应的影响更是深远。 1. ChatGPT与搜索引擎…

    2023年12月5日
    00
  • 了解Robots文件:管理搜索引擎对网站的访问

    在互联网时代,网站的流量对于许多网站所有者和运营者来说至关重要。流量意味着用户的访问和互动,是网站生存和发展的关键。而搜索引擎则是带来大量流量的主要渠道之一。然而,有时候,我们希望搜索引擎不要访问网…

    2023年11月2日
    00
  • SEO优化意见报告

    搜索引擎优化(SEO)是一种至关重要的数字营销策略,对于任何希望在网络上建立品牌和吸引流量的企业或个人都是必不可少的。本报告基于王大神的网站搜索词数据进行分析,提出一系列具体可行的SEO优化建议。 数据概览…

    2023年9月1日
    00
  • 探索Weex AI:你的个人人工智能知识机器人

    在数字时代,人工智能已经渗透到我们生活的方方面面。随着技术的不断进步,我们迎来了一个全新的时代,一个拥有属于自己的人工智能知识机器人的时代。今天,我将向你介绍Weex AI,这个令人兴奋的项目,它将改变你与…

    2023年10月11日
    00
  • SEO优化之路:难熬的收录冬天

    在数字时代,网站的可见性是成功的关键之一。然而,随着时间的推移,越来越多的网站所有者发现,他们的网站不再像以前那样容易被搜索引擎收录。在这个充满竞争的网络世界中,一位网站所有者坚守在SEO的道路上,努力…

    2023年11月4日
    00

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

评论列表(1条)

  • pick
    pick 2022年7月17日 下午3:55

    这还挺不错的