Apache Solr

Лучшие автономные поисковые системы

Лучшие автономные поисковые системы
Ваш босс знает, что вы ищете другую работу?? Сказали ли вы своей второй половинке о неспособности решить, хотите ли вы иметь детей или нет?? Вы, родители, знаете о вашей сексуальной ориентации?? Что ж, Google и другие крупные поисковые системы делают.

«Большинство пользователей ищут в Google, когда они вошли в систему, поэтому доступна вся информация об их онлайн-жизни: поиски на YouTube, электронные письма и история поиска», - говорит Адам Таубер, ведущий разработчик метапоисковой системы Searx, обеспечивающей конфиденциальность.

Конечно, вы можете использовать Tor для анонимности и всегда удалять все следы вашей активности после каждого поиска, но делать это после каждого поиска, скорее всего, довольно быстро устареет. Вместо этого вам следует подумать об установке автономной поисковой системы, способной получать информацию для вас, не раскрывая ничего важного о вас.

Мы выбрали две такие поисковые системы, а также представляем три дополнительные поисковые системы, чтобы показать вам, что отличные альтернативы проприетарным поисковым системам, таким как Google или Bing, уже существуют и их проще установить и использовать, чем вы думаете.

1. YaCy

YaCy - это бесплатная распределенная одноранговая поисковая система, основной компонент которой написан на Java. Поскольку все пользователи YaCy равны, а поисковая система не хранит поисковые запросы пользователей, цензура просто невозможна.

В настоящее время YaCy индексирует около 1.4 миллиарда документов в его индексе благодаря активности более 600 равноправных операторов, которые ежемесячно вносят в него свой вклад. Для сравнения: индекс поиска Google содержит сотни миллиардов веб-страниц и имеет размер более 100000000 гигабайт.

Хотя YaCy еще предстоит пройти долгий путь, прежде чем он сможет составить конкуренцию крупнейшим централизованным поисковым системам в мире, его уже можно использовать в качестве поискового портала для частных интрасетей и приложений для конкретных проектов, поскольку YaCy может работать как единое поисковое устройство без взаимодействия с другими сверстники.

YaCy можно легко интегрировать в любую веб-страницу благодаря простым фрагментам кода, которые можно легко скопировать и вставить без каких-либо изменений.

2. Searx

Searx описывается как уважающая конфиденциальность, взломанная система метапоиска. Он доступен под лицензией GNU Affero General Public License версии 3, и его основная цель - защитить конфиденциальность своих пользователей, никогда не передавая IP-адреса пользователей или историю поиска поисковым системам, из которых он собирает результаты.

«При использовании Searx IP-адрес Searx, случайный пользовательский агент и поисковый запрос отправляются в Google по умолчанию», - объясняет Адам Таубер, также известный как asciimoo, как работает его метапоисковая система. «Конечно, вы можете настроить Searx для пересылки других дополнительных параметров, таких как язык поиска или номер страницы запрашиваемой страницы результатов.”

Searx автоматически блокирует все файлы cookie для отслеживания, обслуживаемые поисковыми системами, чтобы предотвратить изменение результатов на основе профилирования пользователей, которое может быть результатом попытки поисковой системы реализовать поиск, индивидуализированный на основе того, что система знает о пользователе. Searx на 100% бесплатен, и любой может изменить его по мере необходимости. Вы даже можете взять код Searx и запустить механизм метапоиска на своем собственном сервере, что определенно должно решить любые проблемы, которые могут возникнуть в отношении журналов.

3. ElasticSearch

ElasticSearch - это поисковая система, основанная на Lucene, бесплатной библиотеке программного обеспечения для поиска информации с открытым исходным кодом, поддерживаемой Apache Software Foundation и выпущенной под лицензией Apache Software License.

ElasticSearch предоставляет систему полнотекстового поиска с веб-интерфейсом HTTP. Поисковую систему можно использовать для поиска всех видов документов, и ее можно легко распределить по нескольким узлам.

Можно создать автономную поисковую систему с помощью ElasticSearch и Docker, и вы можете найти руководство, которое описывает этот процесс здесь.

4. Амбар

Ambar - это система поиска документов с открытым исходным кодом со множеством полезных функций. Он поддерживает автоматическое сканирование, теги и мгновенный полнотекстовый поиск, просто чтобы привести несколько примеров. Одной из самых интересных особенностей Ambar является его способность выполнять распознавание текста для изображений и файлов PDF. Поддерживаемые языки включают английский, немецкий, русский, итальянский, французский, испанский, польский и голландский.

Ambar можно легко развернуть с помощью одного файла docker-compose, и вы можете узнать, как это сделать, здесь.

5. Apache Solr

Написанная на Java, Apache Solr представляет собой платформу корпоративного поиска, которая включает полнотекстовый поиск, выделение совпадений, фасетный поиск, индексирование в реальном времени, динамическую кластеризацию и многие другие важные функции. Он был создан в 2004 году для внутреннего проекта CNET Networks. CNET Networks любезно пожертвовала его Apache Software Foundation в 2006 году, где в 2007 году он перешел из инкубационного статуса в отдельный проект верхнего уровня.

Сегодня Solr - это высоконадежная, масштабируемая и отказоустойчивая поисковая платформа для предприятий, которая поддерживает функции поиска и навигации на многих крупнейших мировых интернет-сайтах, включая DuckDuckGo, eHarmony и BestBuy. Ты можешь

Как установить и настроить YaCy

Установка YaCy очень проста и занимает всего пару минут, потому что вам не нужно устанавливать внешнюю базу данных или веб-сервер - YaCy поставляется со всем необходимым.

  1. Зайдите на официальный сайт YaCy и скачайте последний пакет для Linux.
  2. Установите среду выполнения OpenJDK 8.
    • Если вы используете дистрибутив на основе Debian, используйте следующую команду: $ sudo apt-get install openjdk-8-jre
    • Если нет, следуйте инструкциям, относящимся к вашему дистрибутиву.
  3. Распакуйте загруженный пакет в желаемое место.
  4. Перейдите в новую папку и запустите «startYACY.sh »в Терминале.
  5. Вы должны увидеть подтверждающее сообщение о том, что YaCy запущен как демон

Заключение

Поисковые системы знают о нас больше, чем большинство людей хотели бы признать. Если вы хотите перестать кормить крупные корпорации сочной информацией, вы можете взять все в свои руки и настроить самостоятельную поисковую систему, чтобы защитить свою конфиденциальность. Хотя самостоятельным поисковым системам еще предстоит пройти долгий путь, прежде чем они станут полностью пригодными для использования, у них есть потенциал, чтобы превзойти аналогичные Google, и их захват - это просто вопрос привлечения большего числа пользователей.

Как изменить указатель мыши и размер курсора, цвет и схему в Windows 10
Указатель мыши и курсор в Windows 10 - очень важные аспекты операционной системы. То же самое можно сказать и о других операционных системах, так что,...
Бесплатные движки с открытым исходным кодом для разработки игр для Linux
В этой статье будет рассмотрен список бесплатных игровых движков с открытым исходным кодом, которые можно использовать для разработки 2D- и 3D-игр в L...
Shadow of the Tomb Raider для Linux Учебное пособие
Shadow of the Tomb Raider - двенадцатое дополнение к серии Tomb Raider - франшизе приключенческой игры, созданной Eidos Montreal. Игра была очень хоро...