在这个信息过载的时代,文档的效率不仅取决于其质量,还取决于用户搜索信息的难易程度。通过高级搜索功能增强文档可以显著提升用户体验。

Meilisearch 云的文档爬虫正是为了解决这个问题,它弥合了庞大内容与用户友好搜索之间的差距。

什么是爬虫?

网页爬虫,有时被称为“蜘蛛”或“机器人”,是一种数字工具,它在互联网的广阔空间中漫游,索引和编目内容以供搜索引擎使用。这可以确保在用户搜索时呈现最相关的的信息。

什么是 Meilisearch 的文档爬虫?

Meilisearch 的文档爬虫不仅仅是一个传统的爬虫;它也作为一个高效的抓取器。它在从网页中提取重要数据的同时,也尊重文档的固有结构,确保精确和结构化的索引。

此系统允许用户将搜索功能集成到他们的文档中,确保他们的受众可以快速找到他们需要的的信息。

如何使用文档爬虫?

使用文档爬虫非常简单;它只需要一个 Meilisearch 云项目和您现有文档的 URL。

设置您的项目

首先,您需要一个在Meilisearch 云中运行的项目。创建项目后,导航到您的项目索引列表并创建一个新索引。

Step 1 of Create Index form: Enter the index name.

爬取您的内容

当提示您导入文档时,选择“文档爬虫”。

Step 2 of Create Index form: Import documents via crawler or file upload.

然后,输入或粘贴您的文档的 URL 并点击“下一步”。

Step 2 of Create Index form: Import documents using a crawler by pasting the website URL

点击“运行”开始爬取您的文档内容并将其推送到 Meilisearch 实例。此过程可能需要几分钟。

Setup interface for the Crawler with a 'Run' button.

爬取后验证

状态更新为“就绪”后,您可以返回到您的项目概述并访问“搜索预览”。点击项目的 URL 或从顶部菜单中选择“预览搜索”选项。

Project overview

执行几次搜索以确保您的文档已正确索引。此步骤对于了解文档的模式特别有用。

Search preview displaying results for the query 'releva' with highlighted matches.

在您的文档中添加搜索栏

使用 Meilisearch 的文档爬虫成功索引您的文档后,下一步是增强用户体验,即将搜索栏集成到您的文档中。

返回您的项目并导航到您的索引设置。从那里,选择“工具”选项卡,然后选择“爬虫”。这将显示爬虫设置和相关资源。

Setup interface for the Crawler with the 'UI starter kit: Doscsearch' option.

UI 启动套件帮助您只需几行代码即可将功能性搜索栏添加到您的文档中。

您现在已完全准备好为您的文档添加无缝的搜索体验!

_____

订阅我们的新闻通讯,随时了解最新消息。要了解更多关于 Meilisearch 的未来并帮助塑造它,请查看我们的路线图,并参与我们的产品讨论

对于其他任何问题,请加入我们的开发者社区,加入Discord