今年,我们推出了 Meilisearch 的第一个贡献者计划:Meilistars。贡献者计划的目的是汇集社区中的顶级贡献者,培养我们之间的关系,突出他们所做的出色工作,甚至可能帮助建立联系。我们目前不会深入探讨这个话题,因为我们希望在专门的博文中分享更多内容,敬请关注!
为了让我们的优秀社区成员备受关注,我们询问他们是否愿意参加一系列访谈,以便我们更好地了解他们。
我们从 Minoru Osuka 的访谈开始。你可能已经在 GitHub 上以 Mosuka 的身份或在 Twitter 上以 @minoru_osuka 的身份认识他。
让我们一起更多地了解他!
认识 Minoru
首先,我们请他用自己的话自我介绍!
“我叫大隅みのる。我在一家为日本提供求职引擎的公司担任软件工程师和技术主管。我主要参与搜索平台的开发。我的爱好是软件开发,我在 GitHub 上发布了我开发的一些开源软件。”
所以 Minoru 不仅从事技术工作,而且还将其视为爱好!我们非常好奇地想知道他是如何进入科技领域的。
Minoru 解释说,他从一所技术学校的编程讲师开始,但他希望增加实践经验,于是决定加入一家软件开发公司。
“这是我作为软件开发人员职业生涯的开始。由于我在工作中使用搜索引擎,我对它们的运作方式产生了兴趣,因此我转到了一个互联网门户网站,并从此一直从事搜索引擎领域。”
Minoru + Meiliseach:命中注定
听到 Minoru 实际上从事搜索引擎工作,我们忍不住问他是何时听说 Meilisearch 以及他是如何开始使用它的。
“大约在 2022 年 5 月,Meilisearch 开始支持日语。Meilisearch 使用日语形态分析器 Lindera 作为日语分词器。我维护 Lindera,所以这是一个非常幸运的事件。”
Minoru 对 Kination 和 Miiton 感激不尽,他们分别创建了 第一个拉取请求,在 Meilisearch 中添加了日语支持,并对其进行了实施。正是由于他们的共同努力,Meilisearch 的日语支持才成为今天的样子。
“我还没有在我的工作中实际使用 Meilisearch,但 voluntas 介绍了 一个使用 Meilisearch 的案例研究,用于他们的日语文档搜索服务,引起了很多关注。”
开源到底
Minoru 在访谈中经常提到 Meilisearch 社区的其他成员,这太重要了,不容忽视。他对有机会与社区中的其他成员建立联系感到非常满意。
“自从 Meilisearch 采用 Lindera 以来,我的 Twitter 关注者人数有所增加。我很高兴认识他们。我非常感谢 Meilisearch。”
Minoru 对开源社区的深度参与确实令人瞩目。除了为 Meilisearch 做出贡献并维护 Lindera 之外,他还创建了自己的 分布式搜索服务器。
“我使用 Elasticsearch 和 Solr 很长时间了,但仅仅使用它们还不够,所以我决定在学习 Rust 的同时构建一个分布式搜索服务器。这很困难,但我学到了很多。”
奇怪的是,正是这个项目促使他维护 Lindera。
“我开始着手开发 Lindera,因为我自己开发了一个分布式搜索服务器。[...] 我的朋友,他正在开发一个全文搜索库,也开发了一个日语形态分析器,但它没有在 crates.io 上注册。当我联系他询问他是否愿意将其注册到 crates.io 时,他给了我一个令人惊讶的答案:‘我希望你接管这个项目。’我对形态分析器也很感兴趣,所以我决定接管开发工作。”
Minoru 还感谢 fulmicoton,他是 kuromoji-rs 的开发者,kuromoji-rs 是最终演变为 Lindera 的原始软件,并将其描述为“一个很棒的 OSS”。
对未来的愿景
鉴于他对 Meilisearch 做出了大量贡献,Minoru 对 Meilisearch 的了如指掌也就不足为奇了。Meilisearch 的直接可用性是 Minoru 最看重的。事实上,他特别看重一个有助于实现这种可访问性的特定功能。
“Meilisearch 可以自动检测索引文档的语言,这一点很棒。对于不熟悉搜索引擎的用户来说,这是一个非常有用的功能。”
在我们与 Minoru 的谈话中,我们不能错过向他询问他希望在 Meilisearch 的不久将来看到哪些改进的机会。不出所料,他的建议集中在语言支持方面。具体来说,他建议实施一种机制来规范字符,在它们被分词之前。
对于那些不熟悉该流程的人来说,当前的操作方式是反过来的。文本被分词(分成单词),然后每个单词根据语言的特性进行规范化。对于像法语这样的罗曼语,这个过程包括将文本转换为小写并删除变音符号,例如重音符号或任何不影响文本含义的东西。对于那些对该主题感兴趣的人来说,你可以加入 GitHub 上的讨论,或 了解更多关于我们如何处理语言支持的信息。
Minoru 对语言支持的建议包括为每个字段自定义规范化器。假设有一个包含地址字段的文档,他希望能够指示 Meilisearch 将地址字段中的汉字数字转换为阿拉伯数字。用他的话说
"目前,Meilisearch 没有针对日语的规范化器,但能够为每个字段自定义它会很棒。[...] 我也希望为日语规范化器做出贡献。”
我们期待与 Minoru 以及任何想要支持我们工作语言爱好者一起改进我们的语言支持!
与 Minoru 交流,更好地了解他,并了解他对 Meilisearch、他的使用情况以及他通过 Meilisearch 结识的人的见解,这是一次真正的乐趣。
提醒一下,你可以在 GitHub 上找到 Minoru,或者为 Lindera 做出贡献。
我们希望你发现这次访谈和你一样有趣,并期待与我们所有不可思议的 Meilistars 会面。