分子相似度搜索(molecular_similarity_search)

分子相似性搜索

本教程演示如何使用开源向量数据库Milvus构建分子相似性搜索系统。

使用的第三方软件包括:

药物开发是新药研发的重要组成部分。药物开发过程包括靶点选择和确认。当发现片段或引导化合物时,研究人员通常会在内部或商业化合物库中搜索类似化合物,以发现结构活性关系(SAR)、化合物可用性。最终,他们将评估引导化合物的潜力,以优化为候选化合物。为了从数十亿规模的化合物库中发现可用的化合物,通常检索化学指纹以进行亚结构搜索和分子相似性搜索。

在本教程中,您将学习如何构建一种分子相似性搜索系统,该系统可以检索特定分子的亚结构、超结构和类似结构。RDKit是一款开源的化学信息学软件,可以将分子结构转换为向量。然后,这些向量存储在Milvus中,Milvus可以对向量进行相似性搜索。Milvus还会自动为每个向量生成唯一的ID。向量ID和分子结构的映射存储在MySQL中。

molecular (opens in a new tab)

Workflow of a molecular similarity search system.

molecular (opens in a new tab)

Demo of a molded similarity search system.