音频相似度搜索

本教程演示如何使用开源向量数据库Milvus构建音频相似度搜索系统。

使用的ML模型和第三方软件包括：

PANNs（大规模预训练音频神经网络）
MySQL
Towhee (opens in a new tab)

语音、音乐、音效等各种类型的音频搜索使得可以快速查询海量音频数据，并找到相似的声音。音频相似性搜索系统的应用包括识别相似的音效、减少知识产权侵权等。音频检索可用于实时搜索和监控在线媒体，以打击知识产权侵权。它也在音频数据的分类和统计分析中扮演着重要的角色。

在本教程中，您将学习如何构建一个音频相似性搜索系统，可以返回相似的声音片段。上传的音频片段使用PANNs转换为向量。这些向量存储在Milvus中，Milvus会自动生成每个向量的唯一ID。然后，用户可以在Milvus中进行向量相似度搜索，并查询与Milvus返回的唯一向量ID对应的音频片段数据路径。

(opens in a new tab)

Workflow of an audio similarity search system.

(opens in a new tab)

Demo of an audio similarity search system.

CLI 概述 (cli_overview)