管理员手册 (Administration Guide)
备份(Backup)
H2M

将 HDF5 数据迁移到 Milvus

本主题描述了如何使用 MilvusDM,一个专为 Milvus 数据迁移而设计的开源工具,将 HDF5 文件中的数据导入到 Milvus 中。

先决条件

在迁移 Milvus 数据之前,你需要 安装 MilvusDM

1. 下载 YAML 文件

下载 M2H.yaml 文件。

$ wget https://raw.githubusercontent.com/milvus-io/milvus-tools/main/yamls/M2H.yaml

2. 设置参数

配置参数包括:

参数描述示例
milvus_versionMilvus 的版本2.0.0
data_pathHDF5 文件路径。设置 data_pathdata_dir 中的一个- /Users/zilliz/float_1.h5 - /Users/zilliz/float_2.h5
data_dirHDF5 文件目录。设置 data_pathdata_dir 中的一个'/Users/zilliz/Desktop/HDF5_data'
dest_hostMilvus 服务器地址'127.0.0.1'
dest_portMilvus 服务器端口19530
mode迁移模式,包括 skipappendoverwrite。当 Milvus 库中已存在指定的集合或分区时,此参数才有效。 skip 表示如果指定的集合或分区已存在,则跳过数据迁移。 append 表示如果指定的集合或分区已存在,则追加数据。 overwrite 表示在插入数据之前删除现有数据,如果指定的集合或分区已存在。'append'
dest_collection_name导入数据的集合名称'test_float'
dest_partition_name (可选)导入数据的分区名称'partition_1'
collection_parameter集合特定的信息,包括向量维度、索引文件大小和相似度度量。"dimension: 512 index_file_size: 1024 metric_type: 'HAMMING'"

以下是两个配置示例供参考。第一个示例设置了 data_path 参数,而第二个设置了 data_dir。根据需要,你可以根据需要设置 data_pathdata_dir

示例 1

H2M:
  milvus-version: 2.0.0
  data_path:
    - /Users/zilliz/float_1.h5
    - /Users/zilliz/float_2.h5
  data_dir:
  dest_host: '127.0.0.1'
  dest_port: 19530
  mode: 'overwrite'        # 'skip/append/overwrite'
  dest_collection_name: 'test_float'
  dest_partition_name: 'partition_1'
  collection_parameter:
    dimension: 128
    index_file_size: 1024
    metric_type: 'L2'

示例 2

H2M:
  milvus_version: 2.0.0
  data_path:
  data_dir: '/Users/zilliz/HDF5_data'
  dest_host: '127.0.0.1'
  dest_port: 19530
  mode: 'append'        # 'skip/append/overwrite'
  dest_collection_name: 'test_binary'
  dest_partition_name: 
  collection_parameter:
    dimension: 512
    index_file_size: 1024
    metric_type: 'HAMMING'

3. 从 HDF5 迁移数据到 Milvus

使用以下命令运行 MilvusDM 将 HDF5 文件中的数据导入到 Milvus。

$ milvusdm --yaml H2M.yaml

接下来做什么

  • 如果你有兴趣将其他形式的数据迁移到 Milvus 中,
    • 了解如何将数据从 Faiss 迁移到 Milvus(f2m.md)。
  • 如果你想了解有关如何从 Milvus 1.x 迁移到 Milvus 2.0 的信息,
    • 了解版本迁移(m2m.md)。
  • 如果你有兴趣了解更多关于数据迁移工具的信息,