华为GaussDB A 配置文件模板

墨天轮 2019-10-12

1492

配置文件模板

#name：算法名，唯一标识一个算法库，算法名长度不长于4096字节，不能重复，CPU和GPU同样算法库实现的也不能重复#

#order：排序方式，只能是asc或者desc，其他值非法

#useDefaultModel：是否使用默认模型标志，只能是true或者false，其他值非法

#libs：算法库的路径

#userLibs: 第三方公司算法库路径，路径长度不长于4096字节

#cpuLib：第三方公司CPU算法库路径

#gpuLib：第三方公司GPU算法库路径

#systemLibs：自研算法库路径

#cpuLib：自研CPU算法库路径

#gpuLib：自研GPU算法库路径

#cpu算法必须提供，gpu算法可以选择提供。

#formula: 原始向量计算公式相关配置

#handler：处理方式是用平台内置的还是使用第三方厂商开发的。除Formula_Embedded_L2_Float32和Formula_Specific_Impl以外的值非法

#Formula_Embedded_L2_Float32: 内置的L2 FLOAT计算方法，自研CPU算法库路径必须提供并且有效，自研GPU算法库路径可以选择提供。

#Formula_Specific_Impl: 第三方厂商实现的方法，第三方CPU算法库路径必须提供并且有效，第三方GPU算法库路径可以选择提供。

#model: 优化算法的模型相关配置

#handler：处理方式是用平台内置的还是使用第三方厂商开发的，只支持以下模型名称

#Model_Embedded_XQ: 内置的XQ模型

#Model_Embedded_HR: 内置的HR模型

#Model_Not_Supported: 内置的空模型，和handler不设置的作用相同，表示该算法没有优化模型

#Model_Specific_Impl_XQ 第三方厂商实现的XQ模型

#Model_Specific_Impl_HR 第三方厂商实现的HR模型

#centralize：模型中心点计算方式，目前不支持，必须配置Centralize_Not_Supported

#Centralize_Not_Supported：不支持

#Centralize_Embedded_Xmean：内置Xmean

#params：算法库使用到的参数（平台能感知，但是不理解其意义，由算法库提供者指定）

#centroidNum：中心点个数

#subVecSize：

#注意：

#1、配置算法库路径和模型路径必须保证路径下相应文件存在。

#2、配置存储介质类型如果是GPU，则必须保证算法配置支持GPU算法

#3、reload操作只能删除，增加算法配置，不能修改算法配置，删除算法配置必须保证算法没有使用。

#LOPQ算法配置注意事项：

#1、LOPQ算法参数不支持修改，保证默认值

#2、LOPQ算法必须配置模型路径，内置了L2距离计算函数

#3、LOPQ算法触发训练最小数据必须大于52万，配置值trainThreshold必须大于520000。

#4、LOQP算法短特征长度是36

#5、LOPQ算法支持使用聚类优化，聚类优化缩小检索范围，置true使用聚类，否则不使用，不配置表示不使用聚类优化

algorithmConfig:

#yt pq model

#algorithm_yt_pq_model:

#centralize:

#handler: Centralize_Not_Supported

#formula:

#handler: Formula_Specific_Impl #Formula_Embedded_L2_Float32 #Formula_Specific_Impl

#libs:

#sysCpuLib: no_so

#sysGpuLib: no_so

#userCpuLib: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libcpu_ytpq_algorithm.so

#userGpuLib: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libgpu_pq_algorithm.so

#model:

#handler: Model_Specific_Impl_XQ

#expandSearchRatio: 50

#calcCodecCpu: true

#name: algorithm_yt_pq_model

#order: asc

#params:

#paramBits: 8

#paramM: 32

#paramDim: 128

#modelPath: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/yt_pq_model.model

#libPath: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libcalcDistance.so

#version: 0.4;0.000,0.446,0.496,0.825,0.909,0.923,0.943,1.00;-1.00,0.135,0.248,0.341,0.421,0.501,0.728,1.00

#useDefaultModel: false

#lopq model cluster

algorithm_lopq_model_cluster:

centralize:

handler: Centralize_Not_Supported

formula:

handler: Formula_Specific_Impl #Formula_Embedded_L2_Float32 #Formula_Specific_Impl

libs:

sysCpuLib: no_so

sysGpuLib: no_so

userCpuLib: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libcpu_lopq_algorithm.so

userGpuLib: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libgpu_lopq_algorithm.so

model:

handler: Model_Specific_Impl_XQ #Model_Not_Supported #Model_Specific_Impl_XQ

expandSearchRatio: 50

useCluster: true #此配置只支持LOPQ算法优化，其它算法不配置

order: asc

params:

LOPQ_PARAM_M: 32

LOPQ_PARAM_V: 100

LOPQ_PARAM_D: 128

LOPQ_PARAM_Ks: 256

LOPQ_PARAM_sample_ratio: 100 #in 1%

modelPath: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/lopq_model_d128_v100_m32_ks256_from_100_w

useDefaultModel: false

#lopq

algorithm_lopq_model:

centralize:

handler: Centralize_Not_Supported

formula:

handler: Formula_Specific_Impl #Formula_Embedded_L2_Float32 #Formula_Specific_Impl

libs:

sysCpuLib: no_so

sysGpuLib: no_so

userCpuLib: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libcpu_lopq_algorithm.so

userGpuLib: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libgpu_lopq_algorithm.so

model:

handler: Model_Specific_Impl_XQ #Model_Not_Supported #Model_Specific_Impl_XQ

expandSearchRatio: 50

order: asc

params:

LOPQ_PARAM_M: 32

LOPQ_PARAM_V: 100

LOPQ_PARAM_D: 128

LOPQ_PARAM_Ks: 256

LOPQ_PARAM_sample_ratio: 100 #in 1%

modelPath: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/lopq_model_d128_v100_m32_ks256_from_100_w

useDefaultModel: false

#gpu pq model

algorithm_gpu_pq_model:

centralize:

handler: Centralize_Not_Supported

formula:

handler: Formula_Specific_Impl #Formula_Embedded_L2_Float32 #Formula_Specific_Impl

libs:

sysCpuLib: no_so

sysGpuLib: no_so

userCpuLib: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libcpu_pq_algorithm.so

userGpuLib: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libgpu_pq_algorithm.so

model:

handler: Model_Specific_Impl_XQ

expandSearchRatio: 50

order: asc

params:

paramBits: 8

paramM: 32

paramDim: 256

modelPath: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/pq_global.model

useDefaultModel: false

#cpu pq model

algorithm_cpu_pq_model:

centralize:

handler: Centralize_Not_Supported

formula:

handler: Formula_Specific_Impl #Formula_Embedded_L2_Float32 #Formula_Specific_Impl

libs:

sysCpuLib: no_so

sysGpuLib: no_so

userCpuLib: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/libcpu_pq_algorithm.so

userGpuLib: no_so

model:

handler: Model_Specific_Impl_XQ

expandSearchRatio: 50

order: asc

params:

paramBits: 8

paramM: 32

paramDim: 256

modelPath: /opt/huawei/Bigdata/mppdb/core/lib/libsimsearch/pq_global.model

useDefaultModel: true

#searchlet 配置

searchletConfig:

##检索临时数据目录,内部使用,用于存储结构化数据

folderName: ./simsearch/data

##训练编码平台使用，训练编码所需要的向量个数，向量个数小于配置值不启动训练编码

model:

trainThreshold: '1000000'

##特征向量组合配置，配置大小会影响数据存储时间和查询时间，

##建议最小配置值：dataSetSize：10000， segmentSize：1000

##dataSetSize：一个dataset内存放向量个数

##segmentSize：一个segment内存放向量个数

##性能测试建议配置 segmentSize 10000000，dataSetSize 20000000

##内存空间需要调整需要加大

dataSet:

segmentSize: '1000000'

dataSetSize: '2000000'

##storageType：存储介质类型：配置值GPU_MEM，CPU_MEM，SSD，HDD，其它配置值非法

##GPU_MEM - GPU显存 CPU_MEM - CPU内存 SSD- SSD文件存储 HDD- HDD硬盘文件存储, 其中SSD存储类型未实现。

##注意：1、存储类型配置可以选择配置，codec，modelID是预制属性，代表短特征和模型ID，名字不能修改。

##2、存储类型配置值必须是结构化数据的子集。

##3、如果没有配置存储介质，短特征默认存储在GPU，模型ID默认存储在HDD，其他属性默认存储介质类型CPU_MEM。

##4、如果配置了GPU算法，没有配置GPU资源，配置非法。

##5、如果配置了GPU存储介质，GPU设备必须存在

##6、如果配置没有GPU设备，GPU资源配置值必须是-1，同时不能配置GPU算法。

#storageType: #GPU_MEM CPU_MEM SSD HDD

#codec: CPU_MEM

#modelID: HDD

查看更多：华为GaussDB 200 基于GaussDB 200的图像特征检索

gaussdb a

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者

华为GaussDB A 配置文件模板

配置文件模板

评论