暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

安装时报指令错误的处理

openGauss 2023-07-25
611

概述

在使用官网提供的镜像安装数据库,有时会遇到一些 "非法指令" "illegal instruction" 的问题,或者在一些本地搭建的虚拟机上,数据库启动失败,但是没有很明确的错误信息的问题。这些往往是由于 CPU 指令集不兼容导致的。

常见的有 3 种:

  • arm CPU 下的 lse 指令

  • x86_64 CPU 下的 rdtscp 指令

  • x86_64 CPU 下的 avx 指令

1. arm 服务器下 LSE 指令

官网发布的 openEuler_arm 包,在编译的时候,打开了ARM_LSE指令集做了编译的优化。但是对于一些其他 arm 服务器,不一定支持。

构建脚本:

    build\script\utils\make_compile.sh
    # it may be risk to enable 'ARM_LSE' for all ARM CPU, but we bid our CPUs are not elder than ARMv8.1

    实测在 鲲鹏 920 和 麒麟 990 的 cpu 芯片下是支持安装的。cpu 可以通过 lscpu 名称查看。

    对于其他不自持该指令的系统,需要去掉 -D__ARM_LSE 指令重新编译即可。

    在编译脚本中 build\script\utils\make_compile.sh,删除掉所有的 -D__ARM_LSE , 重新打包数据库。

      sh build.sh -m release -3rd /sdb/binarylibs -pkg
      # -3rd 是对应三方库二进制的目录

      patch 如下图:

      2. x86 服务器下 rdtscp 指令

      rdtscp 指令集用来检索 CPU 周期计数器,MOT 特性有用到。

      在 server 中位置如下:src\gausskernel\storage\mot\core\infra\synchronization\cycles.h

        /**
            * @brief Retrieve the CPU cycle counter using rdtscp instruction
            * @detail Force processor barrier and memory barrier
            * @return The CPU cycle counter value.
            */
           static __inline __attribute__((always_inline)) uint64_t Rdtscp()
        {
        #if defined(__GNUC__) && (defined(__x86_64__) || defined(__i386__))
               uint32_t low, high;
               __asm__ __volatile__("rdtscp" : "=a"(low), "=d"(high) : : "%rcx");
               return (((uint64_t)high << 32) | low);
        #elif defined(__aarch64__)
               unsigned long cval = 0;
               asm volatile("isb; mrs %0, cntvct_el0" : "=r"(cval) : : "memory");
               return cval;
        #else
        #error "Unsupported CPU architecture or compiler."
        #endif
           }

        有些自己搭建的虚拟机可能没有这个指令集,导致数据库无法启动。

        检测方式

        使用 lscpu 命令进行检测是否具有该指令集: lscpu | grep rdtscp

        解决方法

        如果没有该指令集,需要开启 CPU 直通模式 (host-passthrough)

        3. x86 服务器下 avx 指令

        avx 指令集用来进行加速计算,主要是 db4ai 在使用。该指令集从 2.1.0 版本开始引入,如果存在 2.1.0 之前版本可以运行数据库而 2.1.0 之后数据库启动失败,也有可能是没有该指令导致。

        检测方式

        使用 lscpu 命令进行检测是否具有该指令集: lscpu | grep avx

        解决方法

        如果没有该指令集,从代码中删掉该指令集的引用,重新打包数据库。

        该指令集的引用在 Makefile 里面,可以全局搜索 -mavx , 删掉如下编译选项里面加载-mavx 指令,然后重新打包构建即可

          ifeq ($(PLATFORM_ARCH),x86_64)
                 override CPPFLAGS += -mavx
          endif
                 

          文章转载自openGauss,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

          评论