alpine 和 ubuntu 系统中文乱码问题

发布于:2024-08-15 ⋅ 阅读:(71) ⋅ 点赞:(0)

简介

最近在制作alpine的java镜像和Ubuntu的java镜像。输出的日志中的中文,以及附件等相关涉及中文的都变成问号,这是由于系统缺乏相应的编码文件导致,需要在系统里安装相应的中文编码,中文编码主要有zh_CN.gb18030、zh_CN.gbk、zh_CN.gbk2312、zh_CN.utf8。如果中文是gbk编码的,需要将变量LANG设置成gb18030或gbk编码,如果中文是utf8编码的需要LANG设置成utf-8编码。现将安装过程记录如下:

一、alpine系统中文问号乱码

【1】下载地址:

https://alpine-pkgs.sgerrand.com/sgerrand.rsa.pub

https://github.com/sgerrand/alpine-pkg-glibc/releases/download/2.29-r0/glibc-2.29-r0.apk

https://github.com/sgerrand/alpine-pkg-glibc/releases/download/2.29-r0/glibc-bin-2.29-r0.apk

https://github.com/sgerrand/alpine-pkg-glibc/releases/download/2.29-r0/glibc-i18n-2.29-r0.apk

【2】安装glibc

将sgerrand.rsa.pub 放到 /etc/apk/keys目录下,然后执行如下命令安装apk文件

apk add glibc-2.29-r0.apk glibc-bin-2.29-r0.apk glibc-i18n-2.29-r0.apk

【3】添加path变量

export PATH=/usr/glibc-compat/bin:$PATH

【4】使用localedef生成本地化配置

localedef -i en_US -f UTF-8 en_US.UTF-8
localedef -i zh_CN -f UTF-8 zh_CN.UTF-8
localedef -i zh_CN -f GBK zh_CN.GBK
localedef -i zh_CN -f GB18030 zh_CN.GB18030

【5】设置环境变量

export LANG=zh_CN.GB18030
export LANGUAGE="zh_CN:zh:en_US:en"
export LC_TIME="en_US.UTF8"

经过以上步骤以后,如果是GBK编码的中文就不会乱码了,如果是UTF8编码的话,就改成utf8的编码。LANG=zh_CN.UTF-8 。如果是制作dockerfile的话,参考代码如下:

FROM alpine:3.17
ENV LANG=zh_CN.GB18030
ENV LANGUAGE="zh_CN:zh:en_US:en"
ENV LC_TIME=en_US.UTF8
ENV PATH=$PATH:/usr/glibc-compat/bin:$JAVA_HOME/bin

COPY glibc-2.29-r0.apk glibc-bin-2.29-r0.apk glibc-i18n-2.29-r0.apk /tmp
RUN mkdir -p /etc/apk/keys
COPY sgerrand.rsa.pub /etc/apk/keys
RUN    apk add --force-overwrite /tmp/glibc-2.29-r0.apk /tmp/glibc-bin-2.29-r0.apk /tmp/glibc-i18n-2.29-r0.apk \
    && rm -f /tmp/glibc-2.29-r0.apk /tmp/glibc-bin-2.29-r0.apk /tmp/glibc-i18n-2.29-r0.apk \
    && localedef -i en_US -f UTF-8 en_US.UTF-8 \
            && localedef -i zh_CN -f UTF-8 zh_CN.UTF-8 \
            && localedef -i zh_CN -f GBK zh_CN.GBK \
            && localedef -i zh_CN -f GB18030 zh_CN.GB18030

二、ubuntu中文问号乱码

【1】安装libgcc及语言包

apt-get update
apt-get -y install vim language-pack-zh-hans gcc libgcc-s1 libssl-dev

【2】本地化配置

 locale-gen zh_CN.GB18030
 locale-gen zh_CN.GBK
 locale-gen zh_CN.UTF-8
locale-gen en_US.UTF-8

【3】设置环境变量

export LANG=zh_CN.GB18030
export LANGUAGE="zh_CN:zh:en_US:en"
export LC_TIME=en_US.UTF8

经过以上步骤以后,如果是GBK编码的中文就不会乱码了,如果是UTF8编码的话,就改成utf8的编码。LANG=zh_CN.UTF-8 。如果是制作dockerfile的话,参考代码如下:

FROM ubuntu:22.04

ENV LANG=zh_CN.GB18030
ENV LANGUAGE="zh_CN:zh:en_US:en"
ENV LC_TIME=en_US.UTF8

ENV TZ=Asia/Shanghai
RUN ln -snf /usr/share/zoneinfo/${TZ} /etc/localtime && echo ${TZ} > /etc/timezone


RUN     apt-get update \
        && apt-get -y install vim language-pack-zh-hans gcc libgcc-s1 libssl-dev \
        && locale-gen zh_CN.GB18030 \
        && locale-gen zh_CN.GBK \
        && locale-gen zh_CN.UTF-8 \
        && locale-gen en_US.UTF-8 \
        && rm /bin/sh \
        && ln -s /bin/bash /bin/sh \
        && apt-get -y autoremove \
        && echo "LC_TIME=en_US.UTF8" >>/etc/default/locale \
        && rm -rf /var/lib/apt/lists/*

三、系统语言环境确认

【1】alpine 系统下locale命令查看系统语言环境

没有执行本地化时,执行locale -a 命令是不会显示zh_CN.gb18030、zh_CN.gbk、zh_CN.gbk2312、zh_CN.utf8,如果系统中的中文是utf-8编码的话,需要将LANG改成zh_CN.utf8。

执行命令:locale
返回如下:
LANG=zh_CN.GB18030
LC_CTYPE="zh_CN.GB18030"
LC_NUMERIC="zh_CN.GB18030"
LC_TIME=en_US.UTF8
LC_COLLATE="zh_CN.GB18030"
LC_MONETARY="zh_CN.GB18030"
LC_MESSAGES="zh_CN.GB18030"
LC_PAPER="zh_CN.GB18030"
LC_NAME="zh_CN.GB18030"
LC_ADDRESS="zh_CN.GB18030"
LC_TELEPHONE="zh_CN.GB18030"
LC_MEASUREMENT="zh_CN.GB18030"
LC_IDENTIFICATION="zh_CN.GB18030"
LC_ALL=

执行命令:locale -a
返回如下:
C
C.utf8
en_US.utf8
POSIX
zh_CN.gb18030
zh_CN.gbk
zh_CN.gbk2312
zh_CN.utf8

【2】Ubuntu 系统下locale命令查看系统语言环境

没有执行本地化时,执行locale -a 命令是不会显示zh_CN.gb18030、zh_CN.gbk、zh_CN.gbk2312、zh_CN.utf8,如果系统中的中文是utf-8编码的话,需要将LANG改成zh_CN.utf8。

执行命令:
 sh-5.1# locale -a
C
C.utf8
en_US.utf8
POSIX
zh_CN.gb18030
zh_CN.gbk
zh_CN.utf8
zh_SG.utf8

执行命令:
sh-5.1# locale
LANG=zh_CN.GB18030
LANGUAGE=zh_CN:zh:en_US:en
LC_CTYPE="zh_CN.GB18030"
LC_NUMERIC="zh_CN.GB18030"
LC_TIME=en_US.UTF8
LC_COLLATE="zh_CN.GB18030"
LC_MONETARY="zh_CN.GB18030"
LC_MESSAGES="zh_CN.GB18030"
LC_PAPER="zh_CN.GB18030"
LC_NAME="zh_CN.GB18030"
LC_ADDRESS="zh_CN.GB18030"
LC_TELEPHONE="zh_CN.GB18030"
LC_MEASUREMENT="zh_CN.GB18030"
LC_IDENTIFICATION="zh_CN.GB18030"
LC_ALL=

【3】locale中各个变量的讲解

locale命令的详细用法参考:blog.fpliu.com/it/software/GNU/glibc/bin/locale