批量文件编码转换用python实现的utf8转gb2312,vscode设置特殊文件的默认打开编码

发布于:2024-09-18 ⋅ 阅读:(42) ⋅ 点赞:(0)

批量文件编码转换用python实现的utf8转gb2312, 任意编码之间的相互转换都是可以的.改一下下面的参数即可

convert.py文件内容如下

import os
import glob
import chardet
 
#检测文件编码类型
def detect_file_encoding(file_path):
    with open(file_path, 'rb') as f:
        data = f.read()
        result = chardet.detect(data)
        encoding = result['encoding']
        confidence = result['confidence']
    return encoding, confidence
  
  
def convert_encoding(file_path, from_encoding='utf-8', to_encoding='gb2312'):  
    """  
    将文件的编码从一种转换为另一种。  
      
    :param file_path: 文件的路径  
    :param from_encoding: 原始编码  
    :param to_encoding: 目标编码  
    """  
    try:  
        #判断文件内容的编码类型,如果与to_encoding相同则不转换
        det_encoding, confidence=detect_file_encoding(file_path) 
        
        if(det_encoding == to_encoding):
            print(f"{file_path} is already in {to_encoding} encoding")
            return
        
        # 读取文件内容  
        with open(file_path, 'r', encoding=from_encoding) as file:  
            content = file.read()  
        
        # 写入文件内容到新文件(先写入临时文件,然后替换原文件)  
        temp_file_path = file_path + '.tmp'  
        with open(temp_file_path, 'w', encoding=to_encoding, errors='ignore') as file:  
            file.write(content)  
          
        # 替换原文件  
        os.remove(file_path)  
        os.rename(temp_file_path, file_path)  
        print(f"Converted {file_path} from {from_encoding} to {to_encoding}")  
    except Exception as e:  
        print(f"Failed to convert {file_path}: {e}")  
  
 
  
if __name__ == "__main__":  
    
    file_or_folder_to_convert = 'G:/demo/src/gb3l/'  # 修改为你的文件夹路径或文件路径  
    from_encoding='utf-8'
    to_encoding  ='gb2312'
    file_extensions=['.h','.c'] # 修改为你需要转换的文件类型
    #判断是文件还是文件夹
    if os.path.isfile(file_or_folder_to_convert): 
        #转换单个文件
        convert_encoding(file_or_folder_to_convert)  
    else:
        #转换文件夹下所有文件
        for root, dirs, files in os.walk(file_or_folder_to_convert):  
            for file in files:  
                #取文件扩展名
                file_extension = os.path.splitext(file)[1]
                if (file_extension in file_extensions):  
                    file_path = os.path.join(root, file)   
                    convert_encoding(file_path)

使用的时候只需要修改 代码中的这几个参数即可.

    file_or_folder_to_convert = 'G:/demo/src/gb3l/'  # 修改为你的文件夹路径  
    from_encoding='utf-8'
    to_encoding  ='gb2312'
    file_extensions=['.h','.c'] # 修改为你需要转换的文件类型

使用前需要安装python 3.8以上.
然后使用下面的命令安装chardet 库

	$> pip install chardet 

使用方法, 如下

	$> python convert.py

参数路径什么的, 直接在代码中改.这么简单的代码,是个程序员就会改. 主打一个简单易用.

vscode中指定某种类型的文件打开时的编码格式

按住ctrl+, 在弹出的设置中, 点击右上角的 这个打开json设置图标.
在这里插入图片描述
我的配置如下, .c和.h, 还有.v文件都改成了gb2312编码.

{
    "git.openRepositoryInParentFolders": "never",
    "Codegeex.Privacy": true,
    "EIDE.ARM.INI.Path": "d:\\Keil_v5\\UV4\\UV4.exe",
    "terminal.integrated.scrollback": 3000,
    "workbench.editorAssociations": {
        "*.c": "default"
    },
    "Codegeex.Comment.LanguagePreference": "中文",
    "files.associations": {
        "*.v": "verilog",
        "*.c": "c",
        "*.h": "c"
    },
    "[c]": { 
            "files.encoding": "gb2312" //设置c文件编码
    },
    "[verilog]": { 
            "files.encoding": "gb2312" //设置verilog文件编码
    }
}

网站公告

今日签到

点亮在社区的每一天
去签到