RDKit 给3D信息缺失的sdf生成三维结构

发布于:2025-02-12 ⋅ 阅读:(180) ⋅ 点赞:(0)

要生成包含三维结构的 SDF 文件,可以使用 RDKit 等化学信息学工具。以下是一个 Python 脚本示例,使用 RDKit 读取 SDF 文件、生成三维结构并保存。

### 安装 RDKit
如果尚未安装 RDKit,可以通过以下命令安装:

```bash
conda install -c conda-forge rdkit
```

### Python 脚本

```python
import os
from rdkit import Chem
from rdkit.Chem import AllChem

def generate_3d_structure(input_sdf, output_sdf):
    # 读取 SDF 文件
    suppl = Chem.SDMolSupplier(input_sdf)
    writer = Chem.SDWriter(output_sdf)

    for mol in suppl:
        if mol is not None:
            # 生成三维结构
            AllChem.EmbedMolecule(mol)
            AllChem.UFFOptimizeMolecule(mol)
            # 写入新的 SDF 文件
            writer.write(mol)

    writer.close()

def process_directory(directory):
    for filename in os.listdir(directory):
        if filename.endswith(".sdf"):
            input_sdf = os.path.join(directory, filename)
            output_sdf = os.path.join(directory, f"3d_{filename}")
            generate_3d_structure(input_sdf, output_sdf)
            print(f"Processed {filename} and saved to {output_sdf}")

if __name__ == "__main__":
    # 指定目录
    directory = "path/to/your/directory"
    process_directory(directory)
```

### 脚本说明

1. **generate_3d_structure**: 读取 SDF 文件,生成三维结构并保存。
2. **process_directory**: 遍历指定目录,处理所有 `.sdf` 文件。
3. **EmbedMolecule**: 生成三维坐标。
4. **UFFOptimizeMolecule**: 使用 UFF 力场优化结构。

### 使用步骤

1. 将脚本保存为 `generate_3d_structures.py`。
2. 修改 `directory` 变量为目标目录路径。
3. 运行脚本:

```bash
python generate_3d_structures.py
```

脚本会为每个 `.sdf` 文件生成一个包含三维结构的新文件,文件名以 `3d_` 开头。


网站公告

今日签到

点亮在社区的每一天
去签到