第十九章:Python-pyttsx3 库实现文本转语音功能

发布于:2025-04-01 ⋅ 阅读:(27) ⋅ 点赞:(0)

前言

    在开发语音交互应用或需要文本转语音功能的项目时,pyttsx3 是一个非常实用的 Python 库。它支持离线语音合成无需联网即可将文本转换为语音。本文将详细介绍 pyttsx3 的功能、用法以及常见问题的解决方法,并通过示例代码帮助你快速上手。资源绑定附上完整资料供读者参考学习(含效果视频)!

一、pyttsx3 是什么?

   pyttsx3 是一个轻量级的 Python 库,用于将文本转换为语音。它支持多种语音引擎,包括 Windows 的 SAPI5 和 NSSpeechSynthesizer(Mac),并且可以离线运行,无需依赖外部服务

特点:

  1. 离线运行:无需联网即可使用。

  2. 多平台支持:支持 Windows、Mac 和 Linux。

  3. 简单易用:API 简洁,易于集成到项目中。

  4. 可扩展性:支持自定义语音引擎和属性。

二、安装 pyttsx3

在开始之前,确保你已经安装了 pyttsx3。可以通过以下命令安装:

pip install pyttsx3

Windows用户可能需要额外安装:

pip install pywin32

记得把这两个库都加到Python解释器里

安装完成后,就可以开始使用了。

三、pyttsx3 基本用法

1. 初始化引擎

pyttsx3 的核心是 init() 方法,用于初始化语音引擎。默认情况下,它会自动选择系统支持的引擎。

Python

import pyttsx3

# 初始化引擎
engine = pyttsx3.init()

2. 语音播放

使用 say() 方法将文本传递给引擎,然后调用 runAndWait() 方法开始播放

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.say("Hello, welcome to the pyttsx3 tutorial!")
engine.runAndWait()

效果展示:

3. 保存语音到文件

可以将生成的语音保存为 WAV 文件,方便后续使用。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.save_to_file("Hello, welcome to the pyttsx3 tutorial!", "保存语音文件.wav")
engine.runAndWait()

效果展示

4.什么是 .wav 格式?

.wav(Waveform Audio File Format)是一种常见的音频文件格式,主要用于存储音频数据。以下是它的主要特点:

  1. 无损音频格式
    .wav 是一种无损音频格式,能够完整地保存音频的原始数据不会因压缩而损失音质。因此,它常用于高质量音频的存储和编辑。

  2. 文件较大
    由于 .wav 是无损格式,文件通常较大。例如,一分钟的音频可能占用几 MB 的存储空间。

  3. 兼容性好
    .wav 格式被广泛支持,几乎所有的音频播放器和编辑工具都可以读取和处理 .wav 文件。

  4. 应用场景

    • 语音合成和音频编辑(如 pyttsx3 的输出)。

    • 音频录制和后期处理。

    • 音频分析和研究。

四、语音属性设置

pyttsx3 提供了多种属性设置,可以自定义语音的速度、音量和声音

1. 设置语音速度

速度的范围通常在 0 到 200 之间,默认值为 200

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.setProperty('rate', 150)  # 设置速度为 150
engine.say("永远相信美好的事情即将发生 这个语音速度快吗")
engine.runAndWait()

效果展示

2. 设置音量

音量的范围是 0.0 到 1.0,默认值为 1.0

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.setProperty('volume', 0.5)  # 设置音量为 50%
engine.say("Are you ok! 这个声音大吗 大的话给我点个赞好吗?")
engine.runAndWait()

效果展示

3. 设置声音

可以切换不同的语音声音,例如男性或女性声音。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')

# 切换到第一个可用的女性声音
for voice in voices:
    if "female" in voice.name.lower():
        engine.setProperty('voice', voice.id)
        break

engine.say("这是一个女生的声音")
engine.runAndWait()

效果展示

五、pyttsx3 函数和参数总结

以下是 pyttsx3 的主要函数及其参数的详细说明:

函数/属性 参数 参数类型 说明
init() driverName str 指定语音引擎驱动名称,默认为系统默认引擎
say(text) text str 将文本添加到语音队列
runAndWait() 开始播放语音并等待完成
save_to_file() textfilename strstr 将语音保存到文件,支持 WAV 格式
setProperty() namevalue strany 设置引擎属性,如速度、音量、声音等
getProperty() name str 获取引擎属性值
setProperty('rate', value) value int 设置语音速度,范围通常为 0-200
setProperty('volume', value) value float 设置音量,范围为 0.0-1.0
setProperty('voice', value) value str 设置语音声音,值为可用声音的 ID
stop() 停止当前语音播放
endLoop() 结束语音播放循环

六、进阶用法

1. 获取可用声音列表

可以列出系统中所有可用的声音,并选择特定的声音。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')

print("Available voices:")
for i, voice in enumerate(voices):
    # 手动设置语言信息
    if "Huihui" in voice.name:
        voice.languages = ["zh-CN"]  # 中文(简体)
    elif "Zira" in voice.name:
        voice.languages = ["en-US"]  # 英语(美国)

    print(f"{i+1}. {voice.name} - {voice.languages[0]}")

效果展示

2. 动态调整语音属性

可以在播放过程中动态调整语音属性,例如速度和音量。

Python示例代码

import pyttsx3

engine = pyttsx3.init()

# 慢速播放
engine.setProperty('rate', 100)
engine.say("这是慢速语音")

# 快速播放
engine.setProperty('rate', 250)
engine.say("这是快速语音")

engine.runAndWait()

效果展示

3. 多语言支持

如果系统支持多语言语音,可以指定语言进行语音合成

Python示例代码

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')

# 切换到中文语音
for voice in voices:
    if "Chinese" in voice.name:
        engine.setProperty('voice', voice.id)
        break

engine.say("啊阿狸不会拉杆-pyttsx3!")
engine.runAndWait()

效果展示

4.综合应用-语音助手

import pyttsx3
import datetime
import time
import random
import webbrowser

class SmartVoiceAssistant:
    def __init__(self,name="啊阿狸不会拉杆"):
        self.name=name
        self.engine=pyttsx3.init()
        # 设置默认语音参数
        self.engine.setProperty('rate',160)
        self.engine.setProperty('volume',0.9)
        # 尝试设置女声(如果有的话)
        voices=self.engine.getProperty('voices')
        for voice in voices:
            if voice.gender=='female'or('female'in voice.name.lower()):
                self.engine.setProperty('voice',voice.id)
                break
    def speak(self,text):
        """说话功能"""
        print(f"{self.name}:{text}")
        self.engine.say(text)
        self.engine.runAndWait()
    def greet(self):
        """根据时间问候"""
        hour=datetime.datetime.now().hour
        if 5<=hour<12:
            greeting="早上好!阳光明媚,祝你有个美好的一天。"
        elif 12<=hour<18:
            greeting="下午好!希望你今天过得愉快。"
        else:
            greeting="晚上好!今天过得怎么样?"
            self.speak(greeting)
    def tell_time(self):
        """报时功能"""
        now=datetime.datetime.now()
        time_str=now.strftime("%H点%M分")
        self.speak(f"现在是{time_str}")
    def tell_date(self):
        """报日期功能"""
        now=datetime.datetime.now()
        date_str=now.strftime("%Y年%m月%d日")
        weekday_names=["星期一","星期二","星期三","星期四","星期五","星期六","星期日"]
        weekday=weekday_names[now.weekday()]
        self.speak(f"今天是{date_str},{weekday}")
    def tell_weather(self,condition="晴天",temperature="26"):
        """天气播报(模拟数据)"""
        weather_templates=[
            f"今天天气{condition},气温{temperature}度,是个{self._get_day_comment(condition)}。",
            f"气象部门报告,今天{condition},温度{temperature}度。",
            f"今日天气:{condition},{temperature}度。{self._get_weather_advice(condition)}"
]
        self.speak(random.choice(weather_templates))
    def _get_day_comment(self,condition):
        """根据天气给出评价"""
        good_conditions=["晴天","多云","晴间多云"]
        if condition in good_conditions:
            return "适合户外活动的好日子"
        elif "雨" in condition:
            return "适合在家看书的日子"
        else:
            return "普通的日子"

    def _get_weather_advice(self,condition):
        """根据天气给出建议"""
        if "雨" in condition:
            return "记得带伞哦!"
        elif "晴" in condition:
            return "记得防晒!"
        elif "雪" in condition:
            return "注意保暖!"
        else:
            return "祝你有愉快的一天!"

    def read_news(self,news_list):
        """阅读新闻"""
        self.speak("以下是今日热点新闻:")
        for i,news in enumerate(news_list,1):
            self.speak(f"新闻{i}:{news}")
            time.sleep(0.5)

    def set_reminder(self,minutes,message):
        """设置提醒"""
        self.speak(f"好的,我会在{minutes}分钟后提醒你{message}")

        def reminder_task():
            time.sleep(minutes*60)
            self.speak(f"提醒时间到!{message}")

# 在实际应用中,这里应该使用线程而不是阻塞
#import threading
# reminder_thread = threading.Thread(target=reminder_task)
# reminder_thread.daemon = True
# reminder_thread.start()

# 为了演示,我们使用以下注释掉的代码
# reminder_task()

    def tell_joke(self):
        """讲笑话"""
        jokes=[
            "为什么程序员总是分不清万圣节和圣诞节?因为Oct 31 和 Dec 25 是一样的。",
            "一个程序员去买菜,妻子叮嘱他:'买10个苹果,如果看到有香蕉,就买20个。'结果他回来了,带了20个苹果。妻子问他怎么回事,他说:'他们有香蕉。'",
            "如何判断一个人是否是程序员?问他下楼梯要多久,如果他回答'O(n)',那他就是程序员。",
            "有一天,程序员的妻子让他去买东西:'去买一瓶牛奶,如果有鸡蛋,买六个。'程序员回来后,带了六瓶牛奶。妻子问他:'为什么买六瓶?'他回答:'因为有鸡蛋。'"
]
        self.speak(random.choice(jokes))

    def search_web(self,query):
        """模拟网络搜索"""
        self.speak(f"正在搜索:{query}")
        # 实际应用中可以打开浏览器
        webbrowser.open(f"https://www.google.com/search?q={query}")

    def interactive_mode(self):
        """交互模式"""
        self.greet()
        self.speak(f"我是{self.name},你的智能语音助手。有什么我能帮你的吗?")
        self.speak("我可以告诉你时间、日期、天气,读新闻,讲笑话,或者设置提醒。")

# 在实际应用中,这里应该有语音识别和自然语言处理
# 但为了演示,我们使用简单的输入
        print("\n可用命令:时间、日期、天气、新闻、笑话、提醒、退出")

        while True:
            command=input("\n请输入命令: ").strip().lower()

            if "退出" in command:
                self.speak("再见,期待与你的下次相遇!")
                break
            elif "时间" in command:
                self.tell_time()
            elif "日期" in command:
                self.tell_date()
            elif "天气" in command:
                self.tell_weather()
            elif "新闻" in command:
                sample_news=[
                    "科学家发现新的治疗方法,有望攻克多种疑难杂症",
                    "全国多地加大环保力度,空气质量显著改善",
                    "最新研究表明,每天喝八杯水可能并非必要"
]
                self.read_news(sample_news)
            elif "笑话" in command:
                self.tell_joke()
            elif "提醒" in command:
                self.speak("你想要我提醒你什么?")
                message=input("提醒内容: ")
                self.speak("几分钟后提醒?")
                try:
                    minutes=int(input("分钟数: "))
                    self.set_reminder(minutes,message)
                except ValueError:
                    self.speak("抱歉,我没有理解这个时间")
            else:
                self.speak("抱歉,我没有理解你的命令。可以请你重新说一次吗?")

# 使用示例
if  __name__=="__main__":
    assistant=SmartVoiceAssistant()
# 单独功能演示
# assistant.greet()
# assistant.tell_time()
# assistant.tell_date()
# assistant.tell_weather("小雨", "22")
# assistant.tell_joke()

# 交互模式
# assistant.interactive_mode()

# 简单演示
assistant.speak("演示开始")
assistant.greet()
assistant.tell_time()
assistant.tell_weather()
assistant.tell_joke()
assistant.speak("演示结束,感谢使用!")

效果展示

七、常见问题与解决方法

1. 语音引擎初始化失败

如果初始化失败,可能是因为系统缺少语音引擎。可以尝试以下方法:

  • 确保系统已安装语音引擎(如 Windows 的 SAPI5)。

  • 指定驱动名称初始化:

    Python

    engine = pyttsx3.init(driverName='sapi5')

2. 语音播放无声音

可能的原因包括:

  • 音量设置为 0

  • 选择了无效的声音。

  • 系统音量静音或过低

3. 保存的语音文件无法播放

确保保存的文件路径正确,并且文件格式支持播放(如 WAV)。

八、总结

  pyttsx3 是一个功能强大且易于使用的文本转语音库,适合需要离线语音合成的场景。通过本文的介绍,你应该已经掌握了 pyttsx3 的基本用法和一些进阶技巧。希望这些内容能帮助你在项目中更好地应用 pyttsx3资源绑定附上完整资料供读者参考学习(含效果视频)!

如果你有任何问题或建议,欢迎在评论区留言!