最近在学习书生.浦江大模型实战训练营,所有课程都免费,以关卡的形式学习,也比较有意思,提供免费的算力实战,真的很不错(无广)!欢迎大家一起学习,打开LLM探索大门:邀请连接,
PS,邀请有算力哈哈
。
一、Wordcount实现
1.任务一
请实现一个wordcount函数,统计英文字符串中每个单词出现的次数。返回一个字典,key为单词,value为对应单词出现的次数。
input:
"""Hello world!
This is an example.
Word count is fun.
Is it fun to count words?
Yes, it is fun!"""
output:
{'hello': 1, 'world': 1, 'this': 1, 'is': 4, 'an': 1, 'example': 1, 'word': 1, 'count': 2,
'fun': 3, 'it': 2, 'to': 1, 'words': 1, 'yes': 1}
TIPS:记得先去掉标点符号,然后把每个单词转换成小写。不需要考虑特别多的标点符号,只需要考虑实例输入中存在的就可以。
代码实现:
import re
from collections import defaultdict
def wordcount(text):
# 使用正则表达式去掉标点符号,并将文本转换为小写
cleaned_text = re.sub(r'[.,!?;:"]', '', text).lower()
# 将字符串分割成单词
words = cleaned_text.split()
# 使用defaultdict来统计单词出现次数
count = defaultdict(int)
for word in words:
count[word] += 1
return dict(count)
# 示例使用
text = """
Got this panda plush toy for my daughter's birthday,
who loves it and takes it everywhere. It's soft and
super cute, and its face has a friendly look. It's
a bit small for what I paid though. I think there
might be other options that are bigger for the
same price. It arrived a day earlier than expected,
so I got to play with it myself before I gave it
to her.
"""
result = wordcount(text)
print(result)
代码测试:
返回结果:
{'got': 2, 'this': 1, 'panda': 1, 'plush': 1, 'toy': 1, 'for': 3, 'my': 1, "daughter's": 1, 'birthday': 1, 'who': 1, 'loves': 1, 'it': 5, 'and': 3, 'takes': 1, 'everywhere': 1, "it's": 2, 'soft': 1, 'super': 1, 'cute': 1, 'its': 1, 'face': 1, 'has': 1, 'a': 3, 'friendly': 1, 'look': 1, 'bit': 1, 'small': 1, 'what': 1, 'i': 4, 'paid': 1, 'though': 1, 'think': 1, 'there': 1, 'might': 1, 'be': 1, 'other': 1, 'options': 1, 'that': 1, 'are': 1, 'bigger': 1, 'the': 1, 'same': 1, 'price': 1, 'arrived': 1, 'day': 1, 'earlier': 1, 'than': 1, 'expected': 1, 'so': 1, 'to': 2, 'play': 1, 'with': 1, 'myself': 1, 'before': 1, 'gave': 1, 'her': 1}
二、Vscode连接远程服务器Debug
首先根据上面一篇博客,将Vscode连接上远程服务器,将wordcount.py代码同步到远程服务器上,在程序上打上三个断点:
选择左侧的debug按钮,选择运行与调试
即可进入debug界面,debug面板各按钮功能介绍:
- continue: 继续运行到下一个断点
- step over:跳过,可以理解为运行当前行代码,不进入具体的函数或者方法。
- step into: 进入函数或者方法。如果当行代码存在函数或者方法时,进入代码该函数或者方法。如果当行代码没有函数或者方法,则等价于step over。
- step out:退出函数或者方法, 返回上一层。
- restart:重新启动debug
- stop:终止debug
使用VSCode的debug功能来更容易地找到和修复你Python代码中的错误,也可以随时关注变量的变化,当然在每一步print也是一个不错的选择,不过遇到大型项目需要debug时,还是断点的效率更高。