前言
当我们在处理一些数据来自系统外部的时候,可能来自 API、终端用户输入或者其他途径,Web 开发中有句话叫做:永远不要相信用户的输入。
所以,我们可能需要检查、校验这些数据,将这些数据格式化、标准化,以至于这些数据满足我们真实程序的数据输入,保证项目的正确执行。
Pydantic 介绍
Pydantic 是一个 Python 库,它提供了一种简单方便的方法来验证和操作数据。它的创建是为了帮助简化数据验证过程并提高开发人员的效率。 Pydantic 与 Python 的数据结构无缝集成,并提供灵活且用户友好的 API 来定义和验证数据。使用 Pydantic,开发人员可以定义他们的数据结构和验证规则,库将自动验证传入数据并在不满足任何规则时引发错误。这有助于确保项目中使用的数据是一致的并符合要求的标准。
官方介绍:使用 Python 类型注释的数据验证和设置管理。 pydantic 在运行时强制执行类型提示,并在数据无效时提供用户友好的错误。定义数据应该如何在纯正的、规范的 Python 中;用 pydantic 验证它。
Pydantic 提供 BaseModel 让开发者能够通过继承该类并且利用 typing 注记类别属性的数据类型,保证我们不用写过多的代码就拥有基本的数据验证功能。
定义模型时,被用作请求主体对象和请求-响应对象的类型提示。在本文中,我们将简单看一下在请求体中使用Pydantic 模型来处理 POST 请求。
Pydantic 安装
pip install pydantic
但是如果你是直接安装好了 FastAPI ,这一步可以跳过,因为 FastAPI 框架就使用了 Pydantic。
Pydantic 优点
- 易于使用: Pydantic 很容易安装与使用,并且有一个简单的 API,使得所有开发者都可以快速上手使用。
- 快速验证: Pydantic 快速有效地执行数据验证,使其适合于在高性能的应用程序中使用。
- 自动生成文档: Pydantic 可以为你的数据模型自动生成文档,节省时间,并且更容易理解你的数据结构。
- 类型提示支持: Pydantic 支持类型提示,使开发人员更容易定义数据结构,避免在代码中出现错误。
- 与 FastAPI 集成: Pydantic 可以很容易地与FastAPI(一个高性能的 Python 网络框架)集成,为 API 提供自动请求和响应验证。
- 自定义验证规则: Pydantic 允许开发人员定义自定义的验证规则,使得在需要的时候可以实现复杂的验证逻辑。
- 一致的数据: Pydantic 确保项目中使用的数据是一致的,并符合所需的标准,减少了错误的风险,使代码库的维护更加容易。
什么是类型注解
Python 是动态类型的语言,所以在同一个命名空间中,变量的值可以是字符串也可以是数组,比如:
>>> x = 4
>>> type(x)
<class 'int'>
>>> x = "hello, 宇宙之一粟"
>>> type(x)
<class 'str'>
大约在 Python 3.5 起引入了 type hints 类型注解,虽然 Python 在运行时不强制执行函数和变量类型注解,但这些注解可用于类型检查器、IDE、静态检查器等第三方工具,这些工具就可以帮助我们侦测类型上的错误。
最简单的注解方式如下:
def hello(name: str) -> str:
return 'Hello ' + name
这里面的 : str
声明 name 字段为字符串,如果传入 int 类型,编译器就会得到报错:
利用 Pydantic 定义模型
我们在定义如下 Book 模型的时候,我们声明了 id 为数字类型,Name 到 ISBN 都为字符串类型,Tags 为列表类型,通过继承自 BaseModel
的特性,Pydantic 会自动帮我们验证型态的正确性:
from pydantic import BaseModel
class Book(BaseModel):
id: int
Name: str
Author: str
Publisher: str
ISBN: str
Tags: list[str]
HeadFirstPython = Book(
id = 1,
Name = 'Head First Python, 2nd Edition',
Author = 'Paul Barry',
Publisher ="O'Reilly Media, Inc.",
ISBN = "9781491919538",
Tags = ["Python", "Head Frist"]
)
如果这样定义之后,我们的上述的 HeadFirstPython 不会报任何错误,但是如果我们的 id 还没定义,如下:
from pydantic import BaseModel
class Book(BaseModel):
id: int
Name: str
Author: str
Publisher: str
ISBN: str
Tags: list[str]
HeadFirstPython = Book(
id = "notdefineyet",
Name = 'Head First Python, 2nd Edition',
Author = 'Paul Barry',
Publisher ="O'Reilly Media, Inc.",
ISBN = "9781491919538",
Tags = ["Python", "Head Frist"]
)
则会报一个 id 类型错误的报错:
但是如果你定义 id 为 id = "1",
则不会报错,因为 Pydantic 帮助我们自动实现了类型转换,如果想要严格控制 int 类型,需要导入 StrictInt
,StrictString
同理,代码如下:
from pydantic import BaseModel, StrictInt, StrictStr
class Book(BaseModel):
# id: int
id: StrictInt
# Name: str
Name: StrictStr
Author: str
Publisher: str
ISBN: str
Tags: list[str]
HeadFirstPython = Book(
# id = "1",
id = 1,
# Name = 'Head First Python, 2nd Edition',
Name = 27546, # 此处会报错,
Author = 'Paul Barry',
Publisher ="O'Reilly Media, Inc.",
ISBN = "9781491919538",
Tags = ["Python", "Head Frist", 1]
)
print('output>', HeadFirstPython.dict())
报错信息如下:
pydantic.error_wrappers.ValidationError: 1 validation error for Book
Name
str type expected (type=type_error.str)
更多 Pydantic 的类型详细说明,请查看官方文档,点此处。
Pydantic 的工作方式
Pydantic 的工作方式是允许开发人员使用 Python 类来定义数据模型。这些类继承自 Pydantic 提供的 BaseModel 类,可以包括类型提示、默认值和验证规则。当收到数据时,Pydantic 使用数据模型来验证传入的数据,并确保其符合所定义的要求。
在验证过程中,Pydantic 对照数据模型中定义的类型提示和验证规则,检查数据中的每个字段。如果数据不符合要求,Pydantic 会提出一个错误,并停止验证过程。如果数据是有效的,Pydantic 就会创建一个数据模型的实例,用传入的数据来填充它,并将其返回给用户。
Pydantic 还提供了一些高级功能,例如字段别名,自定义验证函数,以及对嵌套数据模型的支持,使得它可以处理广泛的数据验证场景。此外,Pydantic支持序列化和反序列化,允许根据需要将数据转换为Python数据结构、JSON和其他格式。
Pydantic 与 FastAPI 集成开发 Demo:写一个 todo 应用
假设我们通过 FastAPI 集成 Pydantic 的优点,写一个 todo 应用的接口实现 Todo 应用的创建和查看功能,文件目录结构如下:
首先,我们通过 Pydantic 新建 todo 应用的 model.py
:
from pydantic import BaseModel, StrictInt
class Todo(BaseModel):
id: StrictInt
item: str
先简单定义了两个字段:
- id:数字类型,作为唯一标识
- item: 字符串类型
然后新建路由文件夹 router
,在其中建立一个 todo_router.py
文件,写入如下代码:
from fastapi import APIRouter
from models.model import Todo
todo_router = APIRouter()
todo_list = []
@todo_router.post("/todo")
async def add_todo(todo: Todo) -> dict:
todo_list.append(todo)
return {
"message": "Todo added successfully"
}
@todo_router.get("/todo")
async def retrieve_todos() -> dict:
return {
"todos": todo_list
}
回到 main.py
:
from fastapi import FastAPI
from routers.todo_router import todo_router # importing router
app = FastAPI() # create an app instance
@app.get('/')
async def home() -> dict:
return { "message": "Welcome to my Page"}
app.include_router(todo_router)
验证 Pydantic 是否生效
执行命令如下:
$ uvicorn main:app --reload --port 8888
INFO: Will watch for changes in these directories: ['C:\\Users\\Wade\\Desktop\\FastAPI\\fastwebprojects']
INFO: Uvicorn running on http://127.0.0.1:8888 (Press CTRL+C to quit)
INFO: Started reloader process [22288] using StatReload
INFO: Started server process [25008]
INFO: Waiting for application startup.
INFO: Application startup complete.
另外打开一个终端,执行 GET 请求,得到空的 todo 列表:
$ curl -X 'GET' 'http://127.0.0.1:8888/todo' -H 'accept: applicaion/json'
{"todos":[]}
接着执行 POST 请求,如下:
curl -X POST http://127.0.0.1:8888/todo -H 'accept: application/json' -H 'Content-Type: application/json' -d '{}'
{"detail":[{"loc":["body","id"],"msg":"field required","type":"value_error.missing"},{"loc":["body","item"],"msg":"field required","type":"value_error.missing"}]}
如果我们传入一个空的数组,将会得到一串由 Pydantic 校验生成的 JSON 数据,格式化如下:
{
"detail": [
{
"loc": [
"body",
"id"
],
"msg": "field required",
"type": "value_error.missing"
},
{
"loc": [
"body",
"item"
],
"msg": "field required",
"type": "value_error.missing"
}
]
}
该 JSON 数据提示我们 id 和 item 都是必须字段 "msg": "field required",
因此,我们更改一下 POST 请求,如下:
$ curl -X POST http://127.0.0.1:8888/todo -H 'accept: application/json' -H 'Content-Type: application/json' -d '{"id": 1, "item": "write a todo project"}'
{"message":"Todo added successfully"}
此时我们可以看到创建一个 todo 事项成功,返回了 {"message":"Todo added successfully"}
!
再执行一次 curl 的 GET 请求,结果如下,可以看到刚刚创建成功的今日 todo—— item
为 "write a todo project", id
值为 1:
$ curl -X 'GET' 'http://127.0.0.1:8888/todo' -H 'accept: applicaion/json'
{"todos":[{"id":1,"item":"write a todo project"}]}
打开 http://127.0.0.1:8888/docs
,可以看到如下界面:
此处 Todo 就是我们刚刚定义的 Model 中限定的字段类型:
总结
本文介绍了 Pydantic 以及它的安装与工作方式, Pydantic 提供了自动的数据验证,提高了性能,并且支持复杂的数据结构,使得构建健壮和可维护的应用程序更加容易。虽然本文只是简单的校验数据的存在性,还有更多比如邮箱、密码格式等等, Pydantic 都会提供,希望本文抛砖引玉,让大家探索和学习 Pydantic 的更多功能。
希望本文能对你有所帮助,如果喜欢本文,可以点个关注.
下一篇文章见!宇宙古今无有穷期,一生不过须臾,当思奋争。
本文正在参加「金石计划」
参考链接: