验证器
Annotated Validators 标注验证人¶
API 文档
pydantic.functional_validators.WrapValidator
pydantic.functional_validators.PlainValidator
pydantic.functional_validators.BeforeValidator
pydantic.functional_validators.AfterValidator
Pydantic 通过使用 Annotated
提供了一种应用验证器的方法。当你希望将验证与类型而不是模型或字段绑定时,应该使用这个。
from typing import Any, List
from typing_extensions import Annotated
from pydantic import BaseModel, ValidationError
from pydantic.functional_validators import AfterValidator
def check_squares(v: int) -> int:
assert v**0.5 % 1 == 0, f'{v} is not a square number'
return v
def double(v: Any) -> Any:
return v * 2
MyNumber = Annotated[int, AfterValidator(double), AfterValidator(check_squares)]
class DemoModel(BaseModel):
number: List[MyNumber]
print(DemoModel(number=[2, 8]))
#> number=[4, 16]
try:
DemoModel(number=[2, 4])
except ValidationError as e:
print(e)
"""
1 validation error for DemoModel
number.1
Assertion failed, 8 is not a square number
assert ((8 ** 0.5) % 1) == 0 [type=assertion_error, input_value=4, input_type=int]
"""
在这个示例中,我们使用了一些类型别名( MyNumber = Annotated[...]
)。虽然这有助于提高代码的可读性,但并不是必需的,您可以在模型字段类型提示中直接使用 Annotated
。这些类型别名也不是实际类型,但您可以使用类似的方法( TypeAliasType
)来创建实际类型。有关自定义类型的更详细说明,请参见自定义类型。
还值得注意的是,你可以将 Annotated
嵌套在其他类型中。在这个例子中,我们使用它来对列表的内部项应用验证。同样的方法也可以用于字典键等。
之前、之后、包装和普通验证器¶
Pydantic 提供了多种类型的验证器函数:
-
After
验证器在 Pydantic 的内部解析之后运行。它们通常更具类型安全性,因此更容易实现。 -
Before
验证器在 Pydantic 的内部解析和验证(例如将str
强制转换为int
)之前运行。这些验证器比After
验证器更灵活,因为它们可以修改原始输入,但它们也必须处理原始输入,这在理论上可以是任何任意对象。 -
Plain
验证器类似于mode='before'
验证器,但它们会立即终止验证,不会调用其他验证器,并且 Pydantic 不会执行任何内部验证。 -
Wrap
验证器是所有验证器中最灵活的。你可以在 Pydantic 和其他验证器执行操作之前或之后运行代码,或者你可以立即终止验证,无论是使用成功的值还是错误。
可以使用多个 before、after 或 mode='wrap'
有效器,但只能使用一个 PlainValidator
,因为普通有效器不会调用任何内部有效器。
以下是一个 mode='wrap'
验证器的示例:
import json
from typing import Any, List
from typing_extensions import Annotated
from pydantic import (
BaseModel,
ValidationError,
ValidationInfo,
ValidatorFunctionWrapHandler,
)
from pydantic.functional_validators import WrapValidator
def maybe_strip_whitespace(
v: Any, handler: ValidatorFunctionWrapHandler, info: ValidationInfo
) -> int:
if info.mode == 'json':
assert isinstance(v, str), 'In JSON mode the input must be a string!'
# you can call the handler multiple times
try:
return handler(v)
except ValidationError:
return handler(v.strip())
assert info.mode == 'python'
assert isinstance(v, int), 'In Python mode the input must be an int!'
# do no further validation
return v
MyNumber = Annotated[int, WrapValidator(maybe_strip_whitespace)]
class DemoModel(BaseModel):
number: List[MyNumber]
print(DemoModel(number=[2, 8]))
#> number=[2, 8]
print(DemoModel.model_validate_json(json.dumps({'number': [' 2 ', '8']})))
#> number=[2, 8]
try:
DemoModel(number=['2'])
except ValidationError as e:
print(e)
"""
1 validation error for DemoModel
number.0
Assertion failed, In Python mode the input must be an int!
assert False
+ where False = isinstance('2', int) [type=assertion_error, input_value='2', input_type=str]
"""
同样的“模式”也适用于 @field_validator
,这将在下一节中讨论。
在 Annotated
中的有效验证器的排序¶
Annotated
中的验证元数据的顺序很重要。验证是从右到左进行的,然后再从左到右进行。也就是说,它从右到左运行所有的“之前”验证器(或调用“包装”验证器),然后从左到右返回调用所有的“之后”验证器。
from typing import Any, Callable, List, cast
from typing_extensions import Annotated, TypedDict
from pydantic import (
AfterValidator,
BaseModel,
BeforeValidator,
PlainValidator,
ValidationInfo,
ValidatorFunctionWrapHandler,
WrapValidator,
)
from pydantic.functional_validators import field_validator
class Context(TypedDict):
logs: List[str]
def make_validator(label: str) -> Callable[[Any, ValidationInfo], Any]:
def validator(v: Any, info: ValidationInfo) -> Any:
context = cast(Context, info.context)
context['logs'].append(label)
return v
return validator
def make_wrap_validator(
label: str,
) -> Callable[[Any, ValidatorFunctionWrapHandler, ValidationInfo], Any]:
def validator(
v: Any, handler: ValidatorFunctionWrapHandler, info: ValidationInfo
) -> Any:
context = cast(Context, info.context)
context['logs'].append(f'{label}: pre')
result = handler(v)
context['logs'].append(f'{label}: post')
return result
return validator
class A(BaseModel):
x: Annotated[
str,
BeforeValidator(make_validator('before-1')),
AfterValidator(make_validator('after-1')),
WrapValidator(make_wrap_validator('wrap-1')),
BeforeValidator(make_validator('before-2')),
AfterValidator(make_validator('after-2')),
WrapValidator(make_wrap_validator('wrap-2')),
BeforeValidator(make_validator('before-3')),
AfterValidator(make_validator('after-3')),
WrapValidator(make_wrap_validator('wrap-3')),
BeforeValidator(make_validator('before-4')),
AfterValidator(make_validator('after-4')),
WrapValidator(make_wrap_validator('wrap-4')),
]
y: Annotated[
str,
BeforeValidator(make_validator('before-1')),
AfterValidator(make_validator('after-1')),
WrapValidator(make_wrap_validator('wrap-1')),
BeforeValidator(make_validator('before-2')),
AfterValidator(make_validator('after-2')),
WrapValidator(make_wrap_validator('wrap-2')),
PlainValidator(make_validator('plain')),
BeforeValidator(make_validator('before-3')),
AfterValidator(make_validator('after-3')),
WrapValidator(make_wrap_validator('wrap-3')),
BeforeValidator(make_validator('before-4')),
AfterValidator(make_validator('after-4')),
WrapValidator(make_wrap_validator('wrap-4')),
]
val_x_before = field_validator('x', mode='before')(
make_validator('val_x before')
)
val_x_after = field_validator('x', mode='after')(
make_validator('val_x after')
)
val_y_wrap = field_validator('y', mode='wrap')(
make_wrap_validator('val_y wrap')
)
context = Context(logs=[])
A.model_validate({'x': 'abc', 'y': 'def'}, context=context)
print(context['logs'])
"""
[
'val_x before',
'wrap-4: pre',
'before-4',
'wrap-3: pre',
'before-3',
'wrap-2: pre',
'before-2',
'wrap-1: pre',
'before-1',
'after-1',
'wrap-1: post',
'after-2',
'wrap-2: post',
'after-3',
'wrap-3: post',
'after-4',
'wrap-4: post',
'val_x after',
'val_y wrap: pre',
'wrap-4: pre',
'before-4',
'wrap-3: pre',
'before-3',
'plain',
'after-3',
'wrap-3: post',
'after-4',
'wrap-4: post',
'val_y wrap: post',
]
"""
验证默认值¶
当使用默认值时,验证器不会运行。这适用于 @field_validator
验证器和 Annotated
验证器。您可以使用 Field(validate_default=True)
强制它们运行。将 validate_default
设置为 True
与在 Pydantic v1 中使用 always=True
在 validator
中的行为最接近。但是,通常最好在调用内部验证器之前调用函数的 @model_validator(mode='before')
。
from typing_extensions import Annotated
from pydantic import BaseModel, Field, field_validator
class Model(BaseModel):
x: str = 'abc'
y: Annotated[str, Field(validate_default=True)] = 'xyz'
@field_validator('x', 'y')
@classmethod
def double(cls, v: str) -> str:
return v * 2
print(Model())
#> x='abc' y='xyzxyz'
print(Model(x='foo'))
#> x='foofoo' y='xyzxyz'
print(Model(x='abc'))
#> x='abcabc' y='xyzxyz'
print(Model(x='foo', y='bar'))
#> x='foofoo' y='barbar'
Field validators¶
字段验证程序¶
如果要将验证器附加到模型的特定字段,可以使用 @field_validator
修饰符。
from pydantic import (
BaseModel,
ValidationError,
ValidationInfo,
field_validator,
)
class UserModel(BaseModel):
name: str
id: int
@field_validator('name')
@classmethod
def name_must_contain_space(cls, v: str) -> str:
if ' ' not in v:
raise ValueError('must contain a space')
return v.title()
# you can select multiple fields, or use '*' to select all fields
@field_validator('id', 'name')
@classmethod
def check_alphanumeric(cls, v: str, info: ValidationInfo) -> str:
if isinstance(v, str):
# info.field_name is the name of the field being validated
is_alphanumeric = v.replace(' ', '').isalnum()
assert is_alphanumeric, f'{info.field_name} must be alphanumeric'
return v
print(UserModel(name='John Doe', id=1))
#> name='John Doe' id=1
try:
UserModel(name='samuel', id=1)
except ValidationError as e:
print(e)
"""
1 validation error for UserModel
name
Value error, must contain a space [type=value_error, input_value='samuel', input_type=str]
"""
try:
UserModel(name='John Doe', id='abc')
except ValidationError as e:
print(e)
"""
1 validation error for UserModel
id
Input should be a valid integer, unable to parse string as an integer [type=int_parsing, input_value='abc', input_type=str]
"""
try:
UserModel(name='John Doe!', id=1)
except ValidationError as e:
print(e)
"""
1 validation error for UserModel
name
Assertion failed, name must be alphanumeric
assert False [type=assertion_error, input_value='John Doe!', input_type=str]
"""
需要注意的是验证人:
-
@s 是“类方法”,因此它们接收的第一个参数值是
UserModel
类,而不是UserModel
的实例。我们建议你在@field_validator
装饰器下面使用@classmethod
装饰器来获得正确的类型检查。 -
第二个参数是要验证的字段值;它可以根据需要命名
-
第三个参数,如果存在,是
pydantic.ValidationInfo
的一个实例 -
验证器应返回解析后的值,或引发
ValueError
或AssertionError
(可以使用assert
语句)。 -
一个单一的验证器可以通过传递多个字段名称应用于多个字段。
-
也可以通过传递特殊值
'*'
来调用单个验证程序对所有字段进行验证。
警告
如果使用 assert
语句,请记住,使用 -O
优化标志运行 Python 会禁用 assert
语句,并且验证器将停止工作。
注意
FieldValidationInfo
在 2.4 中已弃用,改为使用 ValidationInfo
。
如果要从 @field_validator
中的另一个字段访问值,可以使用 ValidationInfo.data
,它是一个字段名到字段值的字典。验证是按字段定义的顺序进行的,因此在使用 ValidationInfo.data
时要小心,不要访问尚未验证/填充的字段——例如,在上面的代码中,您将无法从 name_must_contain_space
内部访问 info.data['id']
。但是,在大多数情况下,您希望使用 @model_validator
进行多个字段值的验证,这将在下面的部分中讨论。
Model validators¶
模型验证器¶
也可以使用 @model_validator
对整个模型的数据进行验证。
from typing import Any
from typing_extensions import Self
from pydantic import BaseModel, ValidationError, model_validator
class UserModel(BaseModel):
username: str
password1: str
password2: str
@model_validator(mode='before')
@classmethod
def check_card_number_omitted(cls, data: Any) -> Any:
if isinstance(data, dict):
assert (
'card_number' not in data
), 'card_number should not be included'
return data
@model_validator(mode='after')
def check_passwords_match(self) -> Self:
pw1 = self.password1
pw2 = self.password2
if pw1 is not None and pw2 is not None and pw1 != pw2:
raise ValueError('passwords do not match')
return self
print(UserModel(username='scolvin', password1='zxcvbn', password2='zxcvbn'))
#> username='scolvin' password1='zxcvbn' password2='zxcvbn'
try:
UserModel(username='scolvin', password1='zxcvbn', password2='zxcvbn2')
except ValidationError as e:
print(e)
"""
1 validation error for UserModel
Value error, passwords do not match [type=value_error, input_value={'username': 'scolvin', '... 'password2': 'zxcvbn2'}, input_type=dict]
"""
try:
UserModel(
username='scolvin',
password1='zxcvbn',
password2='zxcvbn',
card_number='1234',
)
except ValidationError as e:
print(e)
"""
1 validation error for UserModel
Assertion failed, card_number should not be included
assert 'card_number' not in {'card_number': '1234', 'password1': 'zxcvbn', 'password2': 'zxcvbn', 'username': 'scolvin'} [type=assertion_error, input_value={'username': 'scolvin', '..., 'card_number': '1234'}, input_type=dict]
"""
注意
“关于返回类型检查” 用 @model_validator
修饰的方法应该在方法结束时返回自身实例。为了进行类型检查,可以使用 Self
来自 typing
或 typing_extensions
的回溯作为修饰方法的返回类型。在上述示例的上下文中,也可以使用 def check_passwords_match(self: 'UserModel') -> 'UserModel'
来表示该方法返回模型的实例。
注意
“关于继承” 在基类中定义的 @model_validator
将在子类实例的验证期间被调用。
Overriding a @model_validator
in a subclass will override the base class' @model_validator
, and thus only the subclass' version of said @model_validator
will be called.
模型验证器可以是 mode='before'
、 mode='after'
或 mode='wrap'
。
在将原始输入传递给模型验证器之前,原始输入通常是 dict[str, Any]
,但也可以是模型本身的实例(例如,如果调用 UserModel.model_validate(UserModel.construct(...))
)或其他任何对象,因为可以将任意对象传递给 model_validate
。由于这一点, mode='before'
验证器非常灵活和强大,但实现起来可能很麻烦且容易出错。在将模型验证器之前,它应该是类方法。第一个参数应该是 cls
(我们还建议你在 @model_validator
中使用 @classmethod
进行适当的类型检查),第二个参数将是输入(你通常应该将其类型化为 Any
,并使用 isinstance
来缩小类型),第三个参数(如果存在)将是一个 pydantic.ValidationInfo
。
mode='after'
验证器是实例方法,并且始终将模型的实例作为第一个参数接收。请确保在验证器的末尾返回该实例。您不应该使用 (cls, ModelType)
作为签名,而是只需使用 (self)
,并让类型检查器为您推断 self
的类型。由于这些是完全类型安全的,因此它们通常比 mode='before'
验证器更容易实现。如果任何字段验证失败,将不会调用该字段的 mode='after'
验证器。
处理验证器中的错误¶
如前几节所述,您可以在验证器中引发 ValueError
或 AssertionError
(包括由 assert ...
语句生成的)来指示验证失败。您还可以引发 PydanticCustomError
,它更详细,但为您提供了更多的灵活性。任何其他错误(包括 TypeError
)都会冒泡,不会被包装在 ValidationError
中。
from pydantic_core import PydanticCustomError
from pydantic import BaseModel, ValidationError, field_validator
class Model(BaseModel):
x: int
@field_validator('x')
@classmethod
def validate_x(cls, v: int) -> int:
if v % 42 == 0:
raise PydanticCustomError(
'the_answer_error',
'{number} is the answer!',
{'number': v},
)
return v
try:
Model(x=42 * 2)
except ValidationError as e:
print(e)
"""
1 validation error for Model
x
84 is the answer! [type=the_answer_error, input_value=84, input_type=int]
"""
Special Types¶
Pydantic 提供了一些特殊类型,可用于自定义验证。
-
InstanceOf
是一种类型,可以用于验证一个值是否是给定类的实例。from typing import List from pydantic import BaseModel, InstanceOf, ValidationError class Fruit: def __repr__(self): return self.__class__.__name__ class Banana(Fruit): ... class Apple(Fruit): ... class Basket(BaseModel): fruits: List[InstanceOf[Fruit]] print(Basket(fruits=[Banana(), Apple()])) > fruits=[Banana, Apple] try: Basket(fruits=[Banana(), 'Apple']) except ValidationError as e: print(e) """ 1 validation error for Basket fruits.1 Input should be an instance of Fruit [type=is_instance_of, input_value='Apple', input_type=str] """
-
SkipValidation
是一种可以用于跳过字段验证的类型。
from typing import List
from pydantic import BaseModel, SkipValidation
class Model(BaseModel):
names: List[SkipValidation[str]]
m = Model(names=['foo', 'bar'])
print(m)
> names=['foo', 'bar']
m = Model(names=['foo', 123]) # (1)!
print(m)
> names=['foo', 123]
请注意,第二项的验证被跳过。如果它的类型错误,在序列化期间将发出警告。
实地考察¶
在创建类时,会检查验证器以确认它们指定的字段实际上存在于模型上。
如果例如,您希望定义一个验证器来验证仅在定义验证器的模型的子类上才会存在的字段,那么这可能是不希望的。
如果您想在创建类时禁用这些检查,可以将 check_fields=False
作为关键字参数传递给验证器。
数据类验证器¶
验证器也与 Pydantic 数据类一起使用。
from pydantic import field_validator
from pydantic.dataclasses import dataclass
@dataclass
class DemoDataclass:
product_id: str # should be a five-digit string, may have leading zeros
@field_validator('product_id', mode='before')
@classmethod
def convert_int_serial(cls, v):
if isinstance(v, int):
v = str(v).zfill(5)
return v
print(DemoDataclass(product_id='01234'))
#> DemoDataclass(product_id='01234')
print(DemoDataclass(product_id=2468))
#> DemoDataclass(product_id='02468')
验证上下文¶
你可以将一个上下文对象传递给验证方法,该对象可以从装饰后的验证函数的 info
参数访问:
from pydantic import BaseModel, ValidationInfo, field_validator
class Model(BaseModel):
text: str
@field_validator('text')
@classmethod
def remove_stopwords(cls, v: str, info: ValidationInfo):
context = info.context
if context:
stopwords = context.get('stopwords', set())
v = ' '.join(w for w in v.split() if w.lower() not in stopwords)
return v
data = {'text': 'This is an example document'}
print(Model.model_validate(data)) # no context
#> text='This is an example document'
print(Model.model_validate(data, context={'stopwords': ['this', 'is', 'an']}))
#> text='example document'
print(Model.model_validate(data, context={'stopwords': ['document']}))
#> text='This is an example'
这在您需要在运行时动态更新验证行为时很有用。例如,如果您希望一个字段具有动态可控的允许值集,可以通过上下文传递允许的值,并使用单独的机制来更新允许的内容:
from typing import Any, Dict, List
from pydantic import (
BaseModel,
ValidationError,
ValidationInfo,
field_validator,
)
_allowed_choices = ['a', 'b', 'c']
def set_allowed_choices(allowed_choices: List[str]) -> None:
global _allowed_choices
_allowed_choices = allowed_choices
def get_context() -> Dict[str, Any]:
return {'allowed_choices': _allowed_choices}
class Model(BaseModel):
choice: str
@field_validator('choice')
@classmethod
def validate_choice(cls, v: str, info: ValidationInfo):
allowed_choices = info.context.get('allowed_choices')
if allowed_choices and v not in allowed_choices:
raise ValueError(f'choice must be one of {allowed_choices}')
return v
print(Model.model_validate({'choice': 'a'}, context=get_context()))
#> choice='a'
try:
print(Model.model_validate({'choice': 'd'}, context=get_context()))
except ValidationError as exc:
print(exc)
"""
1 validation error for Model
choice
Value error, choice must be one of ['a', 'b', 'c'] [type=value_error, input_value='d', input_type=str]
"""
set_allowed_choices(['b', 'c'])
try:
print(Model.model_validate({'choice': 'a'}, context=get_context()))
except ValidationError as exc:
print(exc)
"""
1 validation error for Model
choice
Value error, choice must be one of ['b', 'c'] [type=value_error, input_value='a', input_type=str]
"""
同样,你也可以使用上下文进行序列化。
使用带有 BaseModel
初始化的验证上下文¶
虽然在标准的 BaseModel
初始化程序中无法指定上下文,但您可以通过使用 contextvars.ContextVar
和自定义 __init__
方法来解决此问题:
from contextlib import contextmanager
from contextvars import ContextVar
from typing import Any, Dict, Iterator
from pydantic import BaseModel, ValidationInfo, field_validator
_init_context_var = ContextVar('_init_context_var', default=None)
@contextmanager
def init_context(value: Dict[str, Any]) -> Iterator[None]:
token = _init_context_var.set(value)
try:
yield
finally:
_init_context_var.reset(token)
class Model(BaseModel):
my_number: int
def __init__(self, /, **data: Any) -> None:
self.__pydantic_validator__.validate_python(
data,
self_instance=self,
context=_init_context_var.get(),
)
@field_validator('my_number')
@classmethod
def multiply_with_context(cls, value: int, info: ValidationInfo) -> int:
if info.context:
multiplier = info.context.get('multiplier', 1)
value = value * multiplier
return value
print(Model(my_number=2))
#> my_number=2
with init_context({'multiplier': 3}):
print(Model(my_number=2))
#> my_number=6
print(Model(my_number=2))
#> my_number=2
Reusing Validators¶
有时,您可能希望在多个字段/模型上使用相同的验证器(例如,对某些输入数据进行规范化)。“天真”的方法是编写一个单独的函数,然后从多个装饰器中调用它。显然,这需要大量的重复和样板代码。以下方法演示了如何重用验证器,从而最大限度地减少冗余并使模型再次几乎是声明性的。
from pydantic import BaseModel, field_validator
def normalize(name: str) -> str:
return ' '.join((word.capitalize()) for word in name.split(' '))
class Producer(BaseModel):
name: str
_normalize_name = field_validator('name')(normalize)
class Consumer(BaseModel):
name: str
_normalize_name = field_validator('name')(normalize)
jane_doe = Producer(name='JaNe DOE')
print(repr(jane_doe))
#> Producer(name='Jane Doe')
john_doe = Consumer(name='joHN dOe')
print(repr(john_doe))
#> Consumer(name='John Doe')
本文总阅读量次