add_special_tokens+false

2024-10-24 23:25:16

拼音 [ 拼音 ]

...fails when add_special_tokens=True|False · Issue #28472...

spaces=False), added_tokens_decoder={ 0: AddedToken("<unk>", rstrip=False, lstrip=False, single_word=False, normalized=False, special=True), 1: AddedToken("", rstrip=False, lstrip=False, single_word=False, normalized=False, special=True), 2: AddedToken("", rstrip=False, lstrip=False...
added option to add no special tokens in the preprocessing...

group.add_argument("--no_new_tokens", action="store_false", dest="new_tokens", help=("Do not add special tokens (e.g. CLS, MASK, etc) " "in the sentenciepiece tokenizer")) group.add_argument('--data_impl', type=str, default='infer', choices=['lazy', 'cached', 'mmap', '...