fastertransformers+llama

2024-10-06 12:33:59

拼音 [ 拼音 ]

...for autoregressive dec… · huggingface/transformers@92abe...

# Copied from transformers.models.llama.modeling_llama._prepare_4d_causal_attention_mask_with_cache_position def _prepare_4d_causal_attention_mask_with_cache_position( attention_mask: torch.Tensor, sequence_length: int, target_length: int, dtype: torch.dtype, device: torch.device, min_dtype: fl...