Uma das principais diferenças é que, ao contrário de uma matriz de mensagens de conclusões de chat, não é necessário rastrear tokens com cada chamada para garantir que você permaneça abaixo do comprimento de contexto do modelo. Os threads abstraem esse detalhe de gerenciamento e...