Agora, simplificamos bastante a tarefa. Restringimos a análise ao primeiro tipo de palavras-chave fáceis de extrair: os nomes de domínio que contêm hifens. A distribuição neste subconjunto deve seguir a distribuição em todo o conjunto de dados, devido ao grande volume de dad...