我们平时使用的神经网路,是猜出来的结构,然后用反向传播法去改正一个错误的模型(初始化的模型),正如那个罗丹的故事:有人问罗丹雕塑的技巧是什么?罗丹回答“把多余的石头去掉”。反向传播大抵就是做的这个事情,根据模型犯的错去把它改对了。而这个ReduNet,是正向的构建,像造房子一样,一块砖一块瓦的去建造。所以反
下图为标准匹配模型的架构,模型主要由一个msg_encoder与rsp_encoder组成,这两个encoder一般用RNN、CNN或者BERT等适合对token序列建模的神经网络结构实现,这两个encoder的结构可以一样但一般不一样。训练数据是由大量message-response(或者query-doc、question-answer)对组成。 训练阶段:mr-pair以一个个batch的形式喂给模...
对应第二个问题,如果AI仅仅输入人工筛选的专家信息,它将非常专业但灵活度不足,像“书呆子”;如果完...