1) Parameter Sharing.(可以是数据相同任务不同,也可以是数据和任务都不同,但是数据具有领域性等等) 例如利用同领域内的其它数据做task(通常这些数据会比较多),在做Multitask learning的时候,不同task之间共享相关层的参数,而在task-specific层和classification层不共享,这样做就能利用先验知识缩小假设空间。 2)Paramete...