当AI实现多任务学习，它究竟能做什么？

发布时间：2020-05-10 19:27:37 所属栏目：评论来源：站长网

导读：副标题#e# 提到AI领域的多任务学习，很多人可能一下子就想到通用人工智能那里了。通俗意义上的理解，就像《超能陆战队》里的大白这样一种护理机器人，既能进行医疗诊断，又能读懂人的情绪，还能像陪伴机器人一样完成各种复杂任务。不过大白毕竟只是科幻电

多任务学习希望把优化脸部特征点检测和一些不同但细微相关的任务结合起来，比如头部姿势估计和脸部属性推断。脸部特征点检测不是一个独立的问题，它的预测会被一些不同但细微相关的因素影响。比如一个正在笑的孩子会张开嘴，有效地发现和利用这个相关的脸部属性将帮助更准确地检测嘴角。

当AI实现多任务学习，它究竟能做什么？

如上图人脸特征点检测（TCDCN）模型，除了检测特征点任务，还有识别眼镜、笑脸、性别和姿态这四个辅助任务，通过与其它网络的对比，可以看出辅助任务使主任务的检测更准确。

MTL 在不同领域有不同应用，其模型各不相同，解决的应用问题也不尽相同，但在各自的领域都存在着一些特点，除上面介绍的计算机视觉领域，还有像生物信息学、健康信息学、语音、自然语言处理、网络垃圾邮件过滤、网页检索和普适计算在内的很多领域，都可以使用 MTL 来提升各自的应用的效果和性能。

比如，在生物信息学和健康信息学中，MTL 被应用于识别治疗靶点反应的特征作用机制，通过多个群体的关联性分析来检测因果遗传标记，以及通过稀疏贝叶斯模型的自动相关性特征，来预测阿尔茨海默病的神经成像测量的认知结果。

在语音处理上的应用。2015 年，有研究者在国际声学、语音与信号处理会议（ICASSP）上分享了一篇《基于多任务学习的深度神经网络语音合成》的论文，提出一种多任务叠层深层神经网络。它由多个神经网络组成，前一个神经网络将其最上层的输出作为下一个神经网络的输入，用于语音合成，每个神经网络有两个输出单元，通过共享两个任务之间的隐藏层，一个用于主任务，另一个用于辅助任务，从而更好地提升语音合成的准确度。

在网络 Web 应用程序中，MTL 可以用于不同任务共享一个特征表示，学习 web 搜索中的排名提升；MTL 可以通过可扩展分层多任务学习算法，用于找到广告中转换最大化的层次结构和结构稀疏性等问题。

总体上来说，在这些 MTL 的应用领域中，特征选择方法和深度特征转换方法得到研究者的普遍应用。因为前者可以降低数据维数并提供更好的可解释性，而后者通过学习强大的特征表示可以获得良好的性能。

当AI实现多任务学习，它究竟能做什么？

MTL 正在越来越多的领域作为一种提高神经网络学习能力的手段被广泛应用。这其实正是 AI 在众多行业实际应用中的常态化场景。

我们可以最终溯源反思一下，人类之所以能够具有多任务学习的灵活应用的能力，恰恰是因为所处环境正是处在多特征、多噪声的状况之下，这样必然要求我们人类必须能够触类旁通地进行先验的学习能力的迁移。而如果人工智能仅仅停留在单体智能上面，为每一类知识或任务都建立一套单独的模型，最后可能仍然只是一套“人工智障”的机械系统，闹出“白马非马”这类的笑话来。

当 AI 未来真正既能在融会贯通的方面像人类一样熟练，又能克服人类认知带宽和一些认知偏见，那通向 AGI 的前路才可能迎来一丝曙光。当然这条路还相当遥远。

（编辑：衡阳站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页