大模型与人工智能系统-24年秋

近年来,随着深度学习技术的蓬勃发展,大语言模型已经取得了举世瞩目的成就。在各种复杂的自然语言处理任务上,如机器翻译、情感分析、文本生成等,大语言模型都展现出了其强大的能力,显著提升了任务完成的质量和效率。然而,大语言模型在取得显著成果的同时,也面临着诸多与系统相关的挑战,这些挑战在一定程度上制约了其进一步的发展和应用。

首先,大语言模型通常具有庞大的参数规模和复杂的网络结构,这使得模型训练和推断过程中的计算开销异常巨大。特别是在大数据环境下,模型训练往往需要耗费大量的时间和计算资源,这制约了大语言模型的进一步发展。其次,大语言模型在处理实时任务时,往往面临着高并发的挑战。 由于模型推断需要消耗一定的时间,因此在处理大量并发请求时,很容易出现延迟过高的情况,影响了用户体验和系统性能。最后,大模型在实际场景的应用过程中,仍面临着诸多挑战,包括但不限于数据质量的参差不齐、数据模态的多样性以及隐私和安全问题等。这些挑战无疑会对大模型在实际应用中的落地产生影响。

针对上述挑战,本课程将深入讨论大模型的系统设计以及大模型在系统中的应用所涉及的相关议题。我们将重点介绍近年来学术界和工业界为了研发高性能、高吞吐、低延迟、低开销的大模型训练及推断的解决方案所作出的努力。这些解决方案包括优化算法、改进模型结构、利用分布式计算等技术手段,旨在提升大语言模型的性能和效率。

同时,本课程还将介绍其他大模型与系统相融合的议题,如模型压缩、模型剪枝、数据清理等技术手段的应用。这些技术能够在保持模型性能的同时,减少模型的参数量和计算量,从而使得大语言模型能够更好地适应实际应用场景的需求。

通过本课程的学习,同学们将能够深入了解大语言模型在系统设计和应用中所面临的挑战和解决方案,掌握相关的技术方法和工具,为未来的研究和应用奠定坚实的基础。 本课程将以课程讲授和同学课堂展示相结合的方式,课堂展示的内容将以课程中布置的文献阅读材料为主。课程的评价将由三部分构成,即文献阅读综述,课堂展示以及课程项目。该课程项目的目标是针对某个大模型的应用场景,利用课程中所介绍的相关技术对大模型的应用进行系统优化。开设此新课程的主要目的是帮助同学们了解有关人工智能系统尤其是大模型系统的前沿发展,并且培养和提升同学们的文献检索和学术展示的能力。

学期: 

秋季学期

开课学年: 

2024

相关资料