前言

大模型领域既是繁星点点的未知宇宙,也是蕴含无数可能的广阔天地,正是这一独特的魅力,令无数的探索者为之倾倒,为之奋斗。随着大模型应用逐渐走入人们的日常生活,支撑它的深度学习技术也开始登上更为广阔和深远的人工智能大舞台。

关于本书

本书将揭示大模型ChatGLM3的本地化实战应用,带领读者领略ChatGLM3的高级应用之美.书中不仅详细如何进行ChatGLM3的私有云部署、开发应用、构建思维链以及在有限资源条件下的微调方法,为了让读者更深入地了解ChatGLM3的模型架构,还将解析GLM系列模型的源码,并完成一项文本生成任务。本书的最后将通过实现基于自然语言的真实上市公司大规模年度财务报表非结构化信息抽取实战、智能问答与财务预警实战,展现大模型应用的美好前景。这两个实战案例将融合本书前面介绍的所有知识,从大模型程序应用入手,涉及微调以及工具的使用,并结合具体的业务知识背景,为读者带来一次深度学习的完整体验。

本书涉及的深度学习编程方法与技巧以PyTorch为主。PyTorch因其易用性和普及性而成为深度学习领域的翘楚。当然,本书只是围绕大模型的应用进行深入剖析,若想了解更多关于深度学习的内容,例如卷积神经网络、循环神经网络等模块的构建和使用方法,强烈推荐参阅《PyTorch 2.0深度学习从零开始学》。

本书作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,不仅延续了《PyTorch 2.0深度学习从零开始学》中的核心理念与知识体系,更将深度学习引向了一个新的高度,专注于大模型的本地化研究与应用。本书将帮助读者深入理解深度学习与大模型的精髓,探寻其背后的思维逻辑和创新精神。在这个过程中,读者不仅能学习到理论知识,更能感受到大模型背后的力量与智慧,从而为自己在这一领域的研究和实践提供有力的支撑。

本书特点

本书具有如下6个方面的特点:

· 内容与结构的系统性:本书延续了《PyTorch 2.0深度学习从零开始学》的知识体系,精心设计了内容与结构,结合深度学习基础知识和大模型的具体方向,逐步引导读者走进大模型高级应用和微调场景。每个章节都按照逻辑顺序展开,确保读者在学习过程中能够循序渐进地掌握相关知识和技能。

· 理论与实践的紧密结合:本书不仅关注理论知识,更注重实践应用。通过丰富的实战案例讲解,读者可以亲手进行操作和实践,深入了解深度学习和大模型在实际问题中的应用方法和解决方案。

· 大模型本地化部署领域的专业洞察:本书对大模型本地化部署领域进行深入研究和专业洞察,涵盖了目前最新的研究成果、模型架构和应用场景。读者通过阅读本书,可以紧跟学术前沿,全面了解大模型的发展趋势和实际应用。

· 注重培养解决问题的能力:本书以实际项目为导向,注重培养读者解决问题的能力。通过深入分析实际案例和提供实战代码,读者可以逐步提升自己的实践能力和创新能力,为未来的实际工作做好充分准备。

· 优美的语法和丰富的实例:本书采用优美的语法和丰富的实例进行讲解,让读者在学习过程中感受深度学习的魅力和大模型的智慧。通过生动的比喻、形象的描述和实用的技巧,读者可以更好地理解和掌握深度学习和大模型的核心概念和方法。

· 笔者的专业背景和实战经验:作为深度学习专家和畅销图书作者,笔者具有深厚的学术背景和丰富的实践经验。在撰写本书的过程中,笔者以实际项目中遇到的问题为导向,注重知识体系的完整性和实用性,力求使本书成为一本具有参考价值的重要著作。

本书适合人群

本书适合学习人工智能、深度学习、大模型开发应用以及PyTorch算法的人员阅读,也适合作为高等院校或高职高专大模型相关课程的教材。

建议读者在学习本书内容的过程中,独立进行一些代码的编写,采取开放式的实验方法,即读者自行准备实验数据和实验环境,解决实际问题,最终达到理论联系实际的目的。

配套资源下载

本书配套示例源代码、数据集、PPT课件、作者微信群答疑服务,需要用微信扫描下面的二维码获取。如果在阅读本书的过程中发现问题或有疑问,请联系booksaga@163.com,邮件主题为“ChatGLM3大模型本地化部署、应用开发与微调”。

笔者

2024年2月