大语言模型:原理、应用与优化在线阅读
会员

大语言模型:原理、应用与优化

苏之阳 王锦鹏 姜迪 宋元峰
开会员,本书免费读 >

计算机网络人工智能12.1万字

更新时间:2024-12-18 17:07:10 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

这是一本从工程化角度讲解大语言模型的核心技术、构建方法与前沿应用的著作。首先从语言模型的原理和大模型的基础构件入手,详细梳理了大模型技术的发展脉络,深入探讨了大模型预训练与对齐的方法;然后阐明了大模型训练中的算法设计、数据处理和分布式训练的核心原理,展示了这一系统性工程的复杂性与实现路径。除了基座模型的训练方案,本书还涵盖了大模型在各领域的落地应用方法,包括低参数量微调、知识融合、工具使用和自主智能体等,展示了大模型在提高生产力和创造性任务中的卓越性能和创新潜力。此外,书中进一步介绍了大模型优化的高级话题和前沿技术,如模型小型化、推理能力和多模态大模型等。最后,本书讨论了大模型的局限性与安全性问题,展望了未来的发展方向,为读者提供了全面的理解与前瞻性的视角。无论是人工智能领域的研究员、工程师,还是对前沿技术充满好奇的读者,本书都将是您了解和掌握大模型技术的必备指南。
品牌:机械工业出版社
上架时间:2024-10-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

苏之阳 王锦鹏 姜迪 宋元峰
主页

同类热门书

最新上架

  • 会员
    本书全面系统地介绍了字节跳动旗下AI智能助手——豆包的使用方法,涵盖注册登录流程及基本操作要点,并通过丰富多样的学习、工作、生活等场景的应用实例,如化身学习小能手、担当高效职场助手、呈现精彩模拟人物互动等,充分展现了豆包的强大效用。此外,还深入介绍了豆包智能体及其应用实例,以及豆包App的注册/登录方式和便捷功能。随书赠送学习资源,包含50个高效提问公式,40个深度提问模板、100个豆包智能体模板
    何华平编著计算机7.1万字
  • 会员
    随着Web3.0时代的来临,我国教育领域迎来了一场全面而深刻的变革——AIGC、ChatGPT、大数据、云计算、物联网、数字孪生、元宇宙等新兴技术与教育行业的融合程度日益加深,AI驱动的教育新形态、新模式、新产品不断涌现,数字化、网络化、智能化逐渐成为引领我国教育变革与转型的重要方向。本书立足于全球范围内智慧教育领域的实践经验与前沿趋势,全面阐述AIGC、ChatGPT、元宇宙、数字孪生等新兴技
    程君青 邵立东 杨爱喜计算机13.8万字
  • 会员
    DeepSeek是一种生成式人工智能(AI)大模型,擅长处理复杂任务,具有训练效率高、成本低、性能强、开源等优势,吸引了全世界的关注。本书是写给DeepSeek初学者的快速上手实践指南。本书通过项目实例进行讲解,手把手地教读者如何使用DeepSeek。本书共6章,首先对DeepSeek进行概述,包括其成长路线、优势、技术原理、应用场景、应用方式等;其次讲解如何为DeepSeek写提示词,包括结构化
    李强编著计算机3.6万字
  • 会员
    本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。
    (美)塞巴斯蒂安·拉施卡计算机13.8万字
  • 会员
    随着技术的发展,AI与人们的生活、工作结合得越来越紧密。在设计领域,AI已成为设计师的好帮手。借助AI,设计师可以更好、更快地创作出令人惊艳的作品。本书共9章。第1章系统地介绍了什么是AI设计、有哪些AI设计工具,以及如何撰写提示词让AI生成符合需求的设计作品;第2~9章通过8个实用模块、40多个常见的设计场景,详细介绍了AI在头像和表情包设计、图片处理、社交媒体配图、视频制作、插画绘制、电商设计
    秋叶 定秋枫 赵倚南 吴玉佳计算机3万字
  • 会员
    如今,随着智能创作时代的到来,AI文生内容成为不可忽视的趋势。DeepSeek作为AI文生领域内容领域的一个新热点和新风口,受到资本和各类企业的广泛关注。本书就聚焦于DeepSeek,对其进行详细讲述。本书分为三个部分,第一部分详细介绍DeepSeek的基础理论知识、技术架构、功能、背后的商业生态等,让读者对DeepSeek有一个全面的了解;第二部分讲述DeepSeek操作攻略,包括准备工作、指令
    李寅计算机10.8万字
  • 在技术进步和经济不断发展的当下,越来越多的人开始思考这些问题:当机器人能够顺畅地处理大部分工作时,是否会导致人类大量失业?在大量失业的情况下,人们该如何获得收入,是否会因此感到人生毫无意义,丧失获得快乐的能力?假设人类安全地开发出了超级智能,对它进行了良好的管理,并很好地利用了这项技术所能释放的巨大经济潜力和神奇的变革力量。在这个世界中,人工智能可以做我们能做的一切,而且可以做得更好、更快,成本更
    (英)尼克·博斯特罗姆计算机29.6万字
  • 会员
    本书全面解析了DeepSeek的崛起历程、技术突破及其对AI行业的深远影响。全书共6章,第1章追溯DeepSeek的起源与发展,展示其从初创到全球爆火的历程;第2章通过“AI领域拼多多”的比喻,分析其低成本、高性能的商业化路径,并深入探讨其核心技术;第3章介绍相关应用方法,包括优化交互方式、调用API服务、本地部署模型等;第4章、第5章分别分析DeepSeek引发的行业变革,以及其AI能力在垂直行
    陈根计算机11.6万字
  • 会员
    本书综合运用定性研究和定量研究方法,对体育服务业与人工智能的融合进行深入研究。本书首先是运用耦合协调模型和灰色关联分析法对目前我国体育服务业与人工智能融合的现状进行定量研究,探索二者之间目前处于什么融合发展阶段;其次,对体育服务业与人工智能的融合机理进行了研究,在此基础上,以体育服务业的4个细分行业为例,进行了体育服务业与人工智能融合的具体研究;接着,运用模糊AHP-TOPSIS研究方法对体育服务
    卿平计算机15万字

同类书籍最近更新

  • 《为机器立心》的主题是迈向通用人工智能的中国路线,让AI不再缺“心”,点亮人工智能的“中国时刻”。在书中,朱松纯教授解答了什么是通用人工智能、如何认清智能的本质、如何为人工智能找到统一理论与认知架构,进而为机器立“心”等重要问题。全书共分为两大部分。第一部分“厘清通用人工智能的3大关键迷思”:ChatGPT等大模型无异于缸中之脑;要寻找“乌鸦智能”而不是“鹦鹉智能”;理(U体系)与心(V体系)并非
    朱松纯人工智能11.7万字
  • 本书的主题是从通用人工智能的视角来诠释中国的思想。朱松纯教授致力于搭建人文社科与通用人工智能的双向连接,本书是为人文赋“理”,即以人工智能的数理与认知模型诠释中国思想,试图为中国优秀哲学思想构建严格的数理体系,以便中国思想可以在正在到来的智能时代指导社会治理与实践,从而转化成强大的生产力。为此,本书先从智能时代的文明与道路说起,基于文明起源与演化的历程指出演化的关键在于“心”的出现,探索“心”的构
    朱松纯人工智能13.7万字
  • 如今,人工智能的迅速发展给人们的日常生活和工作带来了巨大的影响。要想让人工智能朝着人类智能的方向持续迈进,我们就应该让我们创造的硅基大脑像人类大脑一样有感知、有记忆、有决策、有行动。问题的难点在于,人类大脑由约1000亿个神经元构成,神经元间交流复杂,大脑掌管认知、意识,影响我们生活的方方面面。我们如何破解如此庞大的复杂系统的运行机制呢?在《心智的10大模型》中,计算神经科学家格蕾丝·林赛深入探讨
    (美)格蕾丝·林赛人工智能19.9万字
  • 2022年末,ChatGPT在全球的风靡,让大模型随之出圈。大模型带来的机遇是人类突破能力边界最大的一次飞跃。未来基于人工智能或将实现“想象即现实,所想即所得”,这将是一次巨大的飞跃。中国、美国以及欧洲各国纷纷出台相关政策,将推动人工智能发展、大模型迭代作为重要的创新引擎。了解、应用大模型,既是时代的要求,也是产业发展的必需。但是在实践中也发现,大家对大模型的了解并不深刻,甚至时常被技术名词“劝退
    沈抖人工智能16.8万字