
会员
多模态大模型:算法、应用与微调
刘兆峰更新时间:2024-09-11 17:38:30
最新章节:封底开会员,本书免费读 >
本书详尽地覆盖了多模态大模型的算法原理和应用实战,提供了丰富的微调技术细节和实际案例,适合对多模态大模型有兴趣的技术人员深入学习及应用。本书分为两篇:算法原理篇:详细介绍了先进的深度学习模型,包括Transformer、GPT系列、深度生成模型,从基本架构、训练方法到特定应用,包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器、GAN、ViT、CLIP、StableDiffusion、各模型训练实践的知识点。此外,探讨了预训练模型的涌现能力、模型参数和通信数据量的估算,以及分布式训练的各种技术,如数据并行、模型并行和混合精度训练等。应用实战篇:聚焦于深度学习模型的实际应用,特别是文本和图像生成,以及代码生成的应用实战。通过具体实战项目,如利用StableDiffusion进行图像生成和CodeLlama进行代码生成,提供了微调技术的详细细节,介绍了LangChain等大模型应用框架。
品牌:机械工业出版社
上架时间:2024-06-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
刘兆峰
主页
同类热门书
最新上架
- 会员
ChatGPT手册:初学者指南与应用实战
本书理论联系实际,全面地介绍ChatGPT的主要应用场景,帮助读者掌握ChatGPT的使用方法和技巧。本书不仅讲述了ChatGPT在学习、写作、工作、生活方面的应用案例,还介绍了一个打造个人品牌的综合应用,内容实用,可操作性强。本书适合希望了解ChatGPT的初学者阅读。计算机9.6万字 - 会员
AI时代生存手册:零基础掌握DeepSeek
本书将带你深入探索AI“神器”——DeepSeek的无限潜能,带你从零开始,轻松掌握AI的核心应用。通过学习本书,你将轻松上手DeepSeek,开启智能生活新篇章;通过学习本书,你将学会用DeepSeek大幅提升工作效率;通过学习本书,你将学会如何让DeepSeek成为你的职场超级助手;通过学习本书,你将学会如何利用DeepSeek激发自己的创作灵感,打造爆款内容和个人品牌;通过学习本书,你将学会计算机7.2万字 智能汽车软件功能安全
这是一本从实践角度系统且深入地讲解智能汽车软件功能安全和智能汽车软件研发的著作,得到了中国工程院院士李克强等13位产业界和学术界专家的一致推荐。作者在功能安全领域深耕10余年,有扎实的理论基础、丰富的实践经验,用挖掘本质的思维方法来撰写本书,从研发体系、架构设计、开发流程、开发方法、安全措施、创新研究等维度对智能汽车软件功能安全做了深入的讲解。全书共11章,分为3个部分。第一部分(第1~3章)智能计算机25.9万字- 会员
DeepSeek原理与项目实战:大模型部署、微调与应用开发
DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合计算机17万字 - 会员
大模型实战:微调、优化与私有化部署
本书深入浅出地介绍了现代大型人工智能(ArtificialIntelligence,AI)模型技术,从对话机器人的发展历程和人工智能的理念出发,详细阐述了大模型私有化部署过程,深入剖析了Transformer架构,旨在帮助读者领悟大模型的核心原理和技术细节。本书的讲解风格独树一帜,将深奥的技术术语转化为简洁明了的语言,案例叙述既严谨又充满趣味,让读者在轻松愉快的阅读体验中自然而然地吸收和理解AI计算机15.8万字 具身智能:人工智能的下一个浪潮
自人工智能(AI)的概念诞生之日起,科学家们就热衷于探讨它的发展路径。第一阶段毫无疑问是计算智能,经过半个多世纪,AI在运算能力和记忆方面早已超越人类。第二阶段,是感知智能,让机器可以看得懂听得懂这个世界。科学界认为,尚未到来的第三阶段,是认知智能,甚至提到一个词:认知时代。我们来到大模型时代或者是生成式人工智能时代了吗?如果我们此时此刻正身处这个时代,那上一个是什么时代?有人说,大规模预训练已经计算机11.3万字- 会员
ChatGPT大模型:技术场景与商业应用
ChatGPT作为人工智能领域的一大进步,引起了热议,其强大功能的背后离不开大模型的支持。大模型指的是参数规模超过千万的机器学习模型,主要应用于语音识别、计算机视觉等领域。本书聚焦大模型,对大模型的技术场景和商业应用展开详细叙述。本书主要从典型应用ChatGPT入手,探寻其背后支撑大模型的魅力。首先,本书对大模型的基础概念、产业格局、带来的新型商业模式进行讲解,展现了大模型的发展现状和商业化潜力。计算机13.2万字 - 会员
设计深度学习系统
本书主要从软件开发者的角度探讨如何构建和设计深度学习系统。作者首先描述一个典型的深度学习系统的整体,包括其主要组件以及它们之间的连接方式,然后在各个单独的章节中深入探讨这些主要组件。对于具体介绍的章节,会在开始时讨论需求,接着介绍设计原则和示例服务/代码,并评估开源解决方案。通过阅读本书,读者将能够了解深度学习系统的工作原理,以及如何开发每个组件。本书的主要读者对象是想要从事深度学习平台工作或将一计算机18.1万字 - 会员
Keras深度学习与神经网络
本书从人工智能导论入手,阐述人工智能的发展及现状,重点介绍了机器学习和神经网络基础、反向传播原理、卷积神经网络和循环神经网络等内容。本书内容由浅入深,循序渐进,从神经元和感知机入手,逐步讲解深度学习中神经网络基础、反向传播以及更深层次的卷积神经网络、循环神经网络。本书知识体系完整,内容覆盖面广,介绍了深度学习中常用的模型和算法,助力读者多方位掌握深度学习的相关知识。本书可作为高等院校计算机等相关专计算机11万字
同类书籍最近更新
- 会员
预训练语言模型:方法、实践与应用
近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang人工智能12.7万字 - 会员
人机沟通法则:理解数字世界的设计与形成
随着ChatGPT等人工智能和语言模型不断进步,了解这些技术的含义和潜在陷阱比以往任何时候都更加重要。作为享誉全球的跨技术和设计学科思想家,前田约翰利用他的丰富经验,为企业、产品设计师和决策者提供了可行的指导。通过深思熟虑和偶尔异想天开的例子,他构造了一个可以描述任何机器学习系统的关键功能的框架,并展望了可以如何使用它们来创造富有包容性和改变世界的产品。对任何想要深入了解机器如何“思考”以及未来可人工智能9.6万字 - 会员
DeepSeek原理与项目实战:大模型部署、微调与应用开发
DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合人工智能17万字