作者:言有三 日期:2023-01-31 22:15:18
适读人群 :本书适合所有AI技术工程师阅读,尤其是专注于深度学习和机器学习的工程师。(1)作者经验丰富:作者曾在奇虎360人工智能研究院、陌陌深度学习实验室等工作多年,负责月活10亿级的产品。 (2)作者知名度高:作者创办“有三AI”社区,有超过10万学员;著有5本深度学习方面的畅销书,发表原创技术文章200余万字。 (3)理论体系完善:系统讲解GAN的理论、各种模型和常见问题,其中GAN的目标优化、训练、评估等内容同类书中极少提及。 (4)实战案例丰富:9个综合案例,覆盖视觉和语音方面的8大应用场景,提供解决方案、案例代码、实验数据和实验结果对比分析。 (5)阅读体验很棒:内容循序渐进、深入浅出,包含大量原创插图,极大程度降低阅读难度。
这是一本系统讲解GAN理论、模型、常见问题,并为视觉和语音领域的大部分应用场景提供GAN解决方案和综合实例的著作。 作者在人工智能领域积累颇深,这本书得到了前阿里巴巴达摩院华先胜和中国科学院自动化所刘成林的推荐。前4章有针对性地讲解GAN的理论,帮助读者夯实基础;后8章讲解应用,用大量经典的模型和9个案例,为8个应用场景提供了GAN解决方案。 第1~4章首先介绍了无监督生成模型、显式生成模型、以GAN为代表的隐式生成模型等各种生成模型的理论和原理;然后讲解了GAN中的目标函数及其数学原理、GAN在训练中的常见问题和相应解决方案、GAN的评价指标和可视化等; 第5~12章分别讲解了图像生成GAN的各类模型与应用、图像翻译GAN的各类模型与应用、人脸图像编辑GAN的各类模型与应用、图像质量增强GAN的各类模型与应用、三维图片与视频生成GAN的各类模型与应用、通用的图像编辑GAN框架、对抗攻击以及GAN在其中的应用、GAN在语音信号处理中的实战应用。 全书内容理论体系完善,GAN的目标优化、训练、评估等内容同类书中极少提及;内容丰富、循序渐进,覆盖视觉和语音中的绝大部分应用场景;实战性强,9个综合案例,提供案例源代码和解读,以及实验数据和实验结果对比分析;图文并茂,包含大量原创图表,可读性强。