大规模语言模型
读书评论:
-
司马明志2024-06-01讲个概念都讲不明白,列一堆论文让我们去看吗?
-
杨中兴2024-05-29很不错的大模型入门书,很全面,推荐入手
-
逖安的拾光机2023-12-27回旋镖是线代和Python,只能囫囵吞枣看个大概,但也能清楚大模型到底从整体框架上是怎么回事,配合观看 Andrej Karpathy 的视频 Intro to Large Language Models
-
葬花人笑痴2024-03-19还不错,可惜没有代码下载,想调代码基本只能对着书抄,代码也能看出来就是复制的开源项目。分布式训练的部分比较有收获。强化学习的部分过于教条,没有讲清楚。剩下的有监督学习,transforms原理,应用,评估,开源数据集介绍意义不大。
-
小三吉2023-12-09非常好的入门书,给了我对大模型的整体架构认知,非常有帮助
-
悠然2024-03-28打5分是因为把我对大模型缺失的信息补全了。比如常用的数据集,数据清理方法,还有训练中的各种已知技巧。脱离算法领域已经好几年,看看挺有意思,估计以后最多也就是做做微调,底层模型不是普通组织可以玩的了。最近用chatgpt和kimi挺多,非常方便,像我在20多年前没用搜索引擎之前对于知识引擎的一个期待。对的,要按照2018年的标准,2024年大模型无疑是智能的,但按照一个不懂技术的人对智能的期待,大模型也只是刚刚入门,勉强可用,后面路还很长。另外,我对降世派和救世派都不感冒,都是些什么鬼?菜鸡互啄;还有些把智能和生命混淆的,脑子进水了。人类发展到今天,做个稍微好点的研究都要到博士,合理吗?想想诸葛28岁拜相,今后的少年就该站在人类总智能肩膀上,年方二八就锋芒毕露。
-
且听风殇2024-06-16前面几章还行,后面又开始堆论文
-
Goal2024-06-12实践的同时,补足充分的理论是必要的!相信AI。
-
杨枫.js2024-01-03需要计科专业背景,外加一些机器学习和深度学习经验才比较好上手。背景知识部分内容很丰盛,不过实战的部分跟理论搭不上,特别是分布式的部分,连预设情境、模拟环境说明之类的都没有,就堆了一些零散的代码,注释和说明也不充分(还有校对错误),有点鸡肋。
-
艾格蒙序曲2024-04-18复旦的课,朴实且全面。学的pre版,这个节点的所有LLMs书都太有时间属性了。
-
圣杯何在?2024-03-09偏算法基础与理论,然后介绍了大模型的算法架构。 还算不错的一本书介绍算法理论同时辅助代码实现
-
啊哈2024-02-24作为 introduction 还是很不错的,可以作为学习的起点
-
iterate2024-01-07看完了,嗯,觉得他这本书,虽然 一些地方比较简略,但是又 很多地方都触及了,而且是明确的触及,有点是 一个 繁盛的 没有叶子的大树 嗯,挺好的,各方面都讲到了,结合 chatgpt 看 很好吃 嗯。
-
鬼谷校长2023-12-31总体上是比较全面的LLM技术介绍,存在一些typo,校读不够充分
-
乐陶陶2024-02-15最新介绍大模型的书,有不少行业总结,代码示例也不少。但不太能看懂,特别是从微调以后的章节。后续看看其他的材料再来读。
-
汪杨2024-02-08还不错的书,覆盖的范围比较全面,不过内容比较精简不太适合初学者