通往AGI的大模型MultiAgent的RL是对的但HF有上限

互联网 12 月前 0 2

本文介绍: 8. RLHF（基于人类反馈（Hum an Fe e dba c k）对语言模型进行强化学习（Re info r ce m ent Le arnin g））不一定是AGI 的必经路径，因为RLHF是hf部分决定了上限，怎么会通往 AGI？4. 学术界大模型研究与工业界差距大，一个问题是 gpu 算力集群不够，学术界不能做pre train，很难下决心 all in 某个研究方向，另一个问题是学术界研究不能在生产中验证。3. 同行Meta 没有做到位，Llama 还是差的挺多的，远远没有做好， meta 没有 train 好。

OpenAI高管Mi r a Mur a t i周三告诉员工，一封关于AI取得突破的信件促使董事会采取了解雇行动。一位消息人士透露，OpenAI在Q*项目上取得了进展，内部人士认为这可能是OpenAI在超级智能领域的突破。这名消息人士称，虽然Q*的数学成绩只是小学生的水平，但在测试中取得优异成绩让研究人员对它未来的成功非常乐观

有人说：奥特曼不用斯派修姆光线把解雇他的OpenAI给消灭吗？

人类终将打开AGI（Art i fi ci al Gener al Int el li gence）通用人工智能的魔盒。

1. sc aling up 是接近 AGI 的正确方向，虽然不一定是最佳方向。

2. 架构层面上，相信肯定有比 transformer 更好架构，但现在大家已经在这个架构上做了很多工作了，也能用。

3. 同行Meta 没有做到位，Llama 还是差的挺多的，远远没有做好， meta 没有 train 好。

4. 学术界大模型研究与工业界差距大，一个问题是 gpu 算力集群不够，学术界不能做pretrain，很难下决心 all in 某个研究方向，另一个问题是学术界研究不能在生产中验证

5. gpt 5什么时候出来不知道。

6. 这一年来 gpt 底层 model 并没换，只不过人的错觉认为变弱了

7. 很多开源社区都是重复的造轮子，所以 OpenAI内部就自己做掉这部分轮子

8. RLHF（基于人类反馈（Human Feedback）对语言模型进行强化学习（Reinfo r cement Learnin g））不一定是AGI 的必经路径，因为RLHF是hf部分决定了上限，怎么会通往 AGI？

9. 但RL是正确的，看好 multi agent，类比阿法狗，可以左脚踩右脚把能力提上去。

10. GPTs是为了方便开发者而零时发布的一个产品，这不是OpenAI公司的重点

原文地址:https://blog.csdn.net/qq _42672770/ar t icle/de tail s/134660818

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若转载，请注明出处：http://www.7code.cn/show_21652.html

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

相关文章

架构学习(四)：scrapy下载中间件实现动态切换User-Agent

架构学习(四)：scrapy下载中间件实现动态切换User-Agent

互联网 10 月前 5

二、人工智能之提示工程(Prompt Engineering)

二、人工智能之提示工程(Prompt Engineering)

互联网 10 月前 5

Apache POI 处理excel文件记录用法

Apache POI 处理excel文件记录用法

apache 10 月前 3

论文阅读笔记AI篇 —— Transformer模型理论+实战 (四)

论文阅读笔记AI篇 —— Transformer模型理论+实战 (四)

互联网 10 月前 3

【书生·浦语大模型实战】“PDF阅读小助手”学习笔记

【书生·浦语大模型实战】“PDF阅读小助手”学习笔记

互联网 10 月前 4

2024/1/17 DFS BFS + Div 3 a,b

2024/1/17 DFS BFS + Div 3 a,b

互联网 10 月前 6

JVM之GC垃圾回收

互联网 10 月前 3

行为型设计模式—中介者模式

互联网 10 月前 4

发表回复取消回复