pytorch打印变量

互联网 1 年前 0 1

本文介绍: print(i)

import torch
#state_dict = torch.loa d(“/home/llama-33B_epoch_0000_step_0004.pt/lla m a.bin“)
#state_dict = torch.loa d(“/home/ckpt/lla m a/30B/consolid ated.00.pth”)
#state_dict = torch.loa d(‘/home/ckpt/lla m a/33B/checkpoints/actor/llama-33B_epoch_0000_step_0004.pt/global_step5/mp_rank_02_mod el_states.pt’)
#state_dict = torch.load(‘/home/ckpt/trainllama/train_zero2_step0/actor/llama-33B_epoch_000_step_000.pt/llama_0.bin‘)
#state_dict = torch.load(‘/home/ckpt/llama/llama-7B_epoch_0000_step_2199.pt/global_step2200/bf16_zero_pp_rank_0_mp_rank_00_optim_states.pt’)
state_dict = torch.load(‘/home/ckpt/llama/65B/checkpoin ts/actor/llama-65B_epoch_0000000_step_0069999.pt/65b_4.bin‘)
print(type(state_dict))

for i in state_dict:
#if i == ‘mod el.layers.1.attention.wq.weight’:
print(i)
print(type(state_dict[i]))
#print(“val ue:”,state_dict[i].shape)
print(“val ue:”,state_dict[i][0:10,0:5])
#print(“val ue:”,state_dict[i].data.size())
#print(“val ue:”,state_dict[i].data)

原文地址:https://blog.csdn.net/upwind_fly/article/details/134555034

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若转载，请注明出处：http://www.7code.cn/show_2177.html

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

llama state torch

相关文章

gstreamer学习笔记

互联网 12 月前 2

查看Pytorch的GPU是否可用

查看Pytorch的GPU是否可用

互联网 1 年前 5

torch.empty()造成的内存溢出问题

torch.empty()造成的内存溢出问题

互联网 1 年前 4

flink1.18 广播流 The Broadcast State Pattern 官方案例scala版本

flink1.18 广播流 The Broadcast State Pattern 官方案例scala版本

互联网 1 年前 5

FlinkAPI开发之状态管理

FlinkAPI开发之状态管理

互联网 1 年前 3

Vuex的基础使用

vue 1 年前 5

JVM之GC垃圾回收

互联网 12 月前 3

行为型设计模式—中介者模式

互联网 12 月前 4

发表回复取消回复