[跑代码]BK-SDM: A Lightweight, Fast, and Cheap Version of Stable Diffusion

本文介绍: 我修改后下载文件名 https://… …/pre process e d _11k.tar.gz 直接粘贴到网址里面也可以下载。检测是否能够训练（先下载数据集get _la ion _data.sh 再运行代码kd _train_t o y.sh）批量大小为8 (=4×2)，训练BK-SDM-Bas e 20次迭代大约需要5分钟和22GB的GPU内存。$FILe_PATH 就是下载路径./data/laion_aes/pre process e d_11k。单GPU训练BK-SDM{Bas e, Small, Tin y}-2。

conda create -n bk-sdm python=3.8
conda activate bk-sdm
git clone https://github.com/Nota-NetsPresso/BK-SDM.git
cd BK-SDM
pip install -r requirements.txt

PNDM采样器 50步去噪声

等效代码(仅修改SD-v1.4的U-Net，同时保留其文本编码器和图像解码器):

Our code was base d on train_text_to_image.py of Di ff users 0.15.0.dev0. To access t he latest version, use this link.
BK-SDM的diff users版本0.15
我的diff users版本比较高0.24.0

bash scripts/get_laion_data.sh preprocessed_11k

# https://netspresso-research-code-release.s3.us-east-2.amazonaws.com/data/improved_aesthetics_6.5plus/preprocessed_11k.tar.gz
# https://netspresso-research-code-release.s3.us-east-2.amazonaws.com/data/improved_aesthetics_6.5plus/preprocessed_212k.tar.gz
# https://netspresso-research-code-release.s3.us-east-2.amazonaws.com/data/improved_aesthetics_6.5plus/preprocessed_2256k.tar.gz

DATA_TYPE=$"preprocessed_11k"  # {preprocessed_11k, preprocessed_212k, preprocessed_2256k}
FILE_NAME="${DATA_TYPE}.tar.gz"
 

DATA_DIR="./data/laion_aes/"
FILE_UNZIP_DIR="${DATA_DIR}${DATA_TYPE}"
FILE_PATH="${DATA_DIR}${FILE_NAME}"

if [ "$DATA_TYPE" = "preprocessed_11k" ] || [ "$DATA_TYPE" = "preprocessed_212k" ]; then
    echo "-&gt; preprocessed_11k or 212k"
    S3_URL="https://netspresso-research-code-release.s3.us-east-2.amazonaws.com/data/improved_aesthetics_6.5plus/${FILE_NAME}"
elif [ "$DATA_TYPE" = "preprocessed_2256k" ]; then
    S3_URL="https://netspresso-research-code-release.s3.us-east-2.amazonaws.com/data/improved_aesthetics_6.25plus/${FILE_NAME}"
else
    echo "Something wrong in data folder name"
    exit
fi

wget $S3_URL -O $FILE_PATH
tar -xvzf $FILE_PATH -C $DATA_DIR
echo "downloaded to ${FILE_UNZIP_DIR}"

bash scripts/kd_train_toy.sh

MODEL_NAME="CompVis/stable-diffusion-v1-4"
TRAIN_DATA_DIR="./data/laion_aes/preprocessed_11k" # please adjust it if needed
UNET_CONFIG_PATH="./src/unet_config"

UNET_NAME="bk_small" # option: ["bk_base", "bk_small", "bk_tiny"]
OUTPUT_DIR="./results/toy_"$UNET_NAME # please adjust it if needed

BATCH_SIZE=2
GRAD_ACCUMULATION=4

StartTime=$(date +%s)

CUDA_VISIBLE_DEVICES=1 accelerate launch src/kd_train_text_to_image.py 
  --pretrained_model_name_or_path $MODEL_NAME 
  --train_data_dir $TRAIN_DATA_DIR
  --use_ema 
  --resolution 512 --center_crop --random_flip 
  --train_batch_size $BATCH_SIZE 
  --gradient_checkpointing 
  --mixed_precision="fp16" 
  --learning_rate 5e-05 
  --max_grad_norm 1 
  --lr_scheduler="constant" --lr_warmup_steps=0 
  --report_to="all" 
  --max_train_steps=20 
  --seed 1234 
  --gradient_accumulation_steps $GRAD_ACCUMULATION 
  --checkpointing_steps 5 
  --valid_steps 5 
  --lambda_sd 1.0 --lambda_kd_output 1.0 --lambda_kd_feat 1.0 
  --use_copy_weight_from_teacher 
  --unet_config_path $UNET_CONFIG_PATH --unet_config_name $UNET_NAME 
  --output_dir $OUTPUT_DIR


EndTime=$(date +%s)
echo "** KD training takes $(($EndTime - $StartTime)) seconds."

bash scripts/get_laion_data.sh preprocessed_212k
bash scripts/kd_train.sh

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

bk sdm 下载

In sta llat ion(下载代码-装环境)

Not e on th e torch version s w e‘ve used

Di s ti llat ion Pre training

发表回复取消回复

Installation(下载代码-装环境)

Note on the torch versions we‘ve used

Distillation Pretraining

相关文章

发表回复 取消回复

In sta llat ion(下载代码-装环境)

Not e on th e torch version s w e‘ve used

Di s ti llat ion Pre training

发表回复取消回复