tuan_tuan
/
torch

 
			
							import os.path
import numpy as np
from datetime import datetime

import torch.nn
from torch.nn import CrossEntropyLoss
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter #tensorboard  --> 可视化
from torch.optim.lr_scheduler import ExponentialLR,CosineAnnealingLR
from torch.nn.functional import  one_hot

from utils.dataset.TT_Dataset  import MyDataset                 #读取数据所用函数
from Model.UNet.unetpro import UNet

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

def estimate(y_label, y_pred):
    y_pred[y_label==0]=0
    # 准确率
    acc = np.mean(np.equal(y_label, y_pred) + 0)

    return acc

#参数
num_classes = 7
epochs = 200
# batch_size = 1
modelname = "UNet"
def train():
    #可视化
    now = datetime.now()
    now = str(now.month) + '_' + str(now.day) + '_' + str(now.hour) + '_' + str(now.minute)

    tensorboardPath = os.path.join(os.getcwd(), 'logs',modelname,now)  #可视化文件所在的文件夹
    if os.path.exists(tensorboardPath) == False:
        os.makedirs(tensorboardPath)

    writer = SummaryWriter(tensorboardPath)

    #数据处理
    # imagePath = r"E:\yqj\try\code\Train\Data\Numpy_Data\Image\image_train.npy"
    # labelPath = r"E:\yqj\try\code\Train\Data\Numpy_Data\Class\256,256,7\classify_labels_Train_Dataset_.npy"
    # valImgPath = r"E:\yqj\try\code\Train\Data\Numpy_Data\Image\image_vaild.npy"
    # valLabPath = r"E:\yqj\try\code\Train\Data\Numpy_Data\Class\256,256,7\classify_labels_Vaild_Dataset_.npy"
    #
    imagePath = r"G:\数据集\YQJ\cut\train\image"
    labelPath = r"G:\数据集\YQJ\cut\train\label"


    # imagePath = os.path.join(os.getcwd(), 'Train', "Data", "image")
    # labelPath = os.path.join(os.getcwd(), 'Train', "Data", "label")

    #构建数据集
    trainDataset = MyDataset(imagePath, labelPath)
    trainDatasetloader = DataLoader(trainDataset, 1,num_workers=1, pin_memory=True)
    trainLen = len(trainDataset)

    # valDataset = MyDataset(valImgPath, valLabPath)
    # valDatasetloader = DataLoader(valDataset, 1)
    # valLen = len(valDataset)
    #定义模型
    model = UNet(num_classes=num_classes, image_size=512).to(device)
    # n_paramtters = sum(p.nume() for p in model.parameters() if p.requires_grad)
    # print('number of params(M): %.2f' % (n_paramtters / 1.e6))
    total = sum([param.nelement() for param in model.parameters()])

    print("Number of parameter: %.2fM" % (total / 1e6))

    #损失函数 优化器
    loss = CrossEntropyLoss(ignore_index=0)
    # opt1 = torch.optim.SGD(model.parameters(),momentum=0.9,lr=0.0001)
    optimizer = torch.optim.AdamW(model.parameters(), lr=0.0005, betas=(0.9, 0.95))
    print(f"优化器参数： {optimizer}")

    #训练
    for epoch in range(epochs):
        print(f"----------------------------------------------epoch: {epoch}----------------------------------------------")
        total_loss = 0
        total_acc = 0
        num = 0
        number = [1,1,1]
        old_num = [0,0,0]

        # 梯度清零
        optimizer.zero_grad()

        for i, data in enumerate(trainDatasetloader):
            img, lab, path = data
            name = path[0].split('\\') #图片名称
            old_num = number
            number = name[-1].replace('.tif', '').split('_')  #数字标号  [0]:第几张图片 [1]:行数 [2]:列数
            print(number)
            postion = number[1:]
            for i, v in enumerate(postion): postion[i] = int(v)
            postion = np.array(postion)

            postion = torch.from_numpy(postion)

            img = img.to(device)
            lab = lab.to(device)
            print(postion)

            output = model(img,postion)
            model_loss = loss(output, lab.long())

            #loss回传 优化器更新参数
            model_loss.backward()
            optimizer.step()

            if(int(old_num[0]) < int(number[0])):
                optimizer.zero_grad()
                print("梯度置零")

            lr = optimizer.param_groups[0]["lr"]     #当前学习率
            print("\r train: epoch: {}, step: {}/{}, lr: {}, loss: {}".format(epoch, i, trainLen, lr, round(float(model_loss), 8)), end='')
            total_loss += model_loss                 #每一步的loss求和

            #可视化的参数
            writer.add_scalar('Train Step Loss ', model_loss,epoch * len(trainDataset) + i )


        # with torch.no_grad():
        #     for i, data in enumerate(valDatasetloader):
        #         img, lab = data
        #         img = img.to(device)
        #         lab = lab.to(device)
        #
        #         output = model(img)
        #         model_loss = loss(output, lab.to(torch.float32))
        #         acc = estimate(lab,img)
        #
        #         lr = optimizer.param_groups[0]["lr"]  # 当前学习率
        #         print(f"val:  epoch: {epoch} setp: {i} acc: {acc} loss: {round(float(model_loss), 8)} ")
        #         total_loss += model_loss  # 每一步的loss求和
        #         total_acc += acc

        #每一个epoch的平均loss
        epoch_loss = total_loss * 1.0 / len(trainDataset)
        # epoch_acc = total_acc * 1.0 /len(valDataset)

        writer.add_scalar('Train Epoch Loss', epoch_loss, epoch + 1 )
        writer.add_scalar('Train Step Lr ', lr, epoch  + i)
        # writer.add_scalar('Val Epoch acc', epoch_acc, epoch + 1)
        # print("\r epoch: {}, epoch_loss: {}, epoch_acc: {}".format(epoch, epoch_loss, epoch_acc), end='')
        #保存模型
        save_name = str(epoch+1) + '-' +str(round(float(epoch_loss), 5)) + ".pth"  #模型名称
        savepath = os.path.join(os.getcwd(), 'Train', "save_model", modelname)     #模型所在文件夹

        Path = os.path.join(savepath, save_name)
        if os.path.exists(savepath) == False:
            os.makedirs(savepath)

        #前190个epoch： 每20个epoch保存一次
        if((epoch + 1) % 20 == 0 and (epoch + 1) < 190):
            torch.save(model.state_dict(),Path)
        # 最后10个epoch： 每个epoch保存一个
        elif((epoch + 1) > 190):
            torch.save(model.state_dict(), Path)


if __name__ == '__main__':
    train()