苹果病害图像识别挑战赛

发表于 2023-08-02 更新于 2023-08-21 Disqus：
一次比赛记录
数据下载地址
import os, sys, glob, argparse
import pandas as pd
import numpy as np
from tqdm import tqdm
import matplotlib.pyplot as plt
#%matplotlib inline
import time
import cv2
from PIL import Image
from sklearn.model_selection import train_test_split, StratifiedKFold, KFold

import torch
torch.manual_seed(0)
torch.backends.cudnn.deterministic = False
torch.backends.cudnn.benchmark = True

import torchvision.models as models
import torchvision.transforms as transforms
import torchvision.datasets as datasets
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.autograd import Variable
#from torch.utils.data.dataset import Dataset
from torch.utils.data import Dataset
import albumentations as A

train_path = glob.glob('./苹果病害图像识别挑战赛公开数据/train/*/*')
test_path = glob.glob('./苹果病害图像识别挑战赛公开数据/test/*')

np.random.shuffle(train_path)
np.random.shuffle(test_path)

DATA_CACHE = {}
class XunFeiDataset(Dataset):
    #DATA_CACHE = {}
    def __init__(self, img_path, transform=None):
        self.img_path = img_path
        if transform is not None:
            self.transform = transform
        else:
            self.transform = None
    
    def __getitem__(self, index):
    	
        if self.img_path[index] in DATA_CACHE:
            img = DATA_CACHE[self.img_path[index]]
        else:
            #img = cv2.imread(self.img_path[index])
            img = cv2.imdecode(np.fromfile(self.img_path[index], dtype=np.uint8), -1)#中文路径读取
            # imdecode读取的是rgb，如果后续需要opencv处理的话，需要转换成bgr，转换后图片颜色会变化
            #img = cv2.cvtColor(img, cv2.COLOR_RGB2BGR)但是测试结果是读取为bgr所以不用转换
            DATA_CACHE[self.img_path[index]] = img
        
        #print(self.img_path[index].split('\\')[1])
        if self.transform is not None:
            img = self.transform(image = img)['image']
            
        if self.img_path[index].split('\\')[1] in ['d1', 'd2', 'd3', 'd4', 'd5', 'd6', 'd7', 'd8', 'd9']:
        #if self.img_path[index].split('/')[-2] in ['d1', 'd2', 'd3', 'd4', 'd5', 'd6', 'd7', 'd8', 'd9']:
            label = ['d1', 'd2', 'd3', 'd4', 'd5', 'd6', 'd7', 'd8', 'd9'].index(self.img_path[index].split('\\')[1])#.split('/')[-2])
        else:
            label = -1
        
        img = img.transpose([2,0,1])
        return img, torch.from_numpy(np.array(label))
    
    def __len__(self):
        return len(self.img_path)

class XunFeiNet(nn.Module):
    def __init__(self,l=None):
        super(XunFeiNet, self).__init__()
                
        model = models.resnet18(weights=models.ResNet18_Weights.DEFAULT)#(True)
        model.avgpool = nn.AdaptiveAvgPool2d(1)
        model.fc = nn.Linear(512, 9)
        if l!=None:
            model=model.load_state_dict(torch.load('model1.pth'))
        self.resnet = model
        
    def forward(self, img):        
        out = self.resnet(img)
        return out

def train(train_loader, model, criterion, optimizer):
    model.train()
    train_loss = 0.0
    for i, (x, target) in enumerate(train_loader):
        x = x.cuda(non_blocking=True)
        target=target.float()
        target = target.cuda(non_blocking=True)

        # compute output
        output = model(x)
        loss = criterion(output, target.long())

        # compute gradient and do SGD step
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if i % 20 == 0:
            print('Train loss', loss.item())
            
        train_loss += loss.item()
    
    return train_loss/len(train_loader)
            
def validate(val_loader, model, criterion):
    model.eval()
    
    val_acc = 0.0
    
    with torch.no_grad():
        end = time.time()
        for i, (x, target) in enumerate(val_loader):
            x = x.cuda()
            target=target.float()
            target = target.cuda()

            # compute output
            output = model(x)
            loss = criterion(output, target.long())
            
            val_acc += (output.argmax(1) == target).sum().item()
            
    return val_acc / len(val_loader.dataset)

def predict(test_loader, model, criterion):
    model.eval()
    val_acc = 0.0
    
    test_pred = []
    with torch.no_grad():
        end = time.time()
        for i, (x, target) in enumerate(test_loader):
            x = x.cuda()
            target=target.float()
            target = target.cuda()

            # compute output
            output = model(x)
            test_pred.append(output.data.cpu().numpy())
            
    return np.vstack(test_pred)





train_loader = torch.utils.data.DataLoader(
    XunFeiDataset(train_path[:-1000],
            A.Compose([
            A.RandomRotate90(),
            A.Resize(256, 256),
            A.RandomCrop(224, 224),
            A.HorizontalFlip(p=0.5),
            A.RandomBrightnessContrast(p=0.5),#A.RandomContrast(p=0.5),
            A.RandomBrightnessContrast(p=0.5),
            A.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225))
        ])
    ), batch_size=30, shuffle=True, num_workers=4#, pin_memory=False
)

val_loader = torch.utils.data.DataLoader(
    XunFeiDataset(train_path[-1000:],
            A.Compose([
            A.Resize(256, 256),
            A.RandomCrop(224, 224),
            # A.HorizontalFlip(p=0.5),
            # A.RandomContrast(p=0.5),
            A.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225))
        ])
    ), batch_size=30, shuffle=False, num_workers=4#, pin_memory=False
)

test_loader = torch.utils.data.DataLoader(
    XunFeiDataset(test_path,
            A.Compose([
            A.Resize(256, 256),
            A.RandomCrop(224, 224),
            A.HorizontalFlip(p=0.5),
            A.RandomBrightnessContrast(p=0.5),#RandomContrast(p=0.5),
            A.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225))
        ])
    ), batch_size=2, shuffle=False, num_workers=4#, pin_memory=False
)


model = XunFeiNet()

model = model.to('cuda')
criterion = nn.CrossEntropyLoss().cuda()
optimizer = torch.optim.AdamW(model.parameters(), 0.00005)#0.001)

if __name__ == '__main__':
	for i  in range(2):
		print(i,'开始')
		train_loss = train(train_loader, model, criterion, optimizer)
		val_acc  = validate(val_loader, model, criterion)
		train_acc = validate(train_loader, model, criterion)

		print(train_loss, train_acc, val_acc)
	torch.save(model.state_dict(), 'model1.pth')
	pred = None

	for _ in range(10):
		if pred is None:
			pred = predict(test_loader, model, criterion)
		else:
			pred += predict(test_loader, model, criterion)



	submit = pd.DataFrame(
    	{
        	'uuid': [(x.split("\\")[-1]).split("/")[-1] for x in test_path],
        	'label': [['d1', 'd2', 'd3', 'd4', 'd5', 'd6', 'd7', 'd8', 'd9'][x] for x in pred.argmax(1)]
	})



	submit = submit.sort_values(by='uuid')
	submit.to_csv('submit1.csv', index=None)