研习社猫脸关键点预测

datawhalechina · Dec 20, 2019 · 2863892 · 2863892
1 parent 9967a13
commit 2863892
Show file tree

Hide file tree

Showing 3 changed files with 10,905 additions and 0 deletions.
diff --git a/competition/yanxishe-喵脸关键点检测/1_train.py b/competition/yanxishe-喵脸关键点检测/1_train.py
@@ -0,0 +1,286 @@
+# -*- coding: utf-8 -*-
+import os, sys, glob, argparse
+import pandas as pd
+import numpy as np
+from tqdm import tqdm
+
+import time, datetime
+import pdb, traceback
+
+import cv2
+# import imagehash
+from PIL import Image
+
+from sklearn.model_selection import train_test_split, StratifiedKFold, KFold
+
+from efficientnet_pytorch import EfficientNet
+# model = EfficientNet.from_pretrained('efficientnet-b4') 
+
+import torch
+torch.manual_seed(0)
+torch.backends.cudnn.deterministic = False
+torch.backends.cudnn.benchmark = True
+
+import torchvision.models as models
+import torchvision.transforms as transforms
+import torchvision.datasets as datasets
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+from torch.autograd import Variable
+from torch.utils.data.dataset import Dataset
+
+# input dataset
+# train_path = glob.glob('../../../dataset/IMDB-WIKI/imdb_crop/*/*')
+train_df = pd.read_csv('./train_box.csv').iloc[:]
+train_df['filename'] = train_df['filename'].apply(lambda x: '../train/{0}'.format(x)+'.jpg')
+
+class QRDataset(Dataset):
+    def __init__(self, df, transform=None, cut_ratio=0.2):
+        self.df = df
+        self.cut_ratio = cut_ratio
+        if transform is not None:
+            self.transform = transform
+        else:
+            self.transform = None
+
+    def __getitem__(self, index):
+        start_time = time.time()
+        img = Image.open(self.df['filename'].iloc[index]).convert('RGB')
+
+        if self.transform is not None:
+            img = self.transform(img)
+        # print(np.array(self.df.iloc[index, 1:-2].values, dtype=np.float32))
+        return img,torch.from_numpy(np.array(self.df.iloc[index, 1:-2].values.astype(np.float32)))
+
+    def __len__(self):
+        return len(self.df)
+
+def accuracy(output, target, topk=(1,)):
+    """Computes the accuracy over the k top predictions for the specified values of k"""
+    with torch.no_grad():
+        maxk = max(topk)
+        batch_size = target.size(0)
+
+        _, pred = output.topk(maxk, 1, True, True)
+        pred = pred.t()
+        correct = pred.eq(target.view(1, -1).expand_as(pred))
+
+        res = []
+        for k in topk:
+            correct_k = correct[:k].view(-1).float().sum(0, keepdim=True)
+            res.append(correct_k.mul_(100.0 / batch_size))
+        return res
+
+class AverageMeter(object):
+    """Computes and stores the average and current value"""
+    def __init__(self, name, fmt=':f'):
+        self.name = name
+        self.fmt = fmt
+        self.reset()
+
+    def reset(self):
+        self.val = 0
+        self.avg = 0
+        self.sum = 0
+        self.count = 0
+
+    def update(self, val, n=1):
+        self.val = val
+        self.sum += val * n
+        self.count += n
+        self.avg = self.sum / self.count
+
+    def __str__(self):
+        fmtstr = '{name} {val' + self.fmt + '} ({avg' + self.fmt + '})'
+        return fmtstr.format(**self.__dict__)
+
+class ProgressMeter(object):
+    def __init__(self, num_batches, *meters):
+        self.batch_fmtstr = self._get_batch_fmtstr(num_batches)
+        self.meters = meters
+        self.prefix = ""
+
+
+    def pr2int(self, batch):
+        entries = [self.prefix + self.batch_fmtstr.format(batch)]
+        entries += [str(meter) for meter in self.meters]
+        print('  '.join(entries))
+
+    def _get_batch_fmtstr(self, num_batches):
+        num_digits = len(str(num_batches // 1))
+        fmt = '{:' + str(num_digits) + 'd}'
+        return '[' + fmt + '/' + fmt.format(num_batches) + ']'
+
+class VisitNet(nn.Module):
+    def __init__(self):
+        super(VisitNet, self).__init__()
+
+#         model = models.resnet18(True)
+#         model.avgpool = nn.AdaptiveAvgPool2d(1)
+#         model.fc = nn.Linear(512, 18)
+#         self.resnet = model
+
+        model = EfficientNet.from_pretrained('efficientnet-b0') 
+        model._fc = nn.Linear(1280, 18)
+        self.resnet = model
+
+    def forward(self, img):        
+        out = self.resnet(img)
+        return out
+
+def validate(val_loader, model, criterion):
+    batch_time = AverageMeter('Time', ':6.3f')
+    losses = AverageMeter('Loss', ':.4e')
+    # top1 = AverageMeter('Acc@1', ':2.2f')
+    # top5 = AverageMeter('Acc@5', ':2.2f')
+    progress = ProgressMeter(len(val_loader), batch_time, losses)
+
+    # switch to evaluate mode
+    model.eval()
+
+    with torch.no_grad():
+        end = time.time()
+        for i, (input, target) in enumerate(val_loader):
+            input = input.cuda()
+            target = target.cuda()
+
+            # compute output
+            output = model(input)
+            loss = criterion(output, target)
+
+            # measure accuracy and record loss
+            # acc1, acc5 = accuracy(output, target, topk=(1, 5))
+            losses.update(loss.item(), input.size(0))
+            # top1.update(acc1[0], input.size(0))
+            # top5.update(acc5[0], input.size(0))
+
+            # measure elapsed time
+            batch_time.update(time.time() - end)
+            end = time.time()
+
+        # TODO: this should also be done with the ProgressMeter
+        print(losses.avg)
+        return losses
+
+def predict(test_loader, model, tta=10):
+    # switch to evaluate mode
+    model.eval()
+
+    test_pred_tta = None
+    for _ in range(tta):
+        test_pred = []
+        with torch.no_grad():
+            end = time.time()
+            for i, (input, target) in enumerate(test_loader):
+                input = input.cuda()
+                target = target.cuda()
+
+                # compute output
+                output = model(input, path)
+                output = output.data.cpu().numpy()
+
+                test_pred.append(output)
+        test_pred = np.vstack(test_pred)
+
+        if test_pred_tta is None:
+            test_pred_tta = test_pred
+        else:
+            test_pred_tta += test_pred
+
+    return test_pred_tta
+
+def train(train_loader, model, criterion, optimizer, epoch):
+    batch_time = AverageMeter('Time', ':6.3f')
+    # data_time = AverageMeter('Data', ':6.3f')
+    losses = AverageMeter('Loss', ':.4e')
+    # top1 = AverageMeter('Acc@1', ':2.2f')
+    # top5 = AverageMeter('Acc@5', ':2.2f')
+    progress = ProgressMeter(len(train_loader), batch_time, losses)
+
+    # switch to train mode
+    model.train()
+
+    end = time.time()
+    for i, (input, target) in enumerate(train_loader):
+        input = input.cuda(non_blocking=True)
+        target = target.cuda(non_blocking=True)
+
+        # compute output
+        output = model(input)
+        loss = criterion(output, target)
+
+        # measure accuracy and record loss
+        # acc1, acc5 = accuracy(output, target, topk=(1, 5))
+        losses.update(loss.item(), input.size(0))
+        # top1.update(acc1[0], input.size(0))
+        # top5.update(acc5[0], input.size(0))
+
+        # compute gradient and do SGD step
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+        # measure elapsed time
+        batch_time.update(time.time() - end)
+        end = time.time()
+
+        if i % 100 == 0:
+            progress.pr2int(i)
+
+skf = KFold(n_splits=10, random_state=233, shuffle=True)
+for flod_idx, (train_idx, val_idx) in enumerate(skf.split(train_df['filename'].values, train_df['filename'].values)):
+    # print(flod_idx, train_idx, val_idx)
+    if flod_idx in [0, 1, 2, 3]:
+        continue
+
+    train_loader = torch.utils.data.DataLoader(
+        QRDataset(train_df.iloc[train_idx],
+                transforms.Compose([
+                            # transforms.RandomGrayscale(),
+                            transforms.Resize((512, 512)),
+                            # transforms.RandomAffine(5),
+                            transforms.ColorJitter(hue=.05, saturation=.05),
+                            # transforms.RandomCrop((88, 88)),
+                            # transforms.RandomHorizontalFlip(),
+                            # transforms.RandomVerticalFlip(),
+                            transforms.ToTensor(),
+                            transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
+            ]), 0
+        ), batch_size=10, shuffle=True, num_workers=10, pin_memory=True
+    )
+
+    val_loader = torch.utils.data.DataLoader(
+        QRDataset(train_df.iloc[val_idx],
+                transforms.Compose([
+                            transforms.Resize((512, 512)),
+                            # transforms.Resize((124, 124)),
+                            # transforms.RandomCrop((88, 88)),
+                            transforms.ToTensor(),
+                            transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
+            ]), 0
+        ), batch_size=10, shuffle=False, num_workers=10, pin_memory=True
+    )
+
+
+    model = VisitNet().cuda()
+    # model = nn.DataParallel(model).cuda()
+    # model.load_state_dict(torch.load('resnet18_pretrain_fold0.pt'))
+    # model.resnet.fc = nn.Linear(512, 100)
+    model = model.cuda()
+
+    # model = nn.DataParallel(model).cuda()
+    criterion = nn.MSELoss(size_average=False)
+    optimizer = torch.optim.Adam(model.parameters(), 0.001)
+    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=5, gamma=0.85)
+    best_acc = 10.0
+    for epoch in range(10):
+        scheduler.step()
+        print('Epoch: ', epoch)
+
+        train(train_loader, model, criterion, optimizer, epoch)
+        val_acc = validate(val_loader, model, criterion)
+
+        if val_acc.avg < best_acc:
+            best_acc = val_acc.avg
+            torch.save(model.state_dict(), './resnet18_fold{0}.pt'.format(flod_idx))