1e9be9d5eSMiklos Szeredi /* 2e9be9d5eSMiklos Szeredi * 3e9be9d5eSMiklos Szeredi * Copyright (C) 2011 Novell Inc. 4e9be9d5eSMiklos Szeredi * 5e9be9d5eSMiklos Szeredi * This program is free software; you can redistribute it and/or modify it 6e9be9d5eSMiklos Szeredi * under the terms of the GNU General Public License version 2 as published by 7e9be9d5eSMiklos Szeredi * the Free Software Foundation. 8e9be9d5eSMiklos Szeredi */ 9e9be9d5eSMiklos Szeredi 105b825c3aSIngo Molnar #include <uapi/linux/magic.h> 11e9be9d5eSMiklos Szeredi #include <linux/fs.h> 12e9be9d5eSMiklos Szeredi #include <linux/namei.h> 13e9be9d5eSMiklos Szeredi #include <linux/xattr.h> 14e9be9d5eSMiklos Szeredi #include <linux/mount.h> 15e9be9d5eSMiklos Szeredi #include <linux/parser.h> 16e9be9d5eSMiklos Szeredi #include <linux/module.h> 17cc259639SAndy Whitcroft #include <linux/statfs.h> 18f45827e8SErez Zadok #include <linux/seq_file.h> 19d837a49bSMiklos Szeredi #include <linux/posix_acl_xattr.h> 20e9be9d5eSMiklos Szeredi #include "overlayfs.h" 21bbb1e54dSMiklos Szeredi #include "ovl_entry.h" 22e9be9d5eSMiklos Szeredi 23e9be9d5eSMiklos Szeredi MODULE_AUTHOR("Miklos Szeredi <miklos@szeredi.hu>"); 24e9be9d5eSMiklos Szeredi MODULE_DESCRIPTION("Overlay filesystem"); 25e9be9d5eSMiklos Szeredi MODULE_LICENSE("GPL"); 26e9be9d5eSMiklos Szeredi 27e9be9d5eSMiklos Szeredi 28e9be9d5eSMiklos Szeredi struct ovl_dir_cache; 29e9be9d5eSMiklos Szeredi 30a78d9f0dSMiklos Szeredi #define OVL_MAX_STACK 500 31a78d9f0dSMiklos Szeredi 32688ea0e5SMiklos Szeredi static bool ovl_redirect_dir_def = IS_ENABLED(CONFIG_OVERLAY_FS_REDIRECT_DIR); 33688ea0e5SMiklos Szeredi module_param_named(redirect_dir, ovl_redirect_dir_def, bool, 0644); 34688ea0e5SMiklos Szeredi MODULE_PARM_DESC(ovl_redirect_dir_def, 35688ea0e5SMiklos Szeredi "Default to on or off for the redirect_dir feature"); 36e9be9d5eSMiklos Szeredi 37e9be9d5eSMiklos Szeredi static void ovl_dentry_release(struct dentry *dentry) 38e9be9d5eSMiklos Szeredi { 39e9be9d5eSMiklos Szeredi struct ovl_entry *oe = dentry->d_fsdata; 40e9be9d5eSMiklos Szeredi 41e9be9d5eSMiklos Szeredi if (oe) { 42dd662667SMiklos Szeredi unsigned int i; 43dd662667SMiklos Szeredi 44e9be9d5eSMiklos Szeredi dput(oe->__upperdentry); 4502b69b28SMiklos Szeredi kfree(oe->redirect); 46dd662667SMiklos Szeredi for (i = 0; i < oe->numlower; i++) 47dd662667SMiklos Szeredi dput(oe->lowerstack[i].dentry); 48e9be9d5eSMiklos Szeredi kfree_rcu(oe, rcu); 49e9be9d5eSMiklos Szeredi } 50e9be9d5eSMiklos Szeredi } 51e9be9d5eSMiklos Szeredi 52b0990fbbSAmir Goldstein static int ovl_check_append_only(struct inode *inode, int flag) 53b0990fbbSAmir Goldstein { 54b0990fbbSAmir Goldstein /* 55b0990fbbSAmir Goldstein * This test was moot in vfs may_open() because overlay inode does 56b0990fbbSAmir Goldstein * not have the S_APPEND flag, so re-check on real upper inode 57b0990fbbSAmir Goldstein */ 58b0990fbbSAmir Goldstein if (IS_APPEND(inode)) { 59b0990fbbSAmir Goldstein if ((flag & O_ACCMODE) != O_RDONLY && !(flag & O_APPEND)) 60b0990fbbSAmir Goldstein return -EPERM; 61b0990fbbSAmir Goldstein if (flag & O_TRUNC) 62b0990fbbSAmir Goldstein return -EPERM; 63b0990fbbSAmir Goldstein } 64b0990fbbSAmir Goldstein 65b0990fbbSAmir Goldstein return 0; 66b0990fbbSAmir Goldstein } 67b0990fbbSAmir Goldstein 682d902671SMiklos Szeredi static struct dentry *ovl_d_real(struct dentry *dentry, 692d902671SMiklos Szeredi const struct inode *inode, 702d902671SMiklos Szeredi unsigned int open_flags) 71d101a125SMiklos Szeredi { 72d101a125SMiklos Szeredi struct dentry *real; 73b0990fbbSAmir Goldstein int err; 74d101a125SMiklos Szeredi 75ca4c8a3aSMiklos Szeredi if (!d_is_reg(dentry)) { 76d101a125SMiklos Szeredi if (!inode || inode == d_inode(dentry)) 77d101a125SMiklos Szeredi return dentry; 78d101a125SMiklos Szeredi goto bug; 79d101a125SMiklos Szeredi } 80d101a125SMiklos Szeredi 812d902671SMiklos Szeredi if (d_is_negative(dentry)) 822d902671SMiklos Szeredi return dentry; 832d902671SMiklos Szeredi 842d902671SMiklos Szeredi if (open_flags) { 85b0990fbbSAmir Goldstein err = ovl_open_maybe_copy_up(dentry, open_flags); 862d902671SMiklos Szeredi if (err) 872d902671SMiklos Szeredi return ERR_PTR(err); 882d902671SMiklos Szeredi } 892d902671SMiklos Szeredi 90d101a125SMiklos Szeredi real = ovl_dentry_upper(dentry); 91b0990fbbSAmir Goldstein if (real && (!inode || inode == d_inode(real))) { 92b0990fbbSAmir Goldstein if (!inode) { 93b0990fbbSAmir Goldstein err = ovl_check_append_only(d_inode(real), open_flags); 94b0990fbbSAmir Goldstein if (err) 95b0990fbbSAmir Goldstein return ERR_PTR(err); 96b0990fbbSAmir Goldstein } 97d101a125SMiklos Szeredi return real; 98b0990fbbSAmir Goldstein } 99d101a125SMiklos Szeredi 100d101a125SMiklos Szeredi real = ovl_dentry_lower(dentry); 101d101a125SMiklos Szeredi if (!real) 102d101a125SMiklos Szeredi goto bug; 103d101a125SMiklos Szeredi 104c4fcfc16SMiklos Szeredi /* Handle recursion */ 105c4fcfc16SMiklos Szeredi real = d_real(real, inode, open_flags); 106c4fcfc16SMiklos Szeredi 107d101a125SMiklos Szeredi if (!inode || inode == d_inode(real)) 108d101a125SMiklos Szeredi return real; 109d101a125SMiklos Szeredi bug: 110656189d2SMiklos Szeredi WARN(1, "ovl_d_real(%pd4, %s:%lu): real dentry not found\n", dentry, 111d101a125SMiklos Szeredi inode ? inode->i_sb->s_id : "NULL", inode ? inode->i_ino : 0); 112d101a125SMiklos Szeredi return dentry; 113d101a125SMiklos Szeredi } 114d101a125SMiklos Szeredi 1157c03b5d4SMiklos Szeredi static int ovl_dentry_revalidate(struct dentry *dentry, unsigned int flags) 1167c03b5d4SMiklos Szeredi { 1177c03b5d4SMiklos Szeredi struct ovl_entry *oe = dentry->d_fsdata; 1187c03b5d4SMiklos Szeredi unsigned int i; 1197c03b5d4SMiklos Szeredi int ret = 1; 1207c03b5d4SMiklos Szeredi 1217c03b5d4SMiklos Szeredi for (i = 0; i < oe->numlower; i++) { 1227c03b5d4SMiklos Szeredi struct dentry *d = oe->lowerstack[i].dentry; 1237c03b5d4SMiklos Szeredi 1247c03b5d4SMiklos Szeredi if (d->d_flags & DCACHE_OP_REVALIDATE) { 1257c03b5d4SMiklos Szeredi ret = d->d_op->d_revalidate(d, flags); 1267c03b5d4SMiklos Szeredi if (ret < 0) 1277c03b5d4SMiklos Szeredi return ret; 1287c03b5d4SMiklos Szeredi if (!ret) { 1297c03b5d4SMiklos Szeredi if (!(flags & LOOKUP_RCU)) 1307c03b5d4SMiklos Szeredi d_invalidate(d); 1317c03b5d4SMiklos Szeredi return -ESTALE; 1327c03b5d4SMiklos Szeredi } 1337c03b5d4SMiklos Szeredi } 1347c03b5d4SMiklos Szeredi } 1357c03b5d4SMiklos Szeredi return 1; 1367c03b5d4SMiklos Szeredi } 1377c03b5d4SMiklos Szeredi 1387c03b5d4SMiklos Szeredi static int ovl_dentry_weak_revalidate(struct dentry *dentry, unsigned int flags) 1397c03b5d4SMiklos Szeredi { 1407c03b5d4SMiklos Szeredi struct ovl_entry *oe = dentry->d_fsdata; 1417c03b5d4SMiklos Szeredi unsigned int i; 1427c03b5d4SMiklos Szeredi int ret = 1; 1437c03b5d4SMiklos Szeredi 1447c03b5d4SMiklos Szeredi for (i = 0; i < oe->numlower; i++) { 1457c03b5d4SMiklos Szeredi struct dentry *d = oe->lowerstack[i].dentry; 1467c03b5d4SMiklos Szeredi 1477c03b5d4SMiklos Szeredi if (d->d_flags & DCACHE_OP_WEAK_REVALIDATE) { 1487c03b5d4SMiklos Szeredi ret = d->d_op->d_weak_revalidate(d, flags); 1497c03b5d4SMiklos Szeredi if (ret <= 0) 1507c03b5d4SMiklos Szeredi break; 1517c03b5d4SMiklos Szeredi } 1527c03b5d4SMiklos Szeredi } 1537c03b5d4SMiklos Szeredi return ret; 1547c03b5d4SMiklos Szeredi } 1557c03b5d4SMiklos Szeredi 156e9be9d5eSMiklos Szeredi static const struct dentry_operations ovl_dentry_operations = { 157e9be9d5eSMiklos Szeredi .d_release = ovl_dentry_release, 158d101a125SMiklos Szeredi .d_real = ovl_d_real, 159e9be9d5eSMiklos Szeredi }; 160e9be9d5eSMiklos Szeredi 1617c03b5d4SMiklos Szeredi static const struct dentry_operations ovl_reval_dentry_operations = { 1627c03b5d4SMiklos Szeredi .d_release = ovl_dentry_release, 163d101a125SMiklos Szeredi .d_real = ovl_d_real, 1647c03b5d4SMiklos Szeredi .d_revalidate = ovl_dentry_revalidate, 1657c03b5d4SMiklos Szeredi .d_weak_revalidate = ovl_dentry_weak_revalidate, 1667c03b5d4SMiklos Szeredi }; 1677c03b5d4SMiklos Szeredi 168e9be9d5eSMiklos Szeredi static void ovl_put_super(struct super_block *sb) 169e9be9d5eSMiklos Szeredi { 170e9be9d5eSMiklos Szeredi struct ovl_fs *ufs = sb->s_fs_info; 171dd662667SMiklos Szeredi unsigned i; 172e9be9d5eSMiklos Szeredi 173e9be9d5eSMiklos Szeredi dput(ufs->workdir); 174e9be9d5eSMiklos Szeredi mntput(ufs->upper_mnt); 175dd662667SMiklos Szeredi for (i = 0; i < ufs->numlower; i++) 176dd662667SMiklos Szeredi mntput(ufs->lower_mnt[i]); 1775ffdbe8bSKonstantin Khlebnikov kfree(ufs->lower_mnt); 178e9be9d5eSMiklos Szeredi 179f45827e8SErez Zadok kfree(ufs->config.lowerdir); 180f45827e8SErez Zadok kfree(ufs->config.upperdir); 181f45827e8SErez Zadok kfree(ufs->config.workdir); 1823fe6e52fSAntonio Murdaca put_cred(ufs->creator_cred); 183e9be9d5eSMiklos Szeredi kfree(ufs); 184e9be9d5eSMiklos Szeredi } 185e9be9d5eSMiklos Szeredi 186e593b2bfSAmir Goldstein static int ovl_sync_fs(struct super_block *sb, int wait) 187e593b2bfSAmir Goldstein { 188e593b2bfSAmir Goldstein struct ovl_fs *ufs = sb->s_fs_info; 189e593b2bfSAmir Goldstein struct super_block *upper_sb; 190e593b2bfSAmir Goldstein int ret; 191e593b2bfSAmir Goldstein 192e593b2bfSAmir Goldstein if (!ufs->upper_mnt) 193e593b2bfSAmir Goldstein return 0; 194e593b2bfSAmir Goldstein upper_sb = ufs->upper_mnt->mnt_sb; 195e593b2bfSAmir Goldstein if (!upper_sb->s_op->sync_fs) 196e593b2bfSAmir Goldstein return 0; 197e593b2bfSAmir Goldstein 198e593b2bfSAmir Goldstein /* real inodes have already been synced by sync_filesystem(ovl_sb) */ 199e593b2bfSAmir Goldstein down_read(&upper_sb->s_umount); 200e593b2bfSAmir Goldstein ret = upper_sb->s_op->sync_fs(upper_sb, wait); 201e593b2bfSAmir Goldstein up_read(&upper_sb->s_umount); 202e593b2bfSAmir Goldstein return ret; 203e593b2bfSAmir Goldstein } 204e593b2bfSAmir Goldstein 205cc259639SAndy Whitcroft /** 206cc259639SAndy Whitcroft * ovl_statfs 207cc259639SAndy Whitcroft * @sb: The overlayfs super block 208cc259639SAndy Whitcroft * @buf: The struct kstatfs to fill in with stats 209cc259639SAndy Whitcroft * 210cc259639SAndy Whitcroft * Get the filesystem statistics. As writes always target the upper layer 2114ebc5818SMiklos Szeredi * filesystem pass the statfs to the upper filesystem (if it exists) 212cc259639SAndy Whitcroft */ 213cc259639SAndy Whitcroft static int ovl_statfs(struct dentry *dentry, struct kstatfs *buf) 214cc259639SAndy Whitcroft { 215cc259639SAndy Whitcroft struct ovl_fs *ofs = dentry->d_sb->s_fs_info; 216cc259639SAndy Whitcroft struct dentry *root_dentry = dentry->d_sb->s_root; 217cc259639SAndy Whitcroft struct path path; 218cc259639SAndy Whitcroft int err; 219cc259639SAndy Whitcroft 2204ebc5818SMiklos Szeredi ovl_path_real(root_dentry, &path); 221cc259639SAndy Whitcroft 222cc259639SAndy Whitcroft err = vfs_statfs(&path, buf); 223cc259639SAndy Whitcroft if (!err) { 2246b2d5fe4SMiklos Szeredi buf->f_namelen = ofs->namelen; 225cc259639SAndy Whitcroft buf->f_type = OVERLAYFS_SUPER_MAGIC; 226cc259639SAndy Whitcroft } 227cc259639SAndy Whitcroft 228cc259639SAndy Whitcroft return err; 229cc259639SAndy Whitcroft } 230cc259639SAndy Whitcroft 231f45827e8SErez Zadok /** 232f45827e8SErez Zadok * ovl_show_options 233f45827e8SErez Zadok * 234f45827e8SErez Zadok * Prints the mount options for a given superblock. 235f45827e8SErez Zadok * Returns zero; does not fail. 236f45827e8SErez Zadok */ 237f45827e8SErez Zadok static int ovl_show_options(struct seq_file *m, struct dentry *dentry) 238f45827e8SErez Zadok { 239f45827e8SErez Zadok struct super_block *sb = dentry->d_sb; 240f45827e8SErez Zadok struct ovl_fs *ufs = sb->s_fs_info; 241f45827e8SErez Zadok 242a068acf2SKees Cook seq_show_option(m, "lowerdir", ufs->config.lowerdir); 24353a08cb9SMiklos Szeredi if (ufs->config.upperdir) { 244a068acf2SKees Cook seq_show_option(m, "upperdir", ufs->config.upperdir); 245a068acf2SKees Cook seq_show_option(m, "workdir", ufs->config.workdir); 24653a08cb9SMiklos Szeredi } 2478d3095f4SMiklos Szeredi if (ufs->config.default_permissions) 2488d3095f4SMiklos Szeredi seq_puts(m, ",default_permissions"); 249c5bef3a7SAmir Goldstein if (ufs->config.redirect_dir != ovl_redirect_dir_def) 250c5bef3a7SAmir Goldstein seq_printf(m, ",redirect_dir=%s", 251c5bef3a7SAmir Goldstein ufs->config.redirect_dir ? "on" : "off"); 252f45827e8SErez Zadok return 0; 253f45827e8SErez Zadok } 254f45827e8SErez Zadok 2553cdf6fe9SSeunghun Lee static int ovl_remount(struct super_block *sb, int *flags, char *data) 2563cdf6fe9SSeunghun Lee { 2573cdf6fe9SSeunghun Lee struct ovl_fs *ufs = sb->s_fs_info; 2583cdf6fe9SSeunghun Lee 259cc6f67bcSMiklos Szeredi if (!(*flags & MS_RDONLY) && (!ufs->upper_mnt || !ufs->workdir)) 2603cdf6fe9SSeunghun Lee return -EROFS; 2613cdf6fe9SSeunghun Lee 2623cdf6fe9SSeunghun Lee return 0; 2633cdf6fe9SSeunghun Lee } 2643cdf6fe9SSeunghun Lee 265e9be9d5eSMiklos Szeredi static const struct super_operations ovl_super_operations = { 266e9be9d5eSMiklos Szeredi .put_super = ovl_put_super, 267e593b2bfSAmir Goldstein .sync_fs = ovl_sync_fs, 268cc259639SAndy Whitcroft .statfs = ovl_statfs, 269f45827e8SErez Zadok .show_options = ovl_show_options, 2703cdf6fe9SSeunghun Lee .remount_fs = ovl_remount, 271eead4f2dSMiklos Szeredi .drop_inode = generic_delete_inode, 272e9be9d5eSMiklos Szeredi }; 273e9be9d5eSMiklos Szeredi 274e9be9d5eSMiklos Szeredi enum { 275e9be9d5eSMiklos Szeredi OPT_LOWERDIR, 276e9be9d5eSMiklos Szeredi OPT_UPPERDIR, 277e9be9d5eSMiklos Szeredi OPT_WORKDIR, 2788d3095f4SMiklos Szeredi OPT_DEFAULT_PERMISSIONS, 279a6c60655SMiklos Szeredi OPT_REDIRECT_DIR_ON, 280a6c60655SMiklos Szeredi OPT_REDIRECT_DIR_OFF, 281e9be9d5eSMiklos Szeredi OPT_ERR, 282e9be9d5eSMiklos Szeredi }; 283e9be9d5eSMiklos Szeredi 284e9be9d5eSMiklos Szeredi static const match_table_t ovl_tokens = { 285e9be9d5eSMiklos Szeredi {OPT_LOWERDIR, "lowerdir=%s"}, 286e9be9d5eSMiklos Szeredi {OPT_UPPERDIR, "upperdir=%s"}, 287e9be9d5eSMiklos Szeredi {OPT_WORKDIR, "workdir=%s"}, 2888d3095f4SMiklos Szeredi {OPT_DEFAULT_PERMISSIONS, "default_permissions"}, 289a6c60655SMiklos Szeredi {OPT_REDIRECT_DIR_ON, "redirect_dir=on"}, 290a6c60655SMiklos Szeredi {OPT_REDIRECT_DIR_OFF, "redirect_dir=off"}, 291e9be9d5eSMiklos Szeredi {OPT_ERR, NULL} 292e9be9d5eSMiklos Szeredi }; 293e9be9d5eSMiklos Szeredi 29491c77947SMiklos Szeredi static char *ovl_next_opt(char **s) 29591c77947SMiklos Szeredi { 29691c77947SMiklos Szeredi char *sbegin = *s; 29791c77947SMiklos Szeredi char *p; 29891c77947SMiklos Szeredi 29991c77947SMiklos Szeredi if (sbegin == NULL) 30091c77947SMiklos Szeredi return NULL; 30191c77947SMiklos Szeredi 30291c77947SMiklos Szeredi for (p = sbegin; *p; p++) { 30391c77947SMiklos Szeredi if (*p == '\\') { 30491c77947SMiklos Szeredi p++; 30591c77947SMiklos Szeredi if (!*p) 30691c77947SMiklos Szeredi break; 30791c77947SMiklos Szeredi } else if (*p == ',') { 30891c77947SMiklos Szeredi *p = '\0'; 30991c77947SMiklos Szeredi *s = p + 1; 31091c77947SMiklos Szeredi return sbegin; 31191c77947SMiklos Szeredi } 31291c77947SMiklos Szeredi } 31391c77947SMiklos Szeredi *s = NULL; 31491c77947SMiklos Szeredi return sbegin; 31591c77947SMiklos Szeredi } 31691c77947SMiklos Szeredi 317e9be9d5eSMiklos Szeredi static int ovl_parse_opt(char *opt, struct ovl_config *config) 318e9be9d5eSMiklos Szeredi { 319e9be9d5eSMiklos Szeredi char *p; 320e9be9d5eSMiklos Szeredi 32191c77947SMiklos Szeredi while ((p = ovl_next_opt(&opt)) != NULL) { 322e9be9d5eSMiklos Szeredi int token; 323e9be9d5eSMiklos Szeredi substring_t args[MAX_OPT_ARGS]; 324e9be9d5eSMiklos Szeredi 325e9be9d5eSMiklos Szeredi if (!*p) 326e9be9d5eSMiklos Szeredi continue; 327e9be9d5eSMiklos Szeredi 328e9be9d5eSMiklos Szeredi token = match_token(p, ovl_tokens, args); 329e9be9d5eSMiklos Szeredi switch (token) { 330e9be9d5eSMiklos Szeredi case OPT_UPPERDIR: 331e9be9d5eSMiklos Szeredi kfree(config->upperdir); 332e9be9d5eSMiklos Szeredi config->upperdir = match_strdup(&args[0]); 333e9be9d5eSMiklos Szeredi if (!config->upperdir) 334e9be9d5eSMiklos Szeredi return -ENOMEM; 335e9be9d5eSMiklos Szeredi break; 336e9be9d5eSMiklos Szeredi 337e9be9d5eSMiklos Szeredi case OPT_LOWERDIR: 338e9be9d5eSMiklos Szeredi kfree(config->lowerdir); 339e9be9d5eSMiklos Szeredi config->lowerdir = match_strdup(&args[0]); 340e9be9d5eSMiklos Szeredi if (!config->lowerdir) 341e9be9d5eSMiklos Szeredi return -ENOMEM; 342e9be9d5eSMiklos Szeredi break; 343e9be9d5eSMiklos Szeredi 344e9be9d5eSMiklos Szeredi case OPT_WORKDIR: 345e9be9d5eSMiklos Szeredi kfree(config->workdir); 346e9be9d5eSMiklos Szeredi config->workdir = match_strdup(&args[0]); 347e9be9d5eSMiklos Szeredi if (!config->workdir) 348e9be9d5eSMiklos Szeredi return -ENOMEM; 349e9be9d5eSMiklos Szeredi break; 350e9be9d5eSMiklos Szeredi 3518d3095f4SMiklos Szeredi case OPT_DEFAULT_PERMISSIONS: 3528d3095f4SMiklos Szeredi config->default_permissions = true; 3538d3095f4SMiklos Szeredi break; 3548d3095f4SMiklos Szeredi 355a6c60655SMiklos Szeredi case OPT_REDIRECT_DIR_ON: 356a6c60655SMiklos Szeredi config->redirect_dir = true; 357a6c60655SMiklos Szeredi break; 358a6c60655SMiklos Szeredi 359a6c60655SMiklos Szeredi case OPT_REDIRECT_DIR_OFF: 360a6c60655SMiklos Szeredi config->redirect_dir = false; 361a6c60655SMiklos Szeredi break; 362a6c60655SMiklos Szeredi 363e9be9d5eSMiklos Szeredi default: 364bead55efShujianyang pr_err("overlayfs: unrecognized mount option \"%s\" or missing value\n", p); 365e9be9d5eSMiklos Szeredi return -EINVAL; 366e9be9d5eSMiklos Szeredi } 367e9be9d5eSMiklos Szeredi } 36871cbad7eShujianyang 36971cbad7eShujianyang /* Workdir is useless in non-upper mount */ 37071cbad7eShujianyang if (!config->upperdir && config->workdir) { 37171cbad7eShujianyang pr_info("overlayfs: option \"workdir=%s\" is useless in a non-upper mount, ignore\n", 37271cbad7eShujianyang config->workdir); 37371cbad7eShujianyang kfree(config->workdir); 37471cbad7eShujianyang config->workdir = NULL; 37571cbad7eShujianyang } 37671cbad7eShujianyang 377e9be9d5eSMiklos Szeredi return 0; 378e9be9d5eSMiklos Szeredi } 379e9be9d5eSMiklos Szeredi 380e9be9d5eSMiklos Szeredi #define OVL_WORKDIR_NAME "work" 381e9be9d5eSMiklos Szeredi 382e9be9d5eSMiklos Szeredi static struct dentry *ovl_workdir_create(struct vfsmount *mnt, 383e9be9d5eSMiklos Szeredi struct dentry *dentry) 384e9be9d5eSMiklos Szeredi { 385e9be9d5eSMiklos Szeredi struct inode *dir = dentry->d_inode; 386e9be9d5eSMiklos Szeredi struct dentry *work; 387e9be9d5eSMiklos Szeredi int err; 388e9be9d5eSMiklos Szeredi bool retried = false; 389e9be9d5eSMiklos Szeredi 390e9be9d5eSMiklos Szeredi err = mnt_want_write(mnt); 391e9be9d5eSMiklos Szeredi if (err) 392e9be9d5eSMiklos Szeredi return ERR_PTR(err); 393e9be9d5eSMiklos Szeredi 3945955102cSAl Viro inode_lock_nested(dir, I_MUTEX_PARENT); 395e9be9d5eSMiklos Szeredi retry: 396e9be9d5eSMiklos Szeredi work = lookup_one_len(OVL_WORKDIR_NAME, dentry, 397e9be9d5eSMiklos Szeredi strlen(OVL_WORKDIR_NAME)); 398e9be9d5eSMiklos Szeredi 399e9be9d5eSMiklos Szeredi if (!IS_ERR(work)) { 400c11b9fddSMiklos Szeredi struct iattr attr = { 401c11b9fddSMiklos Szeredi .ia_valid = ATTR_MODE, 40232a3d848SAl Viro .ia_mode = S_IFDIR | 0, 403c11b9fddSMiklos Szeredi }; 404e9be9d5eSMiklos Szeredi 405e9be9d5eSMiklos Szeredi if (work->d_inode) { 406e9be9d5eSMiklos Szeredi err = -EEXIST; 407e9be9d5eSMiklos Szeredi if (retried) 408e9be9d5eSMiklos Szeredi goto out_dput; 409e9be9d5eSMiklos Szeredi 410e9be9d5eSMiklos Szeredi retried = true; 411eea2fb48SMiklos Szeredi ovl_workdir_cleanup(dir, mnt, work, 0); 412e9be9d5eSMiklos Szeredi dput(work); 413e9be9d5eSMiklos Szeredi goto retry; 414e9be9d5eSMiklos Szeredi } 415e9be9d5eSMiklos Szeredi 41632a3d848SAl Viro err = ovl_create_real(dir, work, 41732a3d848SAl Viro &(struct cattr){.mode = S_IFDIR | 0}, 41832a3d848SAl Viro NULL, true); 419e9be9d5eSMiklos Szeredi if (err) 420e9be9d5eSMiklos Szeredi goto out_dput; 421c11b9fddSMiklos Szeredi 422cb348edbSMiklos Szeredi /* 423cb348edbSMiklos Szeredi * Try to remove POSIX ACL xattrs from workdir. We are good if: 424cb348edbSMiklos Szeredi * 425cb348edbSMiklos Szeredi * a) success (there was a POSIX ACL xattr and was removed) 426cb348edbSMiklos Szeredi * b) -ENODATA (there was no POSIX ACL xattr) 427cb348edbSMiklos Szeredi * c) -EOPNOTSUPP (POSIX ACL xattrs are not supported) 428cb348edbSMiklos Szeredi * 429cb348edbSMiklos Szeredi * There are various other error values that could effectively 430cb348edbSMiklos Szeredi * mean that the xattr doesn't exist (e.g. -ERANGE is returned 431cb348edbSMiklos Szeredi * if the xattr name is too long), but the set of filesystems 432cb348edbSMiklos Szeredi * allowed as upper are limited to "normal" ones, where checking 433cb348edbSMiklos Szeredi * for the above two errors is sufficient. 434cb348edbSMiklos Szeredi */ 435c11b9fddSMiklos Szeredi err = vfs_removexattr(work, XATTR_NAME_POSIX_ACL_DEFAULT); 436e1ff3dd1SMiklos Szeredi if (err && err != -ENODATA && err != -EOPNOTSUPP) 437c11b9fddSMiklos Szeredi goto out_dput; 438c11b9fddSMiklos Szeredi 439c11b9fddSMiklos Szeredi err = vfs_removexattr(work, XATTR_NAME_POSIX_ACL_ACCESS); 440e1ff3dd1SMiklos Szeredi if (err && err != -ENODATA && err != -EOPNOTSUPP) 441c11b9fddSMiklos Szeredi goto out_dput; 442c11b9fddSMiklos Szeredi 443c11b9fddSMiklos Szeredi /* Clear any inherited mode bits */ 444c11b9fddSMiklos Szeredi inode_lock(work->d_inode); 445c11b9fddSMiklos Szeredi err = notify_change(work, &attr, NULL); 446c11b9fddSMiklos Szeredi inode_unlock(work->d_inode); 447c11b9fddSMiklos Szeredi if (err) 448c11b9fddSMiklos Szeredi goto out_dput; 449e9be9d5eSMiklos Szeredi } 450e9be9d5eSMiklos Szeredi out_unlock: 4515955102cSAl Viro inode_unlock(dir); 452e9be9d5eSMiklos Szeredi mnt_drop_write(mnt); 453e9be9d5eSMiklos Szeredi 454e9be9d5eSMiklos Szeredi return work; 455e9be9d5eSMiklos Szeredi 456e9be9d5eSMiklos Szeredi out_dput: 457e9be9d5eSMiklos Szeredi dput(work); 458e9be9d5eSMiklos Szeredi work = ERR_PTR(err); 459e9be9d5eSMiklos Szeredi goto out_unlock; 460e9be9d5eSMiklos Szeredi } 461e9be9d5eSMiklos Szeredi 46291c77947SMiklos Szeredi static void ovl_unescape(char *s) 46391c77947SMiklos Szeredi { 46491c77947SMiklos Szeredi char *d = s; 46591c77947SMiklos Szeredi 46691c77947SMiklos Szeredi for (;; s++, d++) { 46791c77947SMiklos Szeredi if (*s == '\\') 46891c77947SMiklos Szeredi s++; 46991c77947SMiklos Szeredi *d = *s; 47091c77947SMiklos Szeredi if (!*s) 47191c77947SMiklos Szeredi break; 47291c77947SMiklos Szeredi } 47391c77947SMiklos Szeredi } 47491c77947SMiklos Szeredi 475ab508822SMiklos Szeredi static int ovl_mount_dir_noesc(const char *name, struct path *path) 476ab508822SMiklos Szeredi { 477a78d9f0dSMiklos Szeredi int err = -EINVAL; 478ab508822SMiklos Szeredi 479a78d9f0dSMiklos Szeredi if (!*name) { 480a78d9f0dSMiklos Szeredi pr_err("overlayfs: empty lowerdir\n"); 481a78d9f0dSMiklos Szeredi goto out; 482a78d9f0dSMiklos Szeredi } 483ab508822SMiklos Szeredi err = kern_path(name, LOOKUP_FOLLOW, path); 484ab508822SMiklos Szeredi if (err) { 485ab508822SMiklos Szeredi pr_err("overlayfs: failed to resolve '%s': %i\n", name, err); 486ab508822SMiklos Szeredi goto out; 487ab508822SMiklos Szeredi } 488ab508822SMiklos Szeredi err = -EINVAL; 4897c03b5d4SMiklos Szeredi if (ovl_dentry_weird(path->dentry)) { 490ab508822SMiklos Szeredi pr_err("overlayfs: filesystem on '%s' not supported\n", name); 491ab508822SMiklos Szeredi goto out_put; 492ab508822SMiklos Szeredi } 4932b8c30e9SMiklos Szeredi if (!d_is_dir(path->dentry)) { 494ab508822SMiklos Szeredi pr_err("overlayfs: '%s' not a directory\n", name); 495ab508822SMiklos Szeredi goto out_put; 496ab508822SMiklos Szeredi } 497ab508822SMiklos Szeredi return 0; 498ab508822SMiklos Szeredi 499ab508822SMiklos Szeredi out_put: 500ab508822SMiklos Szeredi path_put(path); 501ab508822SMiklos Szeredi out: 502ab508822SMiklos Szeredi return err; 503ab508822SMiklos Szeredi } 504ab508822SMiklos Szeredi 505ab508822SMiklos Szeredi static int ovl_mount_dir(const char *name, struct path *path) 506ab508822SMiklos Szeredi { 507ab508822SMiklos Szeredi int err = -ENOMEM; 508ab508822SMiklos Szeredi char *tmp = kstrdup(name, GFP_KERNEL); 509ab508822SMiklos Szeredi 510ab508822SMiklos Szeredi if (tmp) { 511ab508822SMiklos Szeredi ovl_unescape(tmp); 512ab508822SMiklos Szeredi err = ovl_mount_dir_noesc(tmp, path); 5137c03b5d4SMiklos Szeredi 5147c03b5d4SMiklos Szeredi if (!err) 5157c03b5d4SMiklos Szeredi if (ovl_dentry_remote(path->dentry)) { 5167c03b5d4SMiklos Szeredi pr_err("overlayfs: filesystem on '%s' not supported as upperdir\n", 5177c03b5d4SMiklos Szeredi tmp); 5187c03b5d4SMiklos Szeredi path_put(path); 5197c03b5d4SMiklos Szeredi err = -EINVAL; 5207c03b5d4SMiklos Szeredi } 521ab508822SMiklos Szeredi kfree(tmp); 522ab508822SMiklos Szeredi } 523ab508822SMiklos Szeredi return err; 524ab508822SMiklos Szeredi } 525ab508822SMiklos Szeredi 5266b2d5fe4SMiklos Szeredi static int ovl_check_namelen(struct path *path, struct ovl_fs *ofs, 5276b2d5fe4SMiklos Szeredi const char *name) 5286b2d5fe4SMiklos Szeredi { 5296b2d5fe4SMiklos Szeredi struct kstatfs statfs; 5306b2d5fe4SMiklos Szeredi int err = vfs_statfs(path, &statfs); 5316b2d5fe4SMiklos Szeredi 5326b2d5fe4SMiklos Szeredi if (err) 5336b2d5fe4SMiklos Szeredi pr_err("overlayfs: statfs failed on '%s'\n", name); 5346b2d5fe4SMiklos Szeredi else 5356b2d5fe4SMiklos Szeredi ofs->namelen = max(ofs->namelen, statfs.f_namelen); 5366b2d5fe4SMiklos Szeredi 5376b2d5fe4SMiklos Szeredi return err; 5386b2d5fe4SMiklos Szeredi } 5396b2d5fe4SMiklos Szeredi 5406b2d5fe4SMiklos Szeredi static int ovl_lower_dir(const char *name, struct path *path, 5416b2d5fe4SMiklos Szeredi struct ovl_fs *ofs, int *stack_depth, bool *remote) 542ab508822SMiklos Szeredi { 543ab508822SMiklos Szeredi int err; 544ab508822SMiklos Szeredi 545a78d9f0dSMiklos Szeredi err = ovl_mount_dir_noesc(name, path); 546ab508822SMiklos Szeredi if (err) 547ab508822SMiklos Szeredi goto out; 548ab508822SMiklos Szeredi 5496b2d5fe4SMiklos Szeredi err = ovl_check_namelen(path, ofs, name); 5506b2d5fe4SMiklos Szeredi if (err) 551ab508822SMiklos Szeredi goto out_put; 5526b2d5fe4SMiklos Szeredi 553ab508822SMiklos Szeredi *stack_depth = max(*stack_depth, path->mnt->mnt_sb->s_stack_depth); 554ab508822SMiklos Szeredi 5557c03b5d4SMiklos Szeredi if (ovl_dentry_remote(path->dentry)) 5567c03b5d4SMiklos Szeredi *remote = true; 5577c03b5d4SMiklos Szeredi 558ab508822SMiklos Szeredi return 0; 559ab508822SMiklos Szeredi 560ab508822SMiklos Szeredi out_put: 561ab508822SMiklos Szeredi path_put(path); 562ab508822SMiklos Szeredi out: 563ab508822SMiklos Szeredi return err; 564ab508822SMiklos Szeredi } 565ab508822SMiklos Szeredi 566e9be9d5eSMiklos Szeredi /* Workdir should not be subdir of upperdir and vice versa */ 567e9be9d5eSMiklos Szeredi static bool ovl_workdir_ok(struct dentry *workdir, struct dentry *upperdir) 568e9be9d5eSMiklos Szeredi { 569e9be9d5eSMiklos Szeredi bool ok = false; 570e9be9d5eSMiklos Szeredi 571e9be9d5eSMiklos Szeredi if (workdir != upperdir) { 572e9be9d5eSMiklos Szeredi ok = (lock_rename(workdir, upperdir) == NULL); 573e9be9d5eSMiklos Szeredi unlock_rename(workdir, upperdir); 574e9be9d5eSMiklos Szeredi } 575e9be9d5eSMiklos Szeredi return ok; 576e9be9d5eSMiklos Szeredi } 577e9be9d5eSMiklos Szeredi 578a78d9f0dSMiklos Szeredi static unsigned int ovl_split_lowerdirs(char *str) 579a78d9f0dSMiklos Szeredi { 580a78d9f0dSMiklos Szeredi unsigned int ctr = 1; 581a78d9f0dSMiklos Szeredi char *s, *d; 582a78d9f0dSMiklos Szeredi 583a78d9f0dSMiklos Szeredi for (s = d = str;; s++, d++) { 584a78d9f0dSMiklos Szeredi if (*s == '\\') { 585a78d9f0dSMiklos Szeredi s++; 586a78d9f0dSMiklos Szeredi } else if (*s == ':') { 587a78d9f0dSMiklos Szeredi *d = '\0'; 588a78d9f0dSMiklos Szeredi ctr++; 589a78d9f0dSMiklos Szeredi continue; 590a78d9f0dSMiklos Szeredi } 591a78d9f0dSMiklos Szeredi *d = *s; 592a78d9f0dSMiklos Szeredi if (!*s) 593a78d9f0dSMiklos Szeredi break; 594a78d9f0dSMiklos Szeredi } 595a78d9f0dSMiklos Szeredi return ctr; 596a78d9f0dSMiklos Szeredi } 597a78d9f0dSMiklos Szeredi 5980c97be22SAndreas Gruenbacher static int __maybe_unused 5990eb45fc3SAndreas Gruenbacher ovl_posix_acl_xattr_get(const struct xattr_handler *handler, 6000eb45fc3SAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 6010eb45fc3SAndreas Gruenbacher const char *name, void *buffer, size_t size) 6020eb45fc3SAndreas Gruenbacher { 6030eb45fc3SAndreas Gruenbacher return ovl_xattr_get(dentry, handler->name, buffer, size); 6040eb45fc3SAndreas Gruenbacher } 6050eb45fc3SAndreas Gruenbacher 6060eb45fc3SAndreas Gruenbacher static int __maybe_unused 6070c97be22SAndreas Gruenbacher ovl_posix_acl_xattr_set(const struct xattr_handler *handler, 608d837a49bSMiklos Szeredi struct dentry *dentry, struct inode *inode, 609d837a49bSMiklos Szeredi const char *name, const void *value, 610d837a49bSMiklos Szeredi size_t size, int flags) 611d837a49bSMiklos Szeredi { 612d837a49bSMiklos Szeredi struct dentry *workdir = ovl_workdir(dentry); 613d837a49bSMiklos Szeredi struct inode *realinode = ovl_inode_real(inode, NULL); 614d837a49bSMiklos Szeredi struct posix_acl *acl = NULL; 615d837a49bSMiklos Szeredi int err; 616d837a49bSMiklos Szeredi 617d837a49bSMiklos Szeredi /* Check that everything is OK before copy-up */ 618d837a49bSMiklos Szeredi if (value) { 619d837a49bSMiklos Szeredi acl = posix_acl_from_xattr(&init_user_ns, value, size); 620d837a49bSMiklos Szeredi if (IS_ERR(acl)) 621d837a49bSMiklos Szeredi return PTR_ERR(acl); 622d837a49bSMiklos Szeredi } 623d837a49bSMiklos Szeredi err = -EOPNOTSUPP; 624d837a49bSMiklos Szeredi if (!IS_POSIXACL(d_inode(workdir))) 625d837a49bSMiklos Szeredi goto out_acl_release; 626d837a49bSMiklos Szeredi if (!realinode->i_op->set_acl) 627d837a49bSMiklos Szeredi goto out_acl_release; 628d837a49bSMiklos Szeredi if (handler->flags == ACL_TYPE_DEFAULT && !S_ISDIR(inode->i_mode)) { 629d837a49bSMiklos Szeredi err = acl ? -EACCES : 0; 630d837a49bSMiklos Szeredi goto out_acl_release; 631d837a49bSMiklos Szeredi } 632d837a49bSMiklos Szeredi err = -EPERM; 633d837a49bSMiklos Szeredi if (!inode_owner_or_capable(inode)) 634d837a49bSMiklos Szeredi goto out_acl_release; 635d837a49bSMiklos Szeredi 636d837a49bSMiklos Szeredi posix_acl_release(acl); 637d837a49bSMiklos Szeredi 638fd3220d3SMiklos Szeredi /* 639fd3220d3SMiklos Szeredi * Check if sgid bit needs to be cleared (actual setacl operation will 640fd3220d3SMiklos Szeredi * be done with mounter's capabilities and so that won't do it for us). 641fd3220d3SMiklos Szeredi */ 642fd3220d3SMiklos Szeredi if (unlikely(inode->i_mode & S_ISGID) && 643fd3220d3SMiklos Szeredi handler->flags == ACL_TYPE_ACCESS && 644fd3220d3SMiklos Szeredi !in_group_p(inode->i_gid) && 645fd3220d3SMiklos Szeredi !capable_wrt_inode_uidgid(inode, CAP_FSETID)) { 646fd3220d3SMiklos Szeredi struct iattr iattr = { .ia_valid = ATTR_KILL_SGID }; 647fd3220d3SMiklos Szeredi 648fd3220d3SMiklos Szeredi err = ovl_setattr(dentry, &iattr); 649fd3220d3SMiklos Szeredi if (err) 650fd3220d3SMiklos Szeredi return err; 651fd3220d3SMiklos Szeredi } 652fd3220d3SMiklos Szeredi 653ce31513aSMiklos Szeredi err = ovl_xattr_set(dentry, handler->name, value, size, flags); 654ce31513aSMiklos Szeredi if (!err) 655ce31513aSMiklos Szeredi ovl_copyattr(ovl_inode_real(inode, NULL), inode); 656ce31513aSMiklos Szeredi 657ce31513aSMiklos Szeredi return err; 658d837a49bSMiklos Szeredi 659d837a49bSMiklos Szeredi out_acl_release: 660d837a49bSMiklos Szeredi posix_acl_release(acl); 661d837a49bSMiklos Szeredi return err; 662d837a49bSMiklos Szeredi } 663d837a49bSMiklos Szeredi 6640eb45fc3SAndreas Gruenbacher static int ovl_own_xattr_get(const struct xattr_handler *handler, 6650eb45fc3SAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 6660eb45fc3SAndreas Gruenbacher const char *name, void *buffer, size_t size) 6670eb45fc3SAndreas Gruenbacher { 66848fab5d7SAmir Goldstein return -EOPNOTSUPP; 6690eb45fc3SAndreas Gruenbacher } 6700eb45fc3SAndreas Gruenbacher 671d837a49bSMiklos Szeredi static int ovl_own_xattr_set(const struct xattr_handler *handler, 672d837a49bSMiklos Szeredi struct dentry *dentry, struct inode *inode, 673d837a49bSMiklos Szeredi const char *name, const void *value, 674d837a49bSMiklos Szeredi size_t size, int flags) 675d837a49bSMiklos Szeredi { 67648fab5d7SAmir Goldstein return -EOPNOTSUPP; 677d837a49bSMiklos Szeredi } 678d837a49bSMiklos Szeredi 6790eb45fc3SAndreas Gruenbacher static int ovl_other_xattr_get(const struct xattr_handler *handler, 6800eb45fc3SAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 6810eb45fc3SAndreas Gruenbacher const char *name, void *buffer, size_t size) 6820eb45fc3SAndreas Gruenbacher { 6830eb45fc3SAndreas Gruenbacher return ovl_xattr_get(dentry, name, buffer, size); 6840eb45fc3SAndreas Gruenbacher } 6850eb45fc3SAndreas Gruenbacher 6860e585cccSAndreas Gruenbacher static int ovl_other_xattr_set(const struct xattr_handler *handler, 6870e585cccSAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 6880e585cccSAndreas Gruenbacher const char *name, const void *value, 6890e585cccSAndreas Gruenbacher size_t size, int flags) 6900e585cccSAndreas Gruenbacher { 6910e585cccSAndreas Gruenbacher return ovl_xattr_set(dentry, name, value, size, flags); 6920e585cccSAndreas Gruenbacher } 6930e585cccSAndreas Gruenbacher 6940c97be22SAndreas Gruenbacher static const struct xattr_handler __maybe_unused 6950c97be22SAndreas Gruenbacher ovl_posix_acl_access_xattr_handler = { 696d837a49bSMiklos Szeredi .name = XATTR_NAME_POSIX_ACL_ACCESS, 697d837a49bSMiklos Szeredi .flags = ACL_TYPE_ACCESS, 6980eb45fc3SAndreas Gruenbacher .get = ovl_posix_acl_xattr_get, 699d837a49bSMiklos Szeredi .set = ovl_posix_acl_xattr_set, 700d837a49bSMiklos Szeredi }; 701d837a49bSMiklos Szeredi 7020c97be22SAndreas Gruenbacher static const struct xattr_handler __maybe_unused 7030c97be22SAndreas Gruenbacher ovl_posix_acl_default_xattr_handler = { 704d837a49bSMiklos Szeredi .name = XATTR_NAME_POSIX_ACL_DEFAULT, 705d837a49bSMiklos Szeredi .flags = ACL_TYPE_DEFAULT, 7060eb45fc3SAndreas Gruenbacher .get = ovl_posix_acl_xattr_get, 707d837a49bSMiklos Szeredi .set = ovl_posix_acl_xattr_set, 708d837a49bSMiklos Szeredi }; 709d837a49bSMiklos Szeredi 710d837a49bSMiklos Szeredi static const struct xattr_handler ovl_own_xattr_handler = { 711d837a49bSMiklos Szeredi .prefix = OVL_XATTR_PREFIX, 7120eb45fc3SAndreas Gruenbacher .get = ovl_own_xattr_get, 713d837a49bSMiklos Szeredi .set = ovl_own_xattr_set, 714d837a49bSMiklos Szeredi }; 715d837a49bSMiklos Szeredi 716d837a49bSMiklos Szeredi static const struct xattr_handler ovl_other_xattr_handler = { 717d837a49bSMiklos Szeredi .prefix = "", /* catch all */ 7180eb45fc3SAndreas Gruenbacher .get = ovl_other_xattr_get, 719d837a49bSMiklos Szeredi .set = ovl_other_xattr_set, 720d837a49bSMiklos Szeredi }; 721d837a49bSMiklos Szeredi 722d837a49bSMiklos Szeredi static const struct xattr_handler *ovl_xattr_handlers[] = { 7230c97be22SAndreas Gruenbacher #ifdef CONFIG_FS_POSIX_ACL 724d837a49bSMiklos Szeredi &ovl_posix_acl_access_xattr_handler, 725d837a49bSMiklos Szeredi &ovl_posix_acl_default_xattr_handler, 7260c97be22SAndreas Gruenbacher #endif 727d837a49bSMiklos Szeredi &ovl_own_xattr_handler, 728d837a49bSMiklos Szeredi &ovl_other_xattr_handler, 729d837a49bSMiklos Szeredi NULL 730d837a49bSMiklos Szeredi }; 731d837a49bSMiklos Szeredi 732e9be9d5eSMiklos Szeredi static int ovl_fill_super(struct super_block *sb, void *data, int silent) 733e9be9d5eSMiklos Szeredi { 73433006cdfSKees Cook struct path upperpath = { }; 73533006cdfSKees Cook struct path workpath = { }; 736e9be9d5eSMiklos Szeredi struct dentry *root_dentry; 73739b681f8SMiklos Szeredi struct inode *realinode; 738e9be9d5eSMiklos Szeredi struct ovl_entry *oe; 739e9be9d5eSMiklos Szeredi struct ovl_fs *ufs; 740a78d9f0dSMiklos Szeredi struct path *stack = NULL; 741a78d9f0dSMiklos Szeredi char *lowertmp; 742a78d9f0dSMiklos Szeredi char *lower; 743a78d9f0dSMiklos Szeredi unsigned int numlower; 744a78d9f0dSMiklos Szeredi unsigned int stacklen = 0; 745dd662667SMiklos Szeredi unsigned int i; 7467c03b5d4SMiklos Szeredi bool remote = false; 74751f8f3c4SKonstantin Khlebnikov struct cred *cred; 748e9be9d5eSMiklos Szeredi int err; 749e9be9d5eSMiklos Szeredi 750f45827e8SErez Zadok err = -ENOMEM; 751f45827e8SErez Zadok ufs = kzalloc(sizeof(struct ovl_fs), GFP_KERNEL); 752f45827e8SErez Zadok if (!ufs) 753e9be9d5eSMiklos Szeredi goto out; 754e9be9d5eSMiklos Szeredi 75539d3d60aSAmir Goldstein init_waitqueue_head(&ufs->copyup_wq); 756688ea0e5SMiklos Szeredi ufs->config.redirect_dir = ovl_redirect_dir_def; 757f45827e8SErez Zadok err = ovl_parse_opt((char *) data, &ufs->config); 758f45827e8SErez Zadok if (err) 759f45827e8SErez Zadok goto out_free_config; 760f45827e8SErez Zadok 761e9be9d5eSMiklos Szeredi err = -EINVAL; 76253a08cb9SMiklos Szeredi if (!ufs->config.lowerdir) { 76307f2af7bSKonstantin Khlebnikov if (!silent) 76453a08cb9SMiklos Szeredi pr_err("overlayfs: missing 'lowerdir'\n"); 76553a08cb9SMiklos Szeredi goto out_free_config; 76653a08cb9SMiklos Szeredi } 76753a08cb9SMiklos Szeredi 76853a08cb9SMiklos Szeredi sb->s_stack_depth = 0; 769cf9a6784SMiklos Szeredi sb->s_maxbytes = MAX_LFS_FILESIZE; 77053a08cb9SMiklos Szeredi if (ufs->config.upperdir) { 77153a08cb9SMiklos Szeredi if (!ufs->config.workdir) { 77253a08cb9SMiklos Szeredi pr_err("overlayfs: missing 'workdir'\n"); 773e9be9d5eSMiklos Szeredi goto out_free_config; 774e9be9d5eSMiklos Szeredi } 775e9be9d5eSMiklos Szeredi 776f45827e8SErez Zadok err = ovl_mount_dir(ufs->config.upperdir, &upperpath); 777e9be9d5eSMiklos Szeredi if (err) 7783b7a9a24SMiklos Szeredi goto out_free_config; 779e9be9d5eSMiklos Szeredi 78071cbad7eShujianyang /* Upper fs should not be r/o */ 78171cbad7eShujianyang if (upperpath.mnt->mnt_sb->s_flags & MS_RDONLY) { 78271cbad7eShujianyang pr_err("overlayfs: upper fs is r/o, try multi-lower layers mount\n"); 78371cbad7eShujianyang err = -EINVAL; 78471cbad7eShujianyang goto out_put_upperpath; 78571cbad7eShujianyang } 78671cbad7eShujianyang 7876b2d5fe4SMiklos Szeredi err = ovl_check_namelen(&upperpath, ufs, ufs->config.upperdir); 7886b2d5fe4SMiklos Szeredi if (err) 7896b2d5fe4SMiklos Szeredi goto out_put_upperpath; 7906b2d5fe4SMiklos Szeredi 791f45827e8SErez Zadok err = ovl_mount_dir(ufs->config.workdir, &workpath); 792e9be9d5eSMiklos Szeredi if (err) 7933b7a9a24SMiklos Szeredi goto out_put_upperpath; 7943b7a9a24SMiklos Szeredi 7952f83fd8cShujianyang err = -EINVAL; 796ab508822SMiklos Szeredi if (upperpath.mnt != workpath.mnt) { 797ab508822SMiklos Szeredi pr_err("overlayfs: workdir and upperdir must reside under the same mount\n"); 798ab508822SMiklos Szeredi goto out_put_workpath; 799ab508822SMiklos Szeredi } 800ab508822SMiklos Szeredi if (!ovl_workdir_ok(workpath.dentry, upperpath.dentry)) { 801ab508822SMiklos Szeredi pr_err("overlayfs: workdir and upperdir must be separate subtrees\n"); 802ab508822SMiklos Szeredi goto out_put_workpath; 803ab508822SMiklos Szeredi } 804ab508822SMiklos Szeredi sb->s_stack_depth = upperpath.mnt->mnt_sb->s_stack_depth; 80553a08cb9SMiklos Szeredi } 806a78d9f0dSMiklos Szeredi err = -ENOMEM; 807a78d9f0dSMiklos Szeredi lowertmp = kstrdup(ufs->config.lowerdir, GFP_KERNEL); 808a78d9f0dSMiklos Szeredi if (!lowertmp) 809a78d9f0dSMiklos Szeredi goto out_put_workpath; 810ab508822SMiklos Szeredi 811a78d9f0dSMiklos Szeredi err = -EINVAL; 812a78d9f0dSMiklos Szeredi stacklen = ovl_split_lowerdirs(lowertmp); 8136be4506eShujianyang if (stacklen > OVL_MAX_STACK) { 814fd36570aSColin Ian King pr_err("overlayfs: too many lower directories, limit is %d\n", 8156be4506eShujianyang OVL_MAX_STACK); 816a78d9f0dSMiklos Szeredi goto out_free_lowertmp; 8176be4506eShujianyang } else if (!ufs->config.upperdir && stacklen == 1) { 8186be4506eShujianyang pr_err("overlayfs: at least 2 lowerdir are needed while upperdir nonexistent\n"); 8196be4506eShujianyang goto out_free_lowertmp; 8206be4506eShujianyang } 821a78d9f0dSMiklos Szeredi 822313684c4SGeliang Tang err = -ENOMEM; 823a78d9f0dSMiklos Szeredi stack = kcalloc(stacklen, sizeof(struct path), GFP_KERNEL); 824a78d9f0dSMiklos Szeredi if (!stack) 825a78d9f0dSMiklos Szeredi goto out_free_lowertmp; 826a78d9f0dSMiklos Szeredi 827313684c4SGeliang Tang err = -EINVAL; 828a78d9f0dSMiklos Szeredi lower = lowertmp; 829a78d9f0dSMiklos Szeredi for (numlower = 0; numlower < stacklen; numlower++) { 8306b2d5fe4SMiklos Szeredi err = ovl_lower_dir(lower, &stack[numlower], ufs, 8316b2d5fe4SMiklos Szeredi &sb->s_stack_depth, &remote); 8323b7a9a24SMiklos Szeredi if (err) 833a78d9f0dSMiklos Szeredi goto out_put_lowerpath; 834a78d9f0dSMiklos Szeredi 835a78d9f0dSMiklos Szeredi lower = strchr(lower, '\0') + 1; 836a78d9f0dSMiklos Szeredi } 837e9be9d5eSMiklos Szeredi 838e9be9d5eSMiklos Szeredi err = -EINVAL; 839ab508822SMiklos Szeredi sb->s_stack_depth++; 84069c433edSMiklos Szeredi if (sb->s_stack_depth > FILESYSTEM_MAX_STACK_DEPTH) { 84169c433edSMiklos Szeredi pr_err("overlayfs: maximum fs stacking depth exceeded\n"); 8423b7a9a24SMiklos Szeredi goto out_put_lowerpath; 84369c433edSMiklos Szeredi } 84469c433edSMiklos Szeredi 84553a08cb9SMiklos Szeredi if (ufs->config.upperdir) { 846e9be9d5eSMiklos Szeredi ufs->upper_mnt = clone_private_mount(&upperpath); 847e9be9d5eSMiklos Szeredi err = PTR_ERR(ufs->upper_mnt); 848e9be9d5eSMiklos Szeredi if (IS_ERR(ufs->upper_mnt)) { 849e9be9d5eSMiklos Szeredi pr_err("overlayfs: failed to clone upperpath\n"); 8503b7a9a24SMiklos Szeredi goto out_put_lowerpath; 8513b7a9a24SMiklos Szeredi } 852d719e8f2SMiklos Szeredi /* Don't inherit atime flags */ 853d719e8f2SMiklos Szeredi ufs->upper_mnt->mnt_flags &= ~(MNT_NOATIME | MNT_NODIRATIME | MNT_RELATIME); 854d719e8f2SMiklos Szeredi 855d719e8f2SMiklos Szeredi sb->s_time_gran = ufs->upper_mnt->mnt_sb->s_time_gran; 8563b7a9a24SMiklos Szeredi 8573b7a9a24SMiklos Szeredi ufs->workdir = ovl_workdir_create(ufs->upper_mnt, workpath.dentry); 8583b7a9a24SMiklos Szeredi err = PTR_ERR(ufs->workdir); 8593b7a9a24SMiklos Szeredi if (IS_ERR(ufs->workdir)) { 860cc6f67bcSMiklos Szeredi pr_warn("overlayfs: failed to create directory %s/%s (errno: %i); mounting read-only\n", 861cc6f67bcSMiklos Szeredi ufs->config.workdir, OVL_WORKDIR_NAME, -err); 862cc6f67bcSMiklos Szeredi sb->s_flags |= MS_RDONLY; 863cc6f67bcSMiklos Szeredi ufs->workdir = NULL; 864e9be9d5eSMiklos Szeredi } 86545aebeafSVivek Goyal 86645aebeafSVivek Goyal /* 86745aebeafSVivek Goyal * Upper should support d_type, else whiteouts are visible. 86845aebeafSVivek Goyal * Given workdir and upper are on same fs, we can do 86921765194SVivek Goyal * iterate_dir() on workdir. This check requires successful 87021765194SVivek Goyal * creation of workdir in previous step. 87145aebeafSVivek Goyal */ 87221765194SVivek Goyal if (ufs->workdir) { 873e7f52429SAmir Goldstein struct dentry *temp; 874e7f52429SAmir Goldstein 87545aebeafSVivek Goyal err = ovl_check_d_type_supported(&workpath); 87645aebeafSVivek Goyal if (err < 0) 87745aebeafSVivek Goyal goto out_put_workdir; 87845aebeafSVivek Goyal 879e7c0b599SVivek Goyal /* 880e7c0b599SVivek Goyal * We allowed this configuration and don't want to 881e7c0b599SVivek Goyal * break users over kernel upgrade. So warn instead 882e7c0b599SVivek Goyal * of erroring out. 883e7c0b599SVivek Goyal */ 884e7c0b599SVivek Goyal if (!err) 885e7c0b599SVivek Goyal pr_warn("overlayfs: upper fs needs to support d_type.\n"); 886e7f52429SAmir Goldstein 887e7f52429SAmir Goldstein /* Check if upper/work fs supports O_TMPFILE */ 888e7f52429SAmir Goldstein temp = ovl_do_tmpfile(ufs->workdir, S_IFREG | 0); 889e7f52429SAmir Goldstein ufs->tmpfile = !IS_ERR(temp); 890e7f52429SAmir Goldstein if (ufs->tmpfile) 891e7f52429SAmir Goldstein dput(temp); 892e7f52429SAmir Goldstein else 893e7f52429SAmir Goldstein pr_warn("overlayfs: upper fs does not support tmpfile.\n"); 89482b749b2SAmir Goldstein 89582b749b2SAmir Goldstein /* 89682b749b2SAmir Goldstein * Check if upper/work fs supports trusted.overlay.* 89782b749b2SAmir Goldstein * xattr 89882b749b2SAmir Goldstein */ 89982b749b2SAmir Goldstein err = ovl_do_setxattr(ufs->workdir, OVL_XATTR_OPAQUE, 90082b749b2SAmir Goldstein "0", 1, 0); 90182b749b2SAmir Goldstein if (err) { 90282b749b2SAmir Goldstein ufs->noxattr = true; 90382b749b2SAmir Goldstein pr_warn("overlayfs: upper fs does not support xattr.\n"); 90482b749b2SAmir Goldstein } else { 90582b749b2SAmir Goldstein vfs_removexattr(ufs->workdir, OVL_XATTR_OPAQUE); 90682b749b2SAmir Goldstein } 90753a08cb9SMiklos Szeredi } 90821765194SVivek Goyal } 909e9be9d5eSMiklos Szeredi 9102f83fd8cShujianyang err = -ENOMEM; 911a78d9f0dSMiklos Szeredi ufs->lower_mnt = kcalloc(numlower, sizeof(struct vfsmount *), GFP_KERNEL); 912dd662667SMiklos Szeredi if (ufs->lower_mnt == NULL) 9133b7a9a24SMiklos Szeredi goto out_put_workdir; 914a78d9f0dSMiklos Szeredi for (i = 0; i < numlower; i++) { 915a78d9f0dSMiklos Szeredi struct vfsmount *mnt = clone_private_mount(&stack[i]); 916dd662667SMiklos Szeredi 9172f83fd8cShujianyang err = PTR_ERR(mnt); 918dd662667SMiklos Szeredi if (IS_ERR(mnt)) { 919dd662667SMiklos Szeredi pr_err("overlayfs: failed to clone lowerpath\n"); 920dd662667SMiklos Szeredi goto out_put_lower_mnt; 921e9be9d5eSMiklos Szeredi } 922dd662667SMiklos Szeredi /* 923dd662667SMiklos Szeredi * Make lower_mnt R/O. That way fchmod/fchown on lower file 924dd662667SMiklos Szeredi * will fail instead of modifying lower fs. 925dd662667SMiklos Szeredi */ 926d719e8f2SMiklos Szeredi mnt->mnt_flags |= MNT_READONLY | MNT_NOATIME; 927dd662667SMiklos Szeredi 928a78d9f0dSMiklos Szeredi ufs->lower_mnt[ufs->numlower] = mnt; 929a78d9f0dSMiklos Szeredi ufs->numlower++; 9307bcd74b9SAmir Goldstein 9317bcd74b9SAmir Goldstein /* Check if all lower layers are on same sb */ 9327bcd74b9SAmir Goldstein if (i == 0) 9337bcd74b9SAmir Goldstein ufs->same_sb = mnt->mnt_sb; 9347bcd74b9SAmir Goldstein else if (ufs->same_sb != mnt->mnt_sb) 9357bcd74b9SAmir Goldstein ufs->same_sb = NULL; 936a78d9f0dSMiklos Szeredi } 937e9be9d5eSMiklos Szeredi 93871cbad7eShujianyang /* If the upper fs is nonexistent, we mark overlayfs r/o too */ 93971cbad7eShujianyang if (!ufs->upper_mnt) 940e9be9d5eSMiklos Szeredi sb->s_flags |= MS_RDONLY; 9417bcd74b9SAmir Goldstein else if (ufs->upper_mnt->mnt_sb != ufs->same_sb) 9427bcd74b9SAmir Goldstein ufs->same_sb = NULL; 943e9be9d5eSMiklos Szeredi 9447c03b5d4SMiklos Szeredi if (remote) 9457c03b5d4SMiklos Szeredi sb->s_d_op = &ovl_reval_dentry_operations; 9467c03b5d4SMiklos Szeredi else 947e9be9d5eSMiklos Szeredi sb->s_d_op = &ovl_dentry_operations; 948e9be9d5eSMiklos Szeredi 94951f8f3c4SKonstantin Khlebnikov ufs->creator_cred = cred = prepare_creds(); 95051f8f3c4SKonstantin Khlebnikov if (!cred) 9513fe6e52fSAntonio Murdaca goto out_put_lower_mnt; 9523fe6e52fSAntonio Murdaca 95351f8f3c4SKonstantin Khlebnikov /* Never override disk quota limits or use reserved space */ 95451f8f3c4SKonstantin Khlebnikov cap_lower(cred->cap_effective, CAP_SYS_RESOURCE); 95551f8f3c4SKonstantin Khlebnikov 956e9be9d5eSMiklos Szeredi err = -ENOMEM; 957a78d9f0dSMiklos Szeredi oe = ovl_alloc_entry(numlower); 9583b7a9a24SMiklos Szeredi if (!oe) 9593fe6e52fSAntonio Murdaca goto out_put_cred; 960e9be9d5eSMiklos Szeredi 961655042ccSVivek Goyal sb->s_magic = OVERLAYFS_SUPER_MAGIC; 962655042ccSVivek Goyal sb->s_op = &ovl_super_operations; 963655042ccSVivek Goyal sb->s_xattr = ovl_xattr_handlers; 964655042ccSVivek Goyal sb->s_fs_info = ufs; 965655042ccSVivek Goyal sb->s_flags |= MS_POSIXACL | MS_NOREMOTELOCK; 966655042ccSVivek Goyal 967ca4c8a3aSMiklos Szeredi root_dentry = d_make_root(ovl_new_inode(sb, S_IFDIR, 0)); 968e9be9d5eSMiklos Szeredi if (!root_dentry) 9693b7a9a24SMiklos Szeredi goto out_free_oe; 970e9be9d5eSMiklos Szeredi 971e9be9d5eSMiklos Szeredi mntput(upperpath.mnt); 972a78d9f0dSMiklos Szeredi for (i = 0; i < numlower; i++) 973a78d9f0dSMiklos Szeredi mntput(stack[i].mnt); 974e9be9d5eSMiklos Szeredi path_put(&workpath); 975a78d9f0dSMiklos Szeredi kfree(lowertmp); 976e9be9d5eSMiklos Szeredi 977e9be9d5eSMiklos Szeredi oe->__upperdentry = upperpath.dentry; 978a78d9f0dSMiklos Szeredi for (i = 0; i < numlower; i++) { 979a78d9f0dSMiklos Szeredi oe->lowerstack[i].dentry = stack[i].dentry; 980a78d9f0dSMiklos Szeredi oe->lowerstack[i].mnt = ufs->lower_mnt[i]; 981a78d9f0dSMiklos Szeredi } 9820f95502aSKonstantin Khlebnikov kfree(stack); 983e9be9d5eSMiklos Szeredi 984e9be9d5eSMiklos Szeredi root_dentry->d_fsdata = oe; 985e9be9d5eSMiklos Szeredi 98639b681f8SMiklos Szeredi realinode = d_inode(ovl_dentry_real(root_dentry)); 98739b681f8SMiklos Szeredi ovl_inode_init(d_inode(root_dentry), realinode, !!upperpath.dentry); 98839b681f8SMiklos Szeredi ovl_copyattr(realinode, d_inode(root_dentry)); 989ed06e069SMiklos Szeredi 990e9be9d5eSMiklos Szeredi sb->s_root = root_dentry; 991e9be9d5eSMiklos Szeredi 992e9be9d5eSMiklos Szeredi return 0; 993e9be9d5eSMiklos Szeredi 9943b7a9a24SMiklos Szeredi out_free_oe: 9953b7a9a24SMiklos Szeredi kfree(oe); 9963fe6e52fSAntonio Murdaca out_put_cred: 9973fe6e52fSAntonio Murdaca put_cred(ufs->creator_cred); 998e9be9d5eSMiklos Szeredi out_put_lower_mnt: 999dd662667SMiklos Szeredi for (i = 0; i < ufs->numlower; i++) 1000dd662667SMiklos Szeredi mntput(ufs->lower_mnt[i]); 1001dd662667SMiklos Szeredi kfree(ufs->lower_mnt); 10023b7a9a24SMiklos Szeredi out_put_workdir: 10033b7a9a24SMiklos Szeredi dput(ufs->workdir); 1004e9be9d5eSMiklos Szeredi mntput(ufs->upper_mnt); 1005e9be9d5eSMiklos Szeredi out_put_lowerpath: 1006a78d9f0dSMiklos Szeredi for (i = 0; i < numlower; i++) 1007a78d9f0dSMiklos Szeredi path_put(&stack[i]); 1008a78d9f0dSMiklos Szeredi kfree(stack); 1009a78d9f0dSMiklos Szeredi out_free_lowertmp: 1010a78d9f0dSMiklos Szeredi kfree(lowertmp); 10113b7a9a24SMiklos Szeredi out_put_workpath: 10123b7a9a24SMiklos Szeredi path_put(&workpath); 1013e9be9d5eSMiklos Szeredi out_put_upperpath: 1014e9be9d5eSMiklos Szeredi path_put(&upperpath); 1015e9be9d5eSMiklos Szeredi out_free_config: 1016f45827e8SErez Zadok kfree(ufs->config.lowerdir); 1017f45827e8SErez Zadok kfree(ufs->config.upperdir); 1018f45827e8SErez Zadok kfree(ufs->config.workdir); 1019f45827e8SErez Zadok kfree(ufs); 1020e9be9d5eSMiklos Szeredi out: 1021e9be9d5eSMiklos Szeredi return err; 1022e9be9d5eSMiklos Szeredi } 1023e9be9d5eSMiklos Szeredi 1024e9be9d5eSMiklos Szeredi static struct dentry *ovl_mount(struct file_system_type *fs_type, int flags, 1025e9be9d5eSMiklos Szeredi const char *dev_name, void *raw_data) 1026e9be9d5eSMiklos Szeredi { 1027e9be9d5eSMiklos Szeredi return mount_nodev(fs_type, flags, raw_data, ovl_fill_super); 1028e9be9d5eSMiklos Szeredi } 1029e9be9d5eSMiklos Szeredi 1030e9be9d5eSMiklos Szeredi static struct file_system_type ovl_fs_type = { 1031e9be9d5eSMiklos Szeredi .owner = THIS_MODULE, 1032ef94b186SMiklos Szeredi .name = "overlay", 1033e9be9d5eSMiklos Szeredi .mount = ovl_mount, 1034e9be9d5eSMiklos Szeredi .kill_sb = kill_anon_super, 1035e9be9d5eSMiklos Szeredi }; 1036ef94b186SMiklos Szeredi MODULE_ALIAS_FS("overlay"); 1037e9be9d5eSMiklos Szeredi 1038e9be9d5eSMiklos Szeredi static int __init ovl_init(void) 1039e9be9d5eSMiklos Szeredi { 1040e9be9d5eSMiklos Szeredi return register_filesystem(&ovl_fs_type); 1041e9be9d5eSMiklos Szeredi } 1042e9be9d5eSMiklos Szeredi 1043e9be9d5eSMiklos Szeredi static void __exit ovl_exit(void) 1044e9be9d5eSMiklos Szeredi { 1045e9be9d5eSMiklos Szeredi unregister_filesystem(&ovl_fs_type); 1046e9be9d5eSMiklos Szeredi } 1047e9be9d5eSMiklos Szeredi 1048e9be9d5eSMiklos Szeredi module_init(ovl_init); 1049e9be9d5eSMiklos Szeredi module_exit(ovl_exit); 1050