1e9be9d5eSMiklos Szeredi /* 2e9be9d5eSMiklos Szeredi * 3e9be9d5eSMiklos Szeredi * Copyright (C) 2011 Novell Inc. 4e9be9d5eSMiklos Szeredi * 5e9be9d5eSMiklos Szeredi * This program is free software; you can redistribute it and/or modify it 6e9be9d5eSMiklos Szeredi * under the terms of the GNU General Public License version 2 as published by 7e9be9d5eSMiklos Szeredi * the Free Software Foundation. 8e9be9d5eSMiklos Szeredi */ 9e9be9d5eSMiklos Szeredi 105b825c3aSIngo Molnar #include <uapi/linux/magic.h> 11e9be9d5eSMiklos Szeredi #include <linux/fs.h> 12e9be9d5eSMiklos Szeredi #include <linux/namei.h> 13e9be9d5eSMiklos Szeredi #include <linux/xattr.h> 14e9be9d5eSMiklos Szeredi #include <linux/mount.h> 15e9be9d5eSMiklos Szeredi #include <linux/parser.h> 16e9be9d5eSMiklos Szeredi #include <linux/module.h> 17cc259639SAndy Whitcroft #include <linux/statfs.h> 18f45827e8SErez Zadok #include <linux/seq_file.h> 19d837a49bSMiklos Szeredi #include <linux/posix_acl_xattr.h> 20e9be9d5eSMiklos Szeredi #include "overlayfs.h" 21e9be9d5eSMiklos Szeredi 22e9be9d5eSMiklos Szeredi MODULE_AUTHOR("Miklos Szeredi <miklos@szeredi.hu>"); 23e9be9d5eSMiklos Szeredi MODULE_DESCRIPTION("Overlay filesystem"); 24e9be9d5eSMiklos Szeredi MODULE_LICENSE("GPL"); 25e9be9d5eSMiklos Szeredi 26e9be9d5eSMiklos Szeredi 27e9be9d5eSMiklos Szeredi struct ovl_dir_cache; 28e9be9d5eSMiklos Szeredi 29a78d9f0dSMiklos Szeredi #define OVL_MAX_STACK 500 30a78d9f0dSMiklos Szeredi 31688ea0e5SMiklos Szeredi static bool ovl_redirect_dir_def = IS_ENABLED(CONFIG_OVERLAY_FS_REDIRECT_DIR); 32688ea0e5SMiklos Szeredi module_param_named(redirect_dir, ovl_redirect_dir_def, bool, 0644); 33688ea0e5SMiklos Szeredi MODULE_PARM_DESC(ovl_redirect_dir_def, 34688ea0e5SMiklos Szeredi "Default to on or off for the redirect_dir feature"); 35e9be9d5eSMiklos Szeredi 3602bcd157SAmir Goldstein static bool ovl_index_def = IS_ENABLED(CONFIG_OVERLAY_FS_INDEX); 3702bcd157SAmir Goldstein module_param_named(index, ovl_index_def, bool, 0644); 3802bcd157SAmir Goldstein MODULE_PARM_DESC(ovl_index_def, 3902bcd157SAmir Goldstein "Default to on or off for the inodes index feature"); 4002bcd157SAmir Goldstein 41e9be9d5eSMiklos Szeredi static void ovl_dentry_release(struct dentry *dentry) 42e9be9d5eSMiklos Szeredi { 43e9be9d5eSMiklos Szeredi struct ovl_entry *oe = dentry->d_fsdata; 44e9be9d5eSMiklos Szeredi 45e9be9d5eSMiklos Szeredi if (oe) { 46dd662667SMiklos Szeredi unsigned int i; 47dd662667SMiklos Szeredi 48dd662667SMiklos Szeredi for (i = 0; i < oe->numlower; i++) 49dd662667SMiklos Szeredi dput(oe->lowerstack[i].dentry); 50e9be9d5eSMiklos Szeredi kfree_rcu(oe, rcu); 51e9be9d5eSMiklos Szeredi } 52e9be9d5eSMiklos Szeredi } 53e9be9d5eSMiklos Szeredi 54b0990fbbSAmir Goldstein static int ovl_check_append_only(struct inode *inode, int flag) 55b0990fbbSAmir Goldstein { 56b0990fbbSAmir Goldstein /* 57b0990fbbSAmir Goldstein * This test was moot in vfs may_open() because overlay inode does 58b0990fbbSAmir Goldstein * not have the S_APPEND flag, so re-check on real upper inode 59b0990fbbSAmir Goldstein */ 60b0990fbbSAmir Goldstein if (IS_APPEND(inode)) { 61b0990fbbSAmir Goldstein if ((flag & O_ACCMODE) != O_RDONLY && !(flag & O_APPEND)) 62b0990fbbSAmir Goldstein return -EPERM; 63b0990fbbSAmir Goldstein if (flag & O_TRUNC) 64b0990fbbSAmir Goldstein return -EPERM; 65b0990fbbSAmir Goldstein } 66b0990fbbSAmir Goldstein 67b0990fbbSAmir Goldstein return 0; 68b0990fbbSAmir Goldstein } 69b0990fbbSAmir Goldstein 702d902671SMiklos Szeredi static struct dentry *ovl_d_real(struct dentry *dentry, 712d902671SMiklos Szeredi const struct inode *inode, 72495e6429SMiklos Szeredi unsigned int open_flags, unsigned int flags) 73d101a125SMiklos Szeredi { 74d101a125SMiklos Szeredi struct dentry *real; 75b0990fbbSAmir Goldstein int err; 76d101a125SMiklos Szeredi 77cd91304eSMiklos Szeredi if (flags & D_REAL_UPPER) 78cd91304eSMiklos Szeredi return ovl_dentry_upper(dentry); 79cd91304eSMiklos Szeredi 80ca4c8a3aSMiklos Szeredi if (!d_is_reg(dentry)) { 81d101a125SMiklos Szeredi if (!inode || inode == d_inode(dentry)) 82d101a125SMiklos Szeredi return dentry; 83d101a125SMiklos Szeredi goto bug; 84d101a125SMiklos Szeredi } 85d101a125SMiklos Szeredi 862d902671SMiklos Szeredi if (open_flags) { 87b0990fbbSAmir Goldstein err = ovl_open_maybe_copy_up(dentry, open_flags); 882d902671SMiklos Szeredi if (err) 892d902671SMiklos Szeredi return ERR_PTR(err); 902d902671SMiklos Szeredi } 912d902671SMiklos Szeredi 92d101a125SMiklos Szeredi real = ovl_dentry_upper(dentry); 93b0990fbbSAmir Goldstein if (real && (!inode || inode == d_inode(real))) { 94b0990fbbSAmir Goldstein if (!inode) { 95b0990fbbSAmir Goldstein err = ovl_check_append_only(d_inode(real), open_flags); 96b0990fbbSAmir Goldstein if (err) 97b0990fbbSAmir Goldstein return ERR_PTR(err); 98b0990fbbSAmir Goldstein } 99d101a125SMiklos Szeredi return real; 100b0990fbbSAmir Goldstein } 101d101a125SMiklos Szeredi 102d101a125SMiklos Szeredi real = ovl_dentry_lower(dentry); 103d101a125SMiklos Szeredi if (!real) 104d101a125SMiklos Szeredi goto bug; 105d101a125SMiklos Szeredi 106c4fcfc16SMiklos Szeredi /* Handle recursion */ 107495e6429SMiklos Szeredi real = d_real(real, inode, open_flags, 0); 108c4fcfc16SMiklos Szeredi 109d101a125SMiklos Szeredi if (!inode || inode == d_inode(real)) 110d101a125SMiklos Szeredi return real; 111d101a125SMiklos Szeredi bug: 112656189d2SMiklos Szeredi WARN(1, "ovl_d_real(%pd4, %s:%lu): real dentry not found\n", dentry, 113d101a125SMiklos Szeredi inode ? inode->i_sb->s_id : "NULL", inode ? inode->i_ino : 0); 114d101a125SMiklos Szeredi return dentry; 115d101a125SMiklos Szeredi } 116d101a125SMiklos Szeredi 1177c03b5d4SMiklos Szeredi static int ovl_dentry_revalidate(struct dentry *dentry, unsigned int flags) 1187c03b5d4SMiklos Szeredi { 1197c03b5d4SMiklos Szeredi struct ovl_entry *oe = dentry->d_fsdata; 1207c03b5d4SMiklos Szeredi unsigned int i; 1217c03b5d4SMiklos Szeredi int ret = 1; 1227c03b5d4SMiklos Szeredi 1237c03b5d4SMiklos Szeredi for (i = 0; i < oe->numlower; i++) { 1247c03b5d4SMiklos Szeredi struct dentry *d = oe->lowerstack[i].dentry; 1257c03b5d4SMiklos Szeredi 1267c03b5d4SMiklos Szeredi if (d->d_flags & DCACHE_OP_REVALIDATE) { 1277c03b5d4SMiklos Szeredi ret = d->d_op->d_revalidate(d, flags); 1287c03b5d4SMiklos Szeredi if (ret < 0) 1297c03b5d4SMiklos Szeredi return ret; 1307c03b5d4SMiklos Szeredi if (!ret) { 1317c03b5d4SMiklos Szeredi if (!(flags & LOOKUP_RCU)) 1327c03b5d4SMiklos Szeredi d_invalidate(d); 1337c03b5d4SMiklos Szeredi return -ESTALE; 1347c03b5d4SMiklos Szeredi } 1357c03b5d4SMiklos Szeredi } 1367c03b5d4SMiklos Szeredi } 1377c03b5d4SMiklos Szeredi return 1; 1387c03b5d4SMiklos Szeredi } 1397c03b5d4SMiklos Szeredi 1407c03b5d4SMiklos Szeredi static int ovl_dentry_weak_revalidate(struct dentry *dentry, unsigned int flags) 1417c03b5d4SMiklos Szeredi { 1427c03b5d4SMiklos Szeredi struct ovl_entry *oe = dentry->d_fsdata; 1437c03b5d4SMiklos Szeredi unsigned int i; 1447c03b5d4SMiklos Szeredi int ret = 1; 1457c03b5d4SMiklos Szeredi 1467c03b5d4SMiklos Szeredi for (i = 0; i < oe->numlower; i++) { 1477c03b5d4SMiklos Szeredi struct dentry *d = oe->lowerstack[i].dentry; 1487c03b5d4SMiklos Szeredi 1497c03b5d4SMiklos Szeredi if (d->d_flags & DCACHE_OP_WEAK_REVALIDATE) { 1507c03b5d4SMiklos Szeredi ret = d->d_op->d_weak_revalidate(d, flags); 1517c03b5d4SMiklos Szeredi if (ret <= 0) 1527c03b5d4SMiklos Szeredi break; 1537c03b5d4SMiklos Szeredi } 1547c03b5d4SMiklos Szeredi } 1557c03b5d4SMiklos Szeredi return ret; 1567c03b5d4SMiklos Szeredi } 1577c03b5d4SMiklos Szeredi 158e9be9d5eSMiklos Szeredi static const struct dentry_operations ovl_dentry_operations = { 159e9be9d5eSMiklos Szeredi .d_release = ovl_dentry_release, 160d101a125SMiklos Szeredi .d_real = ovl_d_real, 161e9be9d5eSMiklos Szeredi }; 162e9be9d5eSMiklos Szeredi 1637c03b5d4SMiklos Szeredi static const struct dentry_operations ovl_reval_dentry_operations = { 1647c03b5d4SMiklos Szeredi .d_release = ovl_dentry_release, 165d101a125SMiklos Szeredi .d_real = ovl_d_real, 1667c03b5d4SMiklos Szeredi .d_revalidate = ovl_dentry_revalidate, 1677c03b5d4SMiklos Szeredi .d_weak_revalidate = ovl_dentry_weak_revalidate, 1687c03b5d4SMiklos Szeredi }; 1697c03b5d4SMiklos Szeredi 17013cf199dSAmir Goldstein static struct kmem_cache *ovl_inode_cachep; 17113cf199dSAmir Goldstein 17213cf199dSAmir Goldstein static struct inode *ovl_alloc_inode(struct super_block *sb) 17313cf199dSAmir Goldstein { 17413cf199dSAmir Goldstein struct ovl_inode *oi = kmem_cache_alloc(ovl_inode_cachep, GFP_KERNEL); 17513cf199dSAmir Goldstein 176b3885bd6SHirofumi Nakagawa if (!oi) 177b3885bd6SHirofumi Nakagawa return NULL; 178b3885bd6SHirofumi Nakagawa 17904a01ac7SMiklos Szeredi oi->cache = NULL; 180cf31c463SMiklos Szeredi oi->redirect = NULL; 18104a01ac7SMiklos Szeredi oi->version = 0; 18213c72075SMiklos Szeredi oi->flags = 0; 18309d8b586SMiklos Szeredi oi->__upperdentry = NULL; 18425b7713aSMiklos Szeredi oi->lower = NULL; 185a015dafcSAmir Goldstein mutex_init(&oi->lock); 18625b7713aSMiklos Szeredi 18713cf199dSAmir Goldstein return &oi->vfs_inode; 18813cf199dSAmir Goldstein } 18913cf199dSAmir Goldstein 19013cf199dSAmir Goldstein static void ovl_i_callback(struct rcu_head *head) 19113cf199dSAmir Goldstein { 19213cf199dSAmir Goldstein struct inode *inode = container_of(head, struct inode, i_rcu); 19313cf199dSAmir Goldstein 19413cf199dSAmir Goldstein kmem_cache_free(ovl_inode_cachep, OVL_I(inode)); 19513cf199dSAmir Goldstein } 19613cf199dSAmir Goldstein 19713cf199dSAmir Goldstein static void ovl_destroy_inode(struct inode *inode) 19813cf199dSAmir Goldstein { 19909d8b586SMiklos Szeredi struct ovl_inode *oi = OVL_I(inode); 20009d8b586SMiklos Szeredi 20109d8b586SMiklos Szeredi dput(oi->__upperdentry); 202cf31c463SMiklos Szeredi kfree(oi->redirect); 2034edb83bbSMiklos Szeredi ovl_dir_cache_free(inode); 204a015dafcSAmir Goldstein mutex_destroy(&oi->lock); 20509d8b586SMiklos Szeredi 20613cf199dSAmir Goldstein call_rcu(&inode->i_rcu, ovl_i_callback); 20713cf199dSAmir Goldstein } 20813cf199dSAmir Goldstein 209e9be9d5eSMiklos Szeredi static void ovl_put_super(struct super_block *sb) 210e9be9d5eSMiklos Szeredi { 211e9be9d5eSMiklos Szeredi struct ovl_fs *ufs = sb->s_fs_info; 212dd662667SMiklos Szeredi unsigned i; 213e9be9d5eSMiklos Szeredi 21402bcd157SAmir Goldstein dput(ufs->indexdir); 215e9be9d5eSMiklos Szeredi dput(ufs->workdir); 21685fdee1eSAmir Goldstein if (ufs->workdir_locked) 2172cac0c00SAmir Goldstein ovl_inuse_unlock(ufs->workbasedir); 2182cac0c00SAmir Goldstein dput(ufs->workbasedir); 21985fdee1eSAmir Goldstein if (ufs->upper_mnt && ufs->upperdir_locked) 2202cac0c00SAmir Goldstein ovl_inuse_unlock(ufs->upper_mnt->mnt_root); 221e9be9d5eSMiklos Szeredi mntput(ufs->upper_mnt); 2222a9c6d06SChandan Rajendra for (i = 0; i < ufs->numlower; i++) { 223b9343632SChandan Rajendra mntput(ufs->lower_layers[i].mnt); 2242a9c6d06SChandan Rajendra free_anon_bdev(ufs->lower_layers[i].pseudo_dev); 2252a9c6d06SChandan Rajendra } 226b9343632SChandan Rajendra kfree(ufs->lower_layers); 227e9be9d5eSMiklos Szeredi 228f45827e8SErez Zadok kfree(ufs->config.lowerdir); 229f45827e8SErez Zadok kfree(ufs->config.upperdir); 230f45827e8SErez Zadok kfree(ufs->config.workdir); 2313fe6e52fSAntonio Murdaca put_cred(ufs->creator_cred); 232e9be9d5eSMiklos Szeredi kfree(ufs); 233e9be9d5eSMiklos Szeredi } 234e9be9d5eSMiklos Szeredi 235e593b2bfSAmir Goldstein static int ovl_sync_fs(struct super_block *sb, int wait) 236e593b2bfSAmir Goldstein { 237e593b2bfSAmir Goldstein struct ovl_fs *ufs = sb->s_fs_info; 238e593b2bfSAmir Goldstein struct super_block *upper_sb; 239e593b2bfSAmir Goldstein int ret; 240e593b2bfSAmir Goldstein 241e593b2bfSAmir Goldstein if (!ufs->upper_mnt) 242e593b2bfSAmir Goldstein return 0; 243e593b2bfSAmir Goldstein upper_sb = ufs->upper_mnt->mnt_sb; 244e593b2bfSAmir Goldstein if (!upper_sb->s_op->sync_fs) 245e593b2bfSAmir Goldstein return 0; 246e593b2bfSAmir Goldstein 247e593b2bfSAmir Goldstein /* real inodes have already been synced by sync_filesystem(ovl_sb) */ 248e593b2bfSAmir Goldstein down_read(&upper_sb->s_umount); 249e593b2bfSAmir Goldstein ret = upper_sb->s_op->sync_fs(upper_sb, wait); 250e593b2bfSAmir Goldstein up_read(&upper_sb->s_umount); 251e593b2bfSAmir Goldstein return ret; 252e593b2bfSAmir Goldstein } 253e593b2bfSAmir Goldstein 254cc259639SAndy Whitcroft /** 255cc259639SAndy Whitcroft * ovl_statfs 256cc259639SAndy Whitcroft * @sb: The overlayfs super block 257cc259639SAndy Whitcroft * @buf: The struct kstatfs to fill in with stats 258cc259639SAndy Whitcroft * 259cc259639SAndy Whitcroft * Get the filesystem statistics. As writes always target the upper layer 2604ebc5818SMiklos Szeredi * filesystem pass the statfs to the upper filesystem (if it exists) 261cc259639SAndy Whitcroft */ 262cc259639SAndy Whitcroft static int ovl_statfs(struct dentry *dentry, struct kstatfs *buf) 263cc259639SAndy Whitcroft { 264cc259639SAndy Whitcroft struct ovl_fs *ofs = dentry->d_sb->s_fs_info; 265cc259639SAndy Whitcroft struct dentry *root_dentry = dentry->d_sb->s_root; 266cc259639SAndy Whitcroft struct path path; 267cc259639SAndy Whitcroft int err; 268cc259639SAndy Whitcroft 2694ebc5818SMiklos Szeredi ovl_path_real(root_dentry, &path); 270cc259639SAndy Whitcroft 271cc259639SAndy Whitcroft err = vfs_statfs(&path, buf); 272cc259639SAndy Whitcroft if (!err) { 2736b2d5fe4SMiklos Szeredi buf->f_namelen = ofs->namelen; 274cc259639SAndy Whitcroft buf->f_type = OVERLAYFS_SUPER_MAGIC; 275cc259639SAndy Whitcroft } 276cc259639SAndy Whitcroft 277cc259639SAndy Whitcroft return err; 278cc259639SAndy Whitcroft } 279cc259639SAndy Whitcroft 28002bcd157SAmir Goldstein /* Will this overlay be forced to mount/remount ro? */ 28102bcd157SAmir Goldstein static bool ovl_force_readonly(struct ovl_fs *ufs) 28202bcd157SAmir Goldstein { 28302bcd157SAmir Goldstein return (!ufs->upper_mnt || !ufs->workdir); 28402bcd157SAmir Goldstein } 28502bcd157SAmir Goldstein 286f45827e8SErez Zadok /** 287f45827e8SErez Zadok * ovl_show_options 288f45827e8SErez Zadok * 289f45827e8SErez Zadok * Prints the mount options for a given superblock. 290f45827e8SErez Zadok * Returns zero; does not fail. 291f45827e8SErez Zadok */ 292f45827e8SErez Zadok static int ovl_show_options(struct seq_file *m, struct dentry *dentry) 293f45827e8SErez Zadok { 294f45827e8SErez Zadok struct super_block *sb = dentry->d_sb; 295f45827e8SErez Zadok struct ovl_fs *ufs = sb->s_fs_info; 296f45827e8SErez Zadok 297a068acf2SKees Cook seq_show_option(m, "lowerdir", ufs->config.lowerdir); 29853a08cb9SMiklos Szeredi if (ufs->config.upperdir) { 299a068acf2SKees Cook seq_show_option(m, "upperdir", ufs->config.upperdir); 300a068acf2SKees Cook seq_show_option(m, "workdir", ufs->config.workdir); 30153a08cb9SMiklos Szeredi } 3028d3095f4SMiklos Szeredi if (ufs->config.default_permissions) 3038d3095f4SMiklos Szeredi seq_puts(m, ",default_permissions"); 304c5bef3a7SAmir Goldstein if (ufs->config.redirect_dir != ovl_redirect_dir_def) 305c5bef3a7SAmir Goldstein seq_printf(m, ",redirect_dir=%s", 306c5bef3a7SAmir Goldstein ufs->config.redirect_dir ? "on" : "off"); 30702bcd157SAmir Goldstein if (ufs->config.index != ovl_index_def) 30802bcd157SAmir Goldstein seq_printf(m, ",index=%s", 30902bcd157SAmir Goldstein ufs->config.index ? "on" : "off"); 310f45827e8SErez Zadok return 0; 311f45827e8SErez Zadok } 312f45827e8SErez Zadok 3133cdf6fe9SSeunghun Lee static int ovl_remount(struct super_block *sb, int *flags, char *data) 3143cdf6fe9SSeunghun Lee { 3153cdf6fe9SSeunghun Lee struct ovl_fs *ufs = sb->s_fs_info; 3163cdf6fe9SSeunghun Lee 31702bcd157SAmir Goldstein if (!(*flags & MS_RDONLY) && ovl_force_readonly(ufs)) 3183cdf6fe9SSeunghun Lee return -EROFS; 3193cdf6fe9SSeunghun Lee 3203cdf6fe9SSeunghun Lee return 0; 3213cdf6fe9SSeunghun Lee } 3223cdf6fe9SSeunghun Lee 323e9be9d5eSMiklos Szeredi static const struct super_operations ovl_super_operations = { 32413cf199dSAmir Goldstein .alloc_inode = ovl_alloc_inode, 32513cf199dSAmir Goldstein .destroy_inode = ovl_destroy_inode, 32613cf199dSAmir Goldstein .drop_inode = generic_delete_inode, 327e9be9d5eSMiklos Szeredi .put_super = ovl_put_super, 328e593b2bfSAmir Goldstein .sync_fs = ovl_sync_fs, 329cc259639SAndy Whitcroft .statfs = ovl_statfs, 330f45827e8SErez Zadok .show_options = ovl_show_options, 3313cdf6fe9SSeunghun Lee .remount_fs = ovl_remount, 332e9be9d5eSMiklos Szeredi }; 333e9be9d5eSMiklos Szeredi 334e9be9d5eSMiklos Szeredi enum { 335e9be9d5eSMiklos Szeredi OPT_LOWERDIR, 336e9be9d5eSMiklos Szeredi OPT_UPPERDIR, 337e9be9d5eSMiklos Szeredi OPT_WORKDIR, 3388d3095f4SMiklos Szeredi OPT_DEFAULT_PERMISSIONS, 339a6c60655SMiklos Szeredi OPT_REDIRECT_DIR_ON, 340a6c60655SMiklos Szeredi OPT_REDIRECT_DIR_OFF, 34102bcd157SAmir Goldstein OPT_INDEX_ON, 34202bcd157SAmir Goldstein OPT_INDEX_OFF, 343e9be9d5eSMiklos Szeredi OPT_ERR, 344e9be9d5eSMiklos Szeredi }; 345e9be9d5eSMiklos Szeredi 346e9be9d5eSMiklos Szeredi static const match_table_t ovl_tokens = { 347e9be9d5eSMiklos Szeredi {OPT_LOWERDIR, "lowerdir=%s"}, 348e9be9d5eSMiklos Szeredi {OPT_UPPERDIR, "upperdir=%s"}, 349e9be9d5eSMiklos Szeredi {OPT_WORKDIR, "workdir=%s"}, 3508d3095f4SMiklos Szeredi {OPT_DEFAULT_PERMISSIONS, "default_permissions"}, 351a6c60655SMiklos Szeredi {OPT_REDIRECT_DIR_ON, "redirect_dir=on"}, 352a6c60655SMiklos Szeredi {OPT_REDIRECT_DIR_OFF, "redirect_dir=off"}, 35302bcd157SAmir Goldstein {OPT_INDEX_ON, "index=on"}, 35402bcd157SAmir Goldstein {OPT_INDEX_OFF, "index=off"}, 355e9be9d5eSMiklos Szeredi {OPT_ERR, NULL} 356e9be9d5eSMiklos Szeredi }; 357e9be9d5eSMiklos Szeredi 35891c77947SMiklos Szeredi static char *ovl_next_opt(char **s) 35991c77947SMiklos Szeredi { 36091c77947SMiklos Szeredi char *sbegin = *s; 36191c77947SMiklos Szeredi char *p; 36291c77947SMiklos Szeredi 36391c77947SMiklos Szeredi if (sbegin == NULL) 36491c77947SMiklos Szeredi return NULL; 36591c77947SMiklos Szeredi 36691c77947SMiklos Szeredi for (p = sbegin; *p; p++) { 36791c77947SMiklos Szeredi if (*p == '\\') { 36891c77947SMiklos Szeredi p++; 36991c77947SMiklos Szeredi if (!*p) 37091c77947SMiklos Szeredi break; 37191c77947SMiklos Szeredi } else if (*p == ',') { 37291c77947SMiklos Szeredi *p = '\0'; 37391c77947SMiklos Szeredi *s = p + 1; 37491c77947SMiklos Szeredi return sbegin; 37591c77947SMiklos Szeredi } 37691c77947SMiklos Szeredi } 37791c77947SMiklos Szeredi *s = NULL; 37891c77947SMiklos Szeredi return sbegin; 37991c77947SMiklos Szeredi } 38091c77947SMiklos Szeredi 381e9be9d5eSMiklos Szeredi static int ovl_parse_opt(char *opt, struct ovl_config *config) 382e9be9d5eSMiklos Szeredi { 383e9be9d5eSMiklos Szeredi char *p; 384e9be9d5eSMiklos Szeredi 38591c77947SMiklos Szeredi while ((p = ovl_next_opt(&opt)) != NULL) { 386e9be9d5eSMiklos Szeredi int token; 387e9be9d5eSMiklos Szeredi substring_t args[MAX_OPT_ARGS]; 388e9be9d5eSMiklos Szeredi 389e9be9d5eSMiklos Szeredi if (!*p) 390e9be9d5eSMiklos Szeredi continue; 391e9be9d5eSMiklos Szeredi 392e9be9d5eSMiklos Szeredi token = match_token(p, ovl_tokens, args); 393e9be9d5eSMiklos Szeredi switch (token) { 394e9be9d5eSMiklos Szeredi case OPT_UPPERDIR: 395e9be9d5eSMiklos Szeredi kfree(config->upperdir); 396e9be9d5eSMiklos Szeredi config->upperdir = match_strdup(&args[0]); 397e9be9d5eSMiklos Szeredi if (!config->upperdir) 398e9be9d5eSMiklos Szeredi return -ENOMEM; 399e9be9d5eSMiklos Szeredi break; 400e9be9d5eSMiklos Szeredi 401e9be9d5eSMiklos Szeredi case OPT_LOWERDIR: 402e9be9d5eSMiklos Szeredi kfree(config->lowerdir); 403e9be9d5eSMiklos Szeredi config->lowerdir = match_strdup(&args[0]); 404e9be9d5eSMiklos Szeredi if (!config->lowerdir) 405e9be9d5eSMiklos Szeredi return -ENOMEM; 406e9be9d5eSMiklos Szeredi break; 407e9be9d5eSMiklos Szeredi 408e9be9d5eSMiklos Szeredi case OPT_WORKDIR: 409e9be9d5eSMiklos Szeredi kfree(config->workdir); 410e9be9d5eSMiklos Szeredi config->workdir = match_strdup(&args[0]); 411e9be9d5eSMiklos Szeredi if (!config->workdir) 412e9be9d5eSMiklos Szeredi return -ENOMEM; 413e9be9d5eSMiklos Szeredi break; 414e9be9d5eSMiklos Szeredi 4158d3095f4SMiklos Szeredi case OPT_DEFAULT_PERMISSIONS: 4168d3095f4SMiklos Szeredi config->default_permissions = true; 4178d3095f4SMiklos Szeredi break; 4188d3095f4SMiklos Szeredi 419a6c60655SMiklos Szeredi case OPT_REDIRECT_DIR_ON: 420a6c60655SMiklos Szeredi config->redirect_dir = true; 421a6c60655SMiklos Szeredi break; 422a6c60655SMiklos Szeredi 423a6c60655SMiklos Szeredi case OPT_REDIRECT_DIR_OFF: 424a6c60655SMiklos Szeredi config->redirect_dir = false; 425a6c60655SMiklos Szeredi break; 426a6c60655SMiklos Szeredi 42702bcd157SAmir Goldstein case OPT_INDEX_ON: 42802bcd157SAmir Goldstein config->index = true; 42902bcd157SAmir Goldstein break; 43002bcd157SAmir Goldstein 43102bcd157SAmir Goldstein case OPT_INDEX_OFF: 43202bcd157SAmir Goldstein config->index = false; 43302bcd157SAmir Goldstein break; 43402bcd157SAmir Goldstein 435e9be9d5eSMiklos Szeredi default: 436bead55efShujianyang pr_err("overlayfs: unrecognized mount option \"%s\" or missing value\n", p); 437e9be9d5eSMiklos Szeredi return -EINVAL; 438e9be9d5eSMiklos Szeredi } 439e9be9d5eSMiklos Szeredi } 44071cbad7eShujianyang 44171cbad7eShujianyang /* Workdir is useless in non-upper mount */ 44271cbad7eShujianyang if (!config->upperdir && config->workdir) { 44371cbad7eShujianyang pr_info("overlayfs: option \"workdir=%s\" is useless in a non-upper mount, ignore\n", 44471cbad7eShujianyang config->workdir); 44571cbad7eShujianyang kfree(config->workdir); 44671cbad7eShujianyang config->workdir = NULL; 44771cbad7eShujianyang } 44871cbad7eShujianyang 449e9be9d5eSMiklos Szeredi return 0; 450e9be9d5eSMiklos Szeredi } 451e9be9d5eSMiklos Szeredi 452e9be9d5eSMiklos Szeredi #define OVL_WORKDIR_NAME "work" 45302bcd157SAmir Goldstein #define OVL_INDEXDIR_NAME "index" 454e9be9d5eSMiklos Szeredi 4556b8aa129SAmir Goldstein static struct dentry *ovl_workdir_create(struct super_block *sb, 4566b8aa129SAmir Goldstein struct ovl_fs *ufs, 4576b8aa129SAmir Goldstein struct dentry *dentry, 4586b8aa129SAmir Goldstein const char *name, bool persist) 459e9be9d5eSMiklos Szeredi { 460e9be9d5eSMiklos Szeredi struct inode *dir = dentry->d_inode; 4616b8aa129SAmir Goldstein struct vfsmount *mnt = ufs->upper_mnt; 462e9be9d5eSMiklos Szeredi struct dentry *work; 463e9be9d5eSMiklos Szeredi int err; 464e9be9d5eSMiklos Szeredi bool retried = false; 4656b8aa129SAmir Goldstein bool locked = false; 466e9be9d5eSMiklos Szeredi 467e9be9d5eSMiklos Szeredi err = mnt_want_write(mnt); 468e9be9d5eSMiklos Szeredi if (err) 4696b8aa129SAmir Goldstein goto out_err; 470e9be9d5eSMiklos Szeredi 4715955102cSAl Viro inode_lock_nested(dir, I_MUTEX_PARENT); 4726b8aa129SAmir Goldstein locked = true; 4736b8aa129SAmir Goldstein 474e9be9d5eSMiklos Szeredi retry: 4756b8aa129SAmir Goldstein work = lookup_one_len(name, dentry, strlen(name)); 476e9be9d5eSMiklos Szeredi 477e9be9d5eSMiklos Szeredi if (!IS_ERR(work)) { 478c11b9fddSMiklos Szeredi struct iattr attr = { 479c11b9fddSMiklos Szeredi .ia_valid = ATTR_MODE, 48032a3d848SAl Viro .ia_mode = S_IFDIR | 0, 481c11b9fddSMiklos Szeredi }; 482e9be9d5eSMiklos Szeredi 483e9be9d5eSMiklos Szeredi if (work->d_inode) { 484e9be9d5eSMiklos Szeredi err = -EEXIST; 485e9be9d5eSMiklos Szeredi if (retried) 486e9be9d5eSMiklos Szeredi goto out_dput; 487e9be9d5eSMiklos Szeredi 4886b8aa129SAmir Goldstein if (persist) 4896b8aa129SAmir Goldstein goto out_unlock; 4906b8aa129SAmir Goldstein 491e9be9d5eSMiklos Szeredi retried = true; 492eea2fb48SMiklos Szeredi ovl_workdir_cleanup(dir, mnt, work, 0); 493e9be9d5eSMiklos Szeredi dput(work); 494e9be9d5eSMiklos Szeredi goto retry; 495e9be9d5eSMiklos Szeredi } 496e9be9d5eSMiklos Szeredi 49732a3d848SAl Viro err = ovl_create_real(dir, work, 49832a3d848SAl Viro &(struct cattr){.mode = S_IFDIR | 0}, 49932a3d848SAl Viro NULL, true); 500e9be9d5eSMiklos Szeredi if (err) 501e9be9d5eSMiklos Szeredi goto out_dput; 502c11b9fddSMiklos Szeredi 503cb348edbSMiklos Szeredi /* 504cb348edbSMiklos Szeredi * Try to remove POSIX ACL xattrs from workdir. We are good if: 505cb348edbSMiklos Szeredi * 506cb348edbSMiklos Szeredi * a) success (there was a POSIX ACL xattr and was removed) 507cb348edbSMiklos Szeredi * b) -ENODATA (there was no POSIX ACL xattr) 508cb348edbSMiklos Szeredi * c) -EOPNOTSUPP (POSIX ACL xattrs are not supported) 509cb348edbSMiklos Szeredi * 510cb348edbSMiklos Szeredi * There are various other error values that could effectively 511cb348edbSMiklos Szeredi * mean that the xattr doesn't exist (e.g. -ERANGE is returned 512cb348edbSMiklos Szeredi * if the xattr name is too long), but the set of filesystems 513cb348edbSMiklos Szeredi * allowed as upper are limited to "normal" ones, where checking 514cb348edbSMiklos Szeredi * for the above two errors is sufficient. 515cb348edbSMiklos Szeredi */ 516c11b9fddSMiklos Szeredi err = vfs_removexattr(work, XATTR_NAME_POSIX_ACL_DEFAULT); 517e1ff3dd1SMiklos Szeredi if (err && err != -ENODATA && err != -EOPNOTSUPP) 518c11b9fddSMiklos Szeredi goto out_dput; 519c11b9fddSMiklos Szeredi 520c11b9fddSMiklos Szeredi err = vfs_removexattr(work, XATTR_NAME_POSIX_ACL_ACCESS); 521e1ff3dd1SMiklos Szeredi if (err && err != -ENODATA && err != -EOPNOTSUPP) 522c11b9fddSMiklos Szeredi goto out_dput; 523c11b9fddSMiklos Szeredi 524c11b9fddSMiklos Szeredi /* Clear any inherited mode bits */ 525c11b9fddSMiklos Szeredi inode_lock(work->d_inode); 526c11b9fddSMiklos Szeredi err = notify_change(work, &attr, NULL); 527c11b9fddSMiklos Szeredi inode_unlock(work->d_inode); 528c11b9fddSMiklos Szeredi if (err) 529c11b9fddSMiklos Szeredi goto out_dput; 5306b8aa129SAmir Goldstein } else { 5316b8aa129SAmir Goldstein err = PTR_ERR(work); 5326b8aa129SAmir Goldstein goto out_err; 533e9be9d5eSMiklos Szeredi } 534e9be9d5eSMiklos Szeredi out_unlock: 535e9be9d5eSMiklos Szeredi mnt_drop_write(mnt); 5366b8aa129SAmir Goldstein if (locked) 5376b8aa129SAmir Goldstein inode_unlock(dir); 538e9be9d5eSMiklos Szeredi 539e9be9d5eSMiklos Szeredi return work; 540e9be9d5eSMiklos Szeredi 541e9be9d5eSMiklos Szeredi out_dput: 542e9be9d5eSMiklos Szeredi dput(work); 5436b8aa129SAmir Goldstein out_err: 5446b8aa129SAmir Goldstein pr_warn("overlayfs: failed to create directory %s/%s (errno: %i); mounting read-only\n", 5456b8aa129SAmir Goldstein ufs->config.workdir, name, -err); 5466b8aa129SAmir Goldstein sb->s_flags |= MS_RDONLY; 5476b8aa129SAmir Goldstein work = NULL; 548e9be9d5eSMiklos Szeredi goto out_unlock; 549e9be9d5eSMiklos Szeredi } 550e9be9d5eSMiklos Szeredi 55191c77947SMiklos Szeredi static void ovl_unescape(char *s) 55291c77947SMiklos Szeredi { 55391c77947SMiklos Szeredi char *d = s; 55491c77947SMiklos Szeredi 55591c77947SMiklos Szeredi for (;; s++, d++) { 55691c77947SMiklos Szeredi if (*s == '\\') 55791c77947SMiklos Szeredi s++; 55891c77947SMiklos Szeredi *d = *s; 55991c77947SMiklos Szeredi if (!*s) 56091c77947SMiklos Szeredi break; 56191c77947SMiklos Szeredi } 56291c77947SMiklos Szeredi } 56391c77947SMiklos Szeredi 564ab508822SMiklos Szeredi static int ovl_mount_dir_noesc(const char *name, struct path *path) 565ab508822SMiklos Szeredi { 566a78d9f0dSMiklos Szeredi int err = -EINVAL; 567ab508822SMiklos Szeredi 568a78d9f0dSMiklos Szeredi if (!*name) { 569a78d9f0dSMiklos Szeredi pr_err("overlayfs: empty lowerdir\n"); 570a78d9f0dSMiklos Szeredi goto out; 571a78d9f0dSMiklos Szeredi } 572ab508822SMiklos Szeredi err = kern_path(name, LOOKUP_FOLLOW, path); 573ab508822SMiklos Szeredi if (err) { 574ab508822SMiklos Szeredi pr_err("overlayfs: failed to resolve '%s': %i\n", name, err); 575ab508822SMiklos Szeredi goto out; 576ab508822SMiklos Szeredi } 577ab508822SMiklos Szeredi err = -EINVAL; 5787c03b5d4SMiklos Szeredi if (ovl_dentry_weird(path->dentry)) { 579ab508822SMiklos Szeredi pr_err("overlayfs: filesystem on '%s' not supported\n", name); 580ab508822SMiklos Szeredi goto out_put; 581ab508822SMiklos Szeredi } 5822b8c30e9SMiklos Szeredi if (!d_is_dir(path->dentry)) { 583ab508822SMiklos Szeredi pr_err("overlayfs: '%s' not a directory\n", name); 584ab508822SMiklos Szeredi goto out_put; 585ab508822SMiklos Szeredi } 586ab508822SMiklos Szeredi return 0; 587ab508822SMiklos Szeredi 588ab508822SMiklos Szeredi out_put: 5898aafcb59SMiklos Szeredi path_put_init(path); 590ab508822SMiklos Szeredi out: 591ab508822SMiklos Szeredi return err; 592ab508822SMiklos Szeredi } 593ab508822SMiklos Szeredi 594ab508822SMiklos Szeredi static int ovl_mount_dir(const char *name, struct path *path) 595ab508822SMiklos Szeredi { 596ab508822SMiklos Szeredi int err = -ENOMEM; 597ab508822SMiklos Szeredi char *tmp = kstrdup(name, GFP_KERNEL); 598ab508822SMiklos Szeredi 599ab508822SMiklos Szeredi if (tmp) { 600ab508822SMiklos Szeredi ovl_unescape(tmp); 601ab508822SMiklos Szeredi err = ovl_mount_dir_noesc(tmp, path); 6027c03b5d4SMiklos Szeredi 6037c03b5d4SMiklos Szeredi if (!err) 6047c03b5d4SMiklos Szeredi if (ovl_dentry_remote(path->dentry)) { 6057c03b5d4SMiklos Szeredi pr_err("overlayfs: filesystem on '%s' not supported as upperdir\n", 6067c03b5d4SMiklos Szeredi tmp); 6078aafcb59SMiklos Szeredi path_put_init(path); 6087c03b5d4SMiklos Szeredi err = -EINVAL; 6097c03b5d4SMiklos Szeredi } 610ab508822SMiklos Szeredi kfree(tmp); 611ab508822SMiklos Szeredi } 612ab508822SMiklos Szeredi return err; 613ab508822SMiklos Szeredi } 614ab508822SMiklos Szeredi 6156b2d5fe4SMiklos Szeredi static int ovl_check_namelen(struct path *path, struct ovl_fs *ofs, 6166b2d5fe4SMiklos Szeredi const char *name) 6176b2d5fe4SMiklos Szeredi { 6186b2d5fe4SMiklos Szeredi struct kstatfs statfs; 6196b2d5fe4SMiklos Szeredi int err = vfs_statfs(path, &statfs); 6206b2d5fe4SMiklos Szeredi 6216b2d5fe4SMiklos Szeredi if (err) 6226b2d5fe4SMiklos Szeredi pr_err("overlayfs: statfs failed on '%s'\n", name); 6236b2d5fe4SMiklos Szeredi else 6246b2d5fe4SMiklos Szeredi ofs->namelen = max(ofs->namelen, statfs.f_namelen); 6256b2d5fe4SMiklos Szeredi 6266b2d5fe4SMiklos Szeredi return err; 6276b2d5fe4SMiklos Szeredi } 6286b2d5fe4SMiklos Szeredi 6296b2d5fe4SMiklos Szeredi static int ovl_lower_dir(const char *name, struct path *path, 6306b2d5fe4SMiklos Szeredi struct ovl_fs *ofs, int *stack_depth, bool *remote) 631ab508822SMiklos Szeredi { 632ab508822SMiklos Szeredi int err; 633ab508822SMiklos Szeredi 634a78d9f0dSMiklos Szeredi err = ovl_mount_dir_noesc(name, path); 635ab508822SMiklos Szeredi if (err) 636ab508822SMiklos Szeredi goto out; 637ab508822SMiklos Szeredi 6386b2d5fe4SMiklos Szeredi err = ovl_check_namelen(path, ofs, name); 6396b2d5fe4SMiklos Szeredi if (err) 640ab508822SMiklos Szeredi goto out_put; 6416b2d5fe4SMiklos Szeredi 642ab508822SMiklos Szeredi *stack_depth = max(*stack_depth, path->mnt->mnt_sb->s_stack_depth); 643ab508822SMiklos Szeredi 6447c03b5d4SMiklos Szeredi if (ovl_dentry_remote(path->dentry)) 6457c03b5d4SMiklos Szeredi *remote = true; 6467c03b5d4SMiklos Szeredi 64702bcd157SAmir Goldstein /* 64802bcd157SAmir Goldstein * The inodes index feature needs to encode and decode file 64902bcd157SAmir Goldstein * handles, so it requires that all layers support them. 65002bcd157SAmir Goldstein */ 65102bcd157SAmir Goldstein if (ofs->config.index && !ovl_can_decode_fh(path->dentry->d_sb)) { 65202bcd157SAmir Goldstein ofs->config.index = false; 65302bcd157SAmir Goldstein pr_warn("overlayfs: fs on '%s' does not support file handles, falling back to index=off.\n", name); 65402bcd157SAmir Goldstein } 65502bcd157SAmir Goldstein 656ab508822SMiklos Szeredi return 0; 657ab508822SMiklos Szeredi 658ab508822SMiklos Szeredi out_put: 6598aafcb59SMiklos Szeredi path_put_init(path); 660ab508822SMiklos Szeredi out: 661ab508822SMiklos Szeredi return err; 662ab508822SMiklos Szeredi } 663ab508822SMiklos Szeredi 664e9be9d5eSMiklos Szeredi /* Workdir should not be subdir of upperdir and vice versa */ 665e9be9d5eSMiklos Szeredi static bool ovl_workdir_ok(struct dentry *workdir, struct dentry *upperdir) 666e9be9d5eSMiklos Szeredi { 667e9be9d5eSMiklos Szeredi bool ok = false; 668e9be9d5eSMiklos Szeredi 669e9be9d5eSMiklos Szeredi if (workdir != upperdir) { 670e9be9d5eSMiklos Szeredi ok = (lock_rename(workdir, upperdir) == NULL); 671e9be9d5eSMiklos Szeredi unlock_rename(workdir, upperdir); 672e9be9d5eSMiklos Szeredi } 673e9be9d5eSMiklos Szeredi return ok; 674e9be9d5eSMiklos Szeredi } 675e9be9d5eSMiklos Szeredi 676a78d9f0dSMiklos Szeredi static unsigned int ovl_split_lowerdirs(char *str) 677a78d9f0dSMiklos Szeredi { 678a78d9f0dSMiklos Szeredi unsigned int ctr = 1; 679a78d9f0dSMiklos Szeredi char *s, *d; 680a78d9f0dSMiklos Szeredi 681a78d9f0dSMiklos Szeredi for (s = d = str;; s++, d++) { 682a78d9f0dSMiklos Szeredi if (*s == '\\') { 683a78d9f0dSMiklos Szeredi s++; 684a78d9f0dSMiklos Szeredi } else if (*s == ':') { 685a78d9f0dSMiklos Szeredi *d = '\0'; 686a78d9f0dSMiklos Szeredi ctr++; 687a78d9f0dSMiklos Szeredi continue; 688a78d9f0dSMiklos Szeredi } 689a78d9f0dSMiklos Szeredi *d = *s; 690a78d9f0dSMiklos Szeredi if (!*s) 691a78d9f0dSMiklos Szeredi break; 692a78d9f0dSMiklos Szeredi } 693a78d9f0dSMiklos Szeredi return ctr; 694a78d9f0dSMiklos Szeredi } 695a78d9f0dSMiklos Szeredi 6960c97be22SAndreas Gruenbacher static int __maybe_unused 6970eb45fc3SAndreas Gruenbacher ovl_posix_acl_xattr_get(const struct xattr_handler *handler, 6980eb45fc3SAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 6990eb45fc3SAndreas Gruenbacher const char *name, void *buffer, size_t size) 7000eb45fc3SAndreas Gruenbacher { 7011d88f183SMiklos Szeredi return ovl_xattr_get(dentry, inode, handler->name, buffer, size); 7020eb45fc3SAndreas Gruenbacher } 7030eb45fc3SAndreas Gruenbacher 7040eb45fc3SAndreas Gruenbacher static int __maybe_unused 7050c97be22SAndreas Gruenbacher ovl_posix_acl_xattr_set(const struct xattr_handler *handler, 706d837a49bSMiklos Szeredi struct dentry *dentry, struct inode *inode, 707d837a49bSMiklos Szeredi const char *name, const void *value, 708d837a49bSMiklos Szeredi size_t size, int flags) 709d837a49bSMiklos Szeredi { 710d837a49bSMiklos Szeredi struct dentry *workdir = ovl_workdir(dentry); 71109d8b586SMiklos Szeredi struct inode *realinode = ovl_inode_real(inode); 712d837a49bSMiklos Szeredi struct posix_acl *acl = NULL; 713d837a49bSMiklos Szeredi int err; 714d837a49bSMiklos Szeredi 715d837a49bSMiklos Szeredi /* Check that everything is OK before copy-up */ 716d837a49bSMiklos Szeredi if (value) { 717d837a49bSMiklos Szeredi acl = posix_acl_from_xattr(&init_user_ns, value, size); 718d837a49bSMiklos Szeredi if (IS_ERR(acl)) 719d837a49bSMiklos Szeredi return PTR_ERR(acl); 720d837a49bSMiklos Szeredi } 721d837a49bSMiklos Szeredi err = -EOPNOTSUPP; 722d837a49bSMiklos Szeredi if (!IS_POSIXACL(d_inode(workdir))) 723d837a49bSMiklos Szeredi goto out_acl_release; 724d837a49bSMiklos Szeredi if (!realinode->i_op->set_acl) 725d837a49bSMiklos Szeredi goto out_acl_release; 726d837a49bSMiklos Szeredi if (handler->flags == ACL_TYPE_DEFAULT && !S_ISDIR(inode->i_mode)) { 727d837a49bSMiklos Szeredi err = acl ? -EACCES : 0; 728d837a49bSMiklos Szeredi goto out_acl_release; 729d837a49bSMiklos Szeredi } 730d837a49bSMiklos Szeredi err = -EPERM; 731d837a49bSMiklos Szeredi if (!inode_owner_or_capable(inode)) 732d837a49bSMiklos Szeredi goto out_acl_release; 733d837a49bSMiklos Szeredi 734d837a49bSMiklos Szeredi posix_acl_release(acl); 735d837a49bSMiklos Szeredi 736fd3220d3SMiklos Szeredi /* 737fd3220d3SMiklos Szeredi * Check if sgid bit needs to be cleared (actual setacl operation will 738fd3220d3SMiklos Szeredi * be done with mounter's capabilities and so that won't do it for us). 739fd3220d3SMiklos Szeredi */ 740fd3220d3SMiklos Szeredi if (unlikely(inode->i_mode & S_ISGID) && 741fd3220d3SMiklos Szeredi handler->flags == ACL_TYPE_ACCESS && 742fd3220d3SMiklos Szeredi !in_group_p(inode->i_gid) && 743fd3220d3SMiklos Szeredi !capable_wrt_inode_uidgid(inode, CAP_FSETID)) { 744fd3220d3SMiklos Szeredi struct iattr iattr = { .ia_valid = ATTR_KILL_SGID }; 745fd3220d3SMiklos Szeredi 746fd3220d3SMiklos Szeredi err = ovl_setattr(dentry, &iattr); 747fd3220d3SMiklos Szeredi if (err) 748fd3220d3SMiklos Szeredi return err; 749fd3220d3SMiklos Szeredi } 750fd3220d3SMiklos Szeredi 7511d88f183SMiklos Szeredi err = ovl_xattr_set(dentry, inode, handler->name, value, size, flags); 752ce31513aSMiklos Szeredi if (!err) 75309d8b586SMiklos Szeredi ovl_copyattr(ovl_inode_real(inode), inode); 754ce31513aSMiklos Szeredi 755ce31513aSMiklos Szeredi return err; 756d837a49bSMiklos Szeredi 757d837a49bSMiklos Szeredi out_acl_release: 758d837a49bSMiklos Szeredi posix_acl_release(acl); 759d837a49bSMiklos Szeredi return err; 760d837a49bSMiklos Szeredi } 761d837a49bSMiklos Szeredi 7620eb45fc3SAndreas Gruenbacher static int ovl_own_xattr_get(const struct xattr_handler *handler, 7630eb45fc3SAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 7640eb45fc3SAndreas Gruenbacher const char *name, void *buffer, size_t size) 7650eb45fc3SAndreas Gruenbacher { 76648fab5d7SAmir Goldstein return -EOPNOTSUPP; 7670eb45fc3SAndreas Gruenbacher } 7680eb45fc3SAndreas Gruenbacher 769d837a49bSMiklos Szeredi static int ovl_own_xattr_set(const struct xattr_handler *handler, 770d837a49bSMiklos Szeredi struct dentry *dentry, struct inode *inode, 771d837a49bSMiklos Szeredi const char *name, const void *value, 772d837a49bSMiklos Szeredi size_t size, int flags) 773d837a49bSMiklos Szeredi { 77448fab5d7SAmir Goldstein return -EOPNOTSUPP; 775d837a49bSMiklos Szeredi } 776d837a49bSMiklos Szeredi 7770eb45fc3SAndreas Gruenbacher static int ovl_other_xattr_get(const struct xattr_handler *handler, 7780eb45fc3SAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 7790eb45fc3SAndreas Gruenbacher const char *name, void *buffer, size_t size) 7800eb45fc3SAndreas Gruenbacher { 7811d88f183SMiklos Szeredi return ovl_xattr_get(dentry, inode, name, buffer, size); 7820eb45fc3SAndreas Gruenbacher } 7830eb45fc3SAndreas Gruenbacher 7840e585cccSAndreas Gruenbacher static int ovl_other_xattr_set(const struct xattr_handler *handler, 7850e585cccSAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 7860e585cccSAndreas Gruenbacher const char *name, const void *value, 7870e585cccSAndreas Gruenbacher size_t size, int flags) 7880e585cccSAndreas Gruenbacher { 7891d88f183SMiklos Szeredi return ovl_xattr_set(dentry, inode, name, value, size, flags); 7900e585cccSAndreas Gruenbacher } 7910e585cccSAndreas Gruenbacher 7920c97be22SAndreas Gruenbacher static const struct xattr_handler __maybe_unused 7930c97be22SAndreas Gruenbacher ovl_posix_acl_access_xattr_handler = { 794d837a49bSMiklos Szeredi .name = XATTR_NAME_POSIX_ACL_ACCESS, 795d837a49bSMiklos Szeredi .flags = ACL_TYPE_ACCESS, 7960eb45fc3SAndreas Gruenbacher .get = ovl_posix_acl_xattr_get, 797d837a49bSMiklos Szeredi .set = ovl_posix_acl_xattr_set, 798d837a49bSMiklos Szeredi }; 799d837a49bSMiklos Szeredi 8000c97be22SAndreas Gruenbacher static const struct xattr_handler __maybe_unused 8010c97be22SAndreas Gruenbacher ovl_posix_acl_default_xattr_handler = { 802d837a49bSMiklos Szeredi .name = XATTR_NAME_POSIX_ACL_DEFAULT, 803d837a49bSMiklos Szeredi .flags = ACL_TYPE_DEFAULT, 8040eb45fc3SAndreas Gruenbacher .get = ovl_posix_acl_xattr_get, 805d837a49bSMiklos Szeredi .set = ovl_posix_acl_xattr_set, 806d837a49bSMiklos Szeredi }; 807d837a49bSMiklos Szeredi 808d837a49bSMiklos Szeredi static const struct xattr_handler ovl_own_xattr_handler = { 809d837a49bSMiklos Szeredi .prefix = OVL_XATTR_PREFIX, 8100eb45fc3SAndreas Gruenbacher .get = ovl_own_xattr_get, 811d837a49bSMiklos Szeredi .set = ovl_own_xattr_set, 812d837a49bSMiklos Szeredi }; 813d837a49bSMiklos Szeredi 814d837a49bSMiklos Szeredi static const struct xattr_handler ovl_other_xattr_handler = { 815d837a49bSMiklos Szeredi .prefix = "", /* catch all */ 8160eb45fc3SAndreas Gruenbacher .get = ovl_other_xattr_get, 817d837a49bSMiklos Szeredi .set = ovl_other_xattr_set, 818d837a49bSMiklos Szeredi }; 819d837a49bSMiklos Szeredi 820d837a49bSMiklos Szeredi static const struct xattr_handler *ovl_xattr_handlers[] = { 8210c97be22SAndreas Gruenbacher #ifdef CONFIG_FS_POSIX_ACL 822d837a49bSMiklos Szeredi &ovl_posix_acl_access_xattr_handler, 823d837a49bSMiklos Szeredi &ovl_posix_acl_default_xattr_handler, 8240c97be22SAndreas Gruenbacher #endif 825d837a49bSMiklos Szeredi &ovl_own_xattr_handler, 826d837a49bSMiklos Szeredi &ovl_other_xattr_handler, 827d837a49bSMiklos Szeredi NULL 828d837a49bSMiklos Szeredi }; 829d837a49bSMiklos Szeredi 8306ee8acf0SMiklos Szeredi static int ovl_get_upperpath(struct ovl_fs *ufs, struct path *upperpath) 8316ee8acf0SMiklos Szeredi { 8326ee8acf0SMiklos Szeredi int err; 8336ee8acf0SMiklos Szeredi 8346ee8acf0SMiklos Szeredi err = ovl_mount_dir(ufs->config.upperdir, upperpath); 8356ee8acf0SMiklos Szeredi if (err) 8366ee8acf0SMiklos Szeredi goto out; 8376ee8acf0SMiklos Szeredi 8386ee8acf0SMiklos Szeredi /* Upper fs should not be r/o */ 8396ee8acf0SMiklos Szeredi if (sb_rdonly(upperpath->mnt->mnt_sb)) { 8406ee8acf0SMiklos Szeredi pr_err("overlayfs: upper fs is r/o, try multi-lower layers mount\n"); 8416ee8acf0SMiklos Szeredi err = -EINVAL; 8426ee8acf0SMiklos Szeredi goto out; 8436ee8acf0SMiklos Szeredi } 8446ee8acf0SMiklos Szeredi 8456ee8acf0SMiklos Szeredi err = ovl_check_namelen(upperpath, ufs, ufs->config.upperdir); 8466ee8acf0SMiklos Szeredi if (err) 8476ee8acf0SMiklos Szeredi goto out; 8486ee8acf0SMiklos Szeredi 8496ee8acf0SMiklos Szeredi err = -EBUSY; 8506ee8acf0SMiklos Szeredi if (ovl_inuse_trylock(upperpath->dentry)) { 8516ee8acf0SMiklos Szeredi ufs->upperdir_locked = true; 8526ee8acf0SMiklos Szeredi } else if (ufs->config.index) { 8536ee8acf0SMiklos Szeredi pr_err("overlayfs: upperdir is in-use by another mount, mount with '-o index=off' to override exclusive upperdir protection.\n"); 8546ee8acf0SMiklos Szeredi goto out; 8556ee8acf0SMiklos Szeredi } else { 8566ee8acf0SMiklos Szeredi pr_warn("overlayfs: upperdir is in-use by another mount, accessing files from both mounts will result in undefined behavior.\n"); 8576ee8acf0SMiklos Szeredi } 8586ee8acf0SMiklos Szeredi err = 0; 8596ee8acf0SMiklos Szeredi out: 8606ee8acf0SMiklos Szeredi return err; 8616ee8acf0SMiklos Szeredi } 8626ee8acf0SMiklos Szeredi 86387ad447aSMiklos Szeredi static int ovl_get_workpath(struct ovl_fs *ufs, struct path *upperpath, 86487ad447aSMiklos Szeredi struct path *workpath) 86587ad447aSMiklos Szeredi { 86687ad447aSMiklos Szeredi int err; 86787ad447aSMiklos Szeredi 86887ad447aSMiklos Szeredi err = ovl_mount_dir(ufs->config.workdir, workpath); 86987ad447aSMiklos Szeredi if (err) 87087ad447aSMiklos Szeredi goto out; 87187ad447aSMiklos Szeredi 87287ad447aSMiklos Szeredi err = -EINVAL; 87387ad447aSMiklos Szeredi if (upperpath->mnt != workpath->mnt) { 87487ad447aSMiklos Szeredi pr_err("overlayfs: workdir and upperdir must reside under the same mount\n"); 87587ad447aSMiklos Szeredi goto out; 87687ad447aSMiklos Szeredi } 87787ad447aSMiklos Szeredi if (!ovl_workdir_ok(workpath->dentry, upperpath->dentry)) { 87887ad447aSMiklos Szeredi pr_err("overlayfs: workdir and upperdir must be separate subtrees\n"); 87987ad447aSMiklos Szeredi goto out; 88087ad447aSMiklos Szeredi } 88187ad447aSMiklos Szeredi 88287ad447aSMiklos Szeredi err = -EBUSY; 88387ad447aSMiklos Szeredi if (ovl_inuse_trylock(workpath->dentry)) { 88487ad447aSMiklos Szeredi ufs->workdir_locked = true; 88587ad447aSMiklos Szeredi } else if (ufs->config.index) { 88687ad447aSMiklos Szeredi pr_err("overlayfs: workdir is in-use by another mount, mount with '-o index=off' to override exclusive workdir protection.\n"); 88787ad447aSMiklos Szeredi goto out; 88887ad447aSMiklos Szeredi } else { 88987ad447aSMiklos Szeredi pr_warn("overlayfs: workdir is in-use by another mount, accessing files from both mounts will result in undefined behavior.\n"); 89087ad447aSMiklos Szeredi } 89187ad447aSMiklos Szeredi 89287ad447aSMiklos Szeredi ufs->workbasedir = workpath->dentry; 89387ad447aSMiklos Szeredi err = 0; 89487ad447aSMiklos Szeredi out: 89587ad447aSMiklos Szeredi return err; 89687ad447aSMiklos Szeredi } 89787ad447aSMiklos Szeredi 89821a3b317SMiklos Szeredi static int ovl_get_upper(struct ovl_fs *ufs, struct path *upperpath) 89921a3b317SMiklos Szeredi { 90021a3b317SMiklos Szeredi struct vfsmount *upper_mnt; 90121a3b317SMiklos Szeredi 90221a3b317SMiklos Szeredi upper_mnt = clone_private_mount(upperpath); 90321a3b317SMiklos Szeredi if (IS_ERR(upper_mnt)) { 90421a3b317SMiklos Szeredi pr_err("overlayfs: failed to clone upperpath\n"); 90521a3b317SMiklos Szeredi return PTR_ERR(upper_mnt); 90621a3b317SMiklos Szeredi } 90721a3b317SMiklos Szeredi 90821a3b317SMiklos Szeredi /* Don't inherit atime flags */ 90921a3b317SMiklos Szeredi upper_mnt->mnt_flags &= ~(MNT_NOATIME | MNT_NODIRATIME | MNT_RELATIME); 91021a3b317SMiklos Szeredi ufs->upper_mnt = upper_mnt; 91121a3b317SMiklos Szeredi 91221a3b317SMiklos Szeredi return 0; 91321a3b317SMiklos Szeredi } 91421a3b317SMiklos Szeredi 91553dbb0b4SMiklos Szeredi static int ovl_get_lowerstack(struct super_block *sb, struct ovl_fs *ufs, 91653dbb0b4SMiklos Szeredi struct path **stackp, unsigned int *stacklenp) 91753dbb0b4SMiklos Szeredi { 91853dbb0b4SMiklos Szeredi int err; 91953dbb0b4SMiklos Szeredi char *lowertmp, *lower; 92053dbb0b4SMiklos Szeredi struct path *stack; 92153dbb0b4SMiklos Szeredi unsigned int stacklen, numlower, i; 92253dbb0b4SMiklos Szeredi bool remote = false; 92353dbb0b4SMiklos Szeredi 92453dbb0b4SMiklos Szeredi err = -ENOMEM; 92553dbb0b4SMiklos Szeredi lowertmp = kstrdup(ufs->config.lowerdir, GFP_KERNEL); 92653dbb0b4SMiklos Szeredi if (!lowertmp) 92753dbb0b4SMiklos Szeredi goto out; 92853dbb0b4SMiklos Szeredi 92953dbb0b4SMiklos Szeredi err = -EINVAL; 93053dbb0b4SMiklos Szeredi stacklen = ovl_split_lowerdirs(lowertmp); 93153dbb0b4SMiklos Szeredi if (stacklen > OVL_MAX_STACK) { 93253dbb0b4SMiklos Szeredi pr_err("overlayfs: too many lower directories, limit is %d\n", 93353dbb0b4SMiklos Szeredi OVL_MAX_STACK); 93453dbb0b4SMiklos Szeredi goto out; 93553dbb0b4SMiklos Szeredi } else if (!ufs->config.upperdir && stacklen == 1) { 93653dbb0b4SMiklos Szeredi pr_err("overlayfs: at least 2 lowerdir are needed while upperdir nonexistent\n"); 93753dbb0b4SMiklos Szeredi goto out; 93853dbb0b4SMiklos Szeredi } 93953dbb0b4SMiklos Szeredi 94053dbb0b4SMiklos Szeredi err = -ENOMEM; 94153dbb0b4SMiklos Szeredi stack = kcalloc(stacklen, sizeof(struct path), GFP_KERNEL); 94253dbb0b4SMiklos Szeredi if (!stack) 94353dbb0b4SMiklos Szeredi goto out; 94453dbb0b4SMiklos Szeredi 94553dbb0b4SMiklos Szeredi err = -EINVAL; 94653dbb0b4SMiklos Szeredi lower = lowertmp; 94753dbb0b4SMiklos Szeredi for (numlower = 0; numlower < stacklen; numlower++) { 94853dbb0b4SMiklos Szeredi err = ovl_lower_dir(lower, &stack[numlower], ufs, 94953dbb0b4SMiklos Szeredi &sb->s_stack_depth, &remote); 95053dbb0b4SMiklos Szeredi if (err) 95153dbb0b4SMiklos Szeredi goto out_free_stack; 95253dbb0b4SMiklos Szeredi 95353dbb0b4SMiklos Szeredi lower = strchr(lower, '\0') + 1; 95453dbb0b4SMiklos Szeredi } 95553dbb0b4SMiklos Szeredi 95653dbb0b4SMiklos Szeredi err = -EINVAL; 95753dbb0b4SMiklos Szeredi sb->s_stack_depth++; 95853dbb0b4SMiklos Szeredi if (sb->s_stack_depth > FILESYSTEM_MAX_STACK_DEPTH) { 95953dbb0b4SMiklos Szeredi pr_err("overlayfs: maximum fs stacking depth exceeded\n"); 96053dbb0b4SMiklos Szeredi goto out_free_stack; 96153dbb0b4SMiklos Szeredi } 96253dbb0b4SMiklos Szeredi 96353dbb0b4SMiklos Szeredi *stackp = stack; 96453dbb0b4SMiklos Szeredi *stacklenp = numlower; 96553dbb0b4SMiklos Szeredi 96653dbb0b4SMiklos Szeredi if (remote) 96753dbb0b4SMiklos Szeredi sb->s_d_op = &ovl_reval_dentry_operations; 96853dbb0b4SMiklos Szeredi else 96953dbb0b4SMiklos Szeredi sb->s_d_op = &ovl_dentry_operations; 97053dbb0b4SMiklos Szeredi 97153dbb0b4SMiklos Szeredi err = 0; 97253dbb0b4SMiklos Szeredi 97353dbb0b4SMiklos Szeredi out: 97453dbb0b4SMiklos Szeredi kfree(lowertmp); 97553dbb0b4SMiklos Szeredi return err; 97653dbb0b4SMiklos Szeredi 97753dbb0b4SMiklos Szeredi out_free_stack: 97853dbb0b4SMiklos Szeredi for (i = 0; i < numlower; i++) 97953dbb0b4SMiklos Szeredi path_put(&stack[i]); 98053dbb0b4SMiklos Szeredi kfree(stack); 98153dbb0b4SMiklos Szeredi goto out; 98253dbb0b4SMiklos Szeredi } 98353dbb0b4SMiklos Szeredi 984e9be9d5eSMiklos Szeredi static int ovl_fill_super(struct super_block *sb, void *data, int silent) 985e9be9d5eSMiklos Szeredi { 98633006cdfSKees Cook struct path upperpath = { }; 98733006cdfSKees Cook struct path workpath = { }; 988e9be9d5eSMiklos Szeredi struct dentry *root_dentry; 989e9be9d5eSMiklos Szeredi struct ovl_entry *oe; 990e9be9d5eSMiklos Szeredi struct ovl_fs *ufs; 991a78d9f0dSMiklos Szeredi struct path *stack = NULL; 99253dbb0b4SMiklos Szeredi unsigned int numlower = 0; 993dd662667SMiklos Szeredi unsigned int i; 99451f8f3c4SKonstantin Khlebnikov struct cred *cred; 995e9be9d5eSMiklos Szeredi int err; 996e9be9d5eSMiklos Szeredi 997f45827e8SErez Zadok err = -ENOMEM; 998f45827e8SErez Zadok ufs = kzalloc(sizeof(struct ovl_fs), GFP_KERNEL); 999f45827e8SErez Zadok if (!ufs) 1000e9be9d5eSMiklos Szeredi goto out; 1001e9be9d5eSMiklos Szeredi 1002688ea0e5SMiklos Szeredi ufs->config.redirect_dir = ovl_redirect_dir_def; 100302bcd157SAmir Goldstein ufs->config.index = ovl_index_def; 1004f45827e8SErez Zadok err = ovl_parse_opt((char *) data, &ufs->config); 1005f45827e8SErez Zadok if (err) 1006f45827e8SErez Zadok goto out_free_config; 1007f45827e8SErez Zadok 1008e9be9d5eSMiklos Szeredi err = -EINVAL; 100953a08cb9SMiklos Szeredi if (!ufs->config.lowerdir) { 101007f2af7bSKonstantin Khlebnikov if (!silent) 101153a08cb9SMiklos Szeredi pr_err("overlayfs: missing 'lowerdir'\n"); 101253a08cb9SMiklos Szeredi goto out_free_config; 101353a08cb9SMiklos Szeredi } 101453a08cb9SMiklos Szeredi 101553a08cb9SMiklos Szeredi sb->s_stack_depth = 0; 1016cf9a6784SMiklos Szeredi sb->s_maxbytes = MAX_LFS_FILESIZE; 101753a08cb9SMiklos Szeredi if (ufs->config.upperdir) { 101853a08cb9SMiklos Szeredi if (!ufs->config.workdir) { 101953a08cb9SMiklos Szeredi pr_err("overlayfs: missing 'workdir'\n"); 1020e9be9d5eSMiklos Szeredi goto out_free_config; 1021e9be9d5eSMiklos Szeredi } 1022e9be9d5eSMiklos Szeredi 10236ee8acf0SMiklos Szeredi err = ovl_get_upperpath(ufs, &upperpath); 1024e9be9d5eSMiklos Szeredi if (err) 10256ee8acf0SMiklos Szeredi goto out_unlock_upperdentry; 10262cac0c00SAmir Goldstein 102787ad447aSMiklos Szeredi err = ovl_get_workpath(ufs, &upperpath, &workpath); 1028e9be9d5eSMiklos Szeredi if (err) 102987ad447aSMiklos Szeredi goto out_unlock_workdentry; 10303b7a9a24SMiklos Szeredi 1031ab508822SMiklos Szeredi sb->s_stack_depth = upperpath.mnt->mnt_sb->s_stack_depth; 103253a08cb9SMiklos Szeredi } 103353dbb0b4SMiklos Szeredi err = ovl_get_lowerstack(sb, ufs, &stack, &numlower); 10343b7a9a24SMiklos Szeredi if (err) 103553dbb0b4SMiklos Szeredi goto out_unlock_workdentry; 103669c433edSMiklos Szeredi 103753a08cb9SMiklos Szeredi if (ufs->config.upperdir) { 103821a3b317SMiklos Szeredi err = ovl_get_upper(ufs, &upperpath); 103921a3b317SMiklos Szeredi if (err) 10403b7a9a24SMiklos Szeredi goto out_put_lowerpath; 1041d719e8f2SMiklos Szeredi 1042d719e8f2SMiklos Szeredi sb->s_time_gran = ufs->upper_mnt->mnt_sb->s_time_gran; 10433b7a9a24SMiklos Szeredi 10446b8aa129SAmir Goldstein ufs->workdir = ovl_workdir_create(sb, ufs, workpath.dentry, 10456b8aa129SAmir Goldstein OVL_WORKDIR_NAME, false); 104645aebeafSVivek Goyal /* 104745aebeafSVivek Goyal * Upper should support d_type, else whiteouts are visible. 104845aebeafSVivek Goyal * Given workdir and upper are on same fs, we can do 104921765194SVivek Goyal * iterate_dir() on workdir. This check requires successful 105021765194SVivek Goyal * creation of workdir in previous step. 105145aebeafSVivek Goyal */ 105221765194SVivek Goyal if (ufs->workdir) { 1053e7f52429SAmir Goldstein struct dentry *temp; 1054e7f52429SAmir Goldstein 105545aebeafSVivek Goyal err = ovl_check_d_type_supported(&workpath); 105645aebeafSVivek Goyal if (err < 0) 105745aebeafSVivek Goyal goto out_put_workdir; 105845aebeafSVivek Goyal 1059e7c0b599SVivek Goyal /* 1060e7c0b599SVivek Goyal * We allowed this configuration and don't want to 1061e7c0b599SVivek Goyal * break users over kernel upgrade. So warn instead 1062e7c0b599SVivek Goyal * of erroring out. 1063e7c0b599SVivek Goyal */ 1064e7c0b599SVivek Goyal if (!err) 1065e7c0b599SVivek Goyal pr_warn("overlayfs: upper fs needs to support d_type.\n"); 1066e7f52429SAmir Goldstein 1067e7f52429SAmir Goldstein /* Check if upper/work fs supports O_TMPFILE */ 1068e7f52429SAmir Goldstein temp = ovl_do_tmpfile(ufs->workdir, S_IFREG | 0); 1069e7f52429SAmir Goldstein ufs->tmpfile = !IS_ERR(temp); 1070e7f52429SAmir Goldstein if (ufs->tmpfile) 1071e7f52429SAmir Goldstein dput(temp); 1072e7f52429SAmir Goldstein else 1073e7f52429SAmir Goldstein pr_warn("overlayfs: upper fs does not support tmpfile.\n"); 107482b749b2SAmir Goldstein 107582b749b2SAmir Goldstein /* 107682b749b2SAmir Goldstein * Check if upper/work fs supports trusted.overlay.* 107782b749b2SAmir Goldstein * xattr 107882b749b2SAmir Goldstein */ 107982b749b2SAmir Goldstein err = ovl_do_setxattr(ufs->workdir, OVL_XATTR_OPAQUE, 108082b749b2SAmir Goldstein "0", 1, 0); 108182b749b2SAmir Goldstein if (err) { 108282b749b2SAmir Goldstein ufs->noxattr = true; 108382b749b2SAmir Goldstein pr_warn("overlayfs: upper fs does not support xattr.\n"); 108482b749b2SAmir Goldstein } else { 108582b749b2SAmir Goldstein vfs_removexattr(ufs->workdir, OVL_XATTR_OPAQUE); 108682b749b2SAmir Goldstein } 108702bcd157SAmir Goldstein 108802bcd157SAmir Goldstein /* Check if upper/work fs supports file handles */ 108902bcd157SAmir Goldstein if (ufs->config.index && 109002bcd157SAmir Goldstein !ovl_can_decode_fh(ufs->workdir->d_sb)) { 109102bcd157SAmir Goldstein ufs->config.index = false; 109202bcd157SAmir Goldstein pr_warn("overlayfs: upper fs does not support file handles, falling back to index=off.\n"); 109302bcd157SAmir Goldstein } 109453a08cb9SMiklos Szeredi } 109521765194SVivek Goyal } 1096e9be9d5eSMiklos Szeredi 10972f83fd8cShujianyang err = -ENOMEM; 1098b9343632SChandan Rajendra ufs->lower_layers = kcalloc(numlower, sizeof(struct ovl_layer), 1099b9343632SChandan Rajendra GFP_KERNEL); 1100b9343632SChandan Rajendra if (ufs->lower_layers == NULL) 11013b7a9a24SMiklos Szeredi goto out_put_workdir; 1102a78d9f0dSMiklos Szeredi for (i = 0; i < numlower; i++) { 1103b9343632SChandan Rajendra struct vfsmount *mnt; 11042a9c6d06SChandan Rajendra dev_t dev; 11052a9c6d06SChandan Rajendra 11062a9c6d06SChandan Rajendra err = get_anon_bdev(&dev); 11072a9c6d06SChandan Rajendra if (err) { 11082a9c6d06SChandan Rajendra pr_err("overlayfs: failed to get anonymous bdev for lowerpath\n"); 11092a9c6d06SChandan Rajendra goto out_put_lower_layers; 11102a9c6d06SChandan Rajendra } 1111dd662667SMiklos Szeredi 1112b9343632SChandan Rajendra mnt = clone_private_mount(&stack[i]); 11132f83fd8cShujianyang err = PTR_ERR(mnt); 1114dd662667SMiklos Szeredi if (IS_ERR(mnt)) { 1115dd662667SMiklos Szeredi pr_err("overlayfs: failed to clone lowerpath\n"); 11162a9c6d06SChandan Rajendra free_anon_bdev(dev); 1117b9343632SChandan Rajendra goto out_put_lower_layers; 1118e9be9d5eSMiklos Szeredi } 1119dd662667SMiklos Szeredi /* 1120b9343632SChandan Rajendra * Make lower layers R/O. That way fchmod/fchown on lower file 1121dd662667SMiklos Szeredi * will fail instead of modifying lower fs. 1122dd662667SMiklos Szeredi */ 1123d719e8f2SMiklos Szeredi mnt->mnt_flags |= MNT_READONLY | MNT_NOATIME; 1124dd662667SMiklos Szeredi 1125b9343632SChandan Rajendra ufs->lower_layers[ufs->numlower].mnt = mnt; 11262a9c6d06SChandan Rajendra ufs->lower_layers[ufs->numlower].pseudo_dev = dev; 1127a78d9f0dSMiklos Szeredi ufs->numlower++; 11287bcd74b9SAmir Goldstein 11297bcd74b9SAmir Goldstein /* Check if all lower layers are on same sb */ 11307bcd74b9SAmir Goldstein if (i == 0) 11317bcd74b9SAmir Goldstein ufs->same_sb = mnt->mnt_sb; 11327bcd74b9SAmir Goldstein else if (ufs->same_sb != mnt->mnt_sb) 11337bcd74b9SAmir Goldstein ufs->same_sb = NULL; 1134a78d9f0dSMiklos Szeredi } 1135e9be9d5eSMiklos Szeredi 113671cbad7eShujianyang /* If the upper fs is nonexistent, we mark overlayfs r/o too */ 113771cbad7eShujianyang if (!ufs->upper_mnt) 1138e9be9d5eSMiklos Szeredi sb->s_flags |= MS_RDONLY; 11397bcd74b9SAmir Goldstein else if (ufs->upper_mnt->mnt_sb != ufs->same_sb) 11407bcd74b9SAmir Goldstein ufs->same_sb = NULL; 1141e9be9d5eSMiklos Szeredi 1142b9343632SChandan Rajendra err = -ENOMEM; 1143b9343632SChandan Rajendra oe = ovl_alloc_entry(numlower); 1144b9343632SChandan Rajendra if (!oe) 1145b9343632SChandan Rajendra goto out_put_lower_layers; 1146b9343632SChandan Rajendra 1147b9343632SChandan Rajendra for (i = 0; i < numlower; i++) { 1148b9343632SChandan Rajendra oe->lowerstack[i].dentry = stack[i].dentry; 1149b9343632SChandan Rajendra oe->lowerstack[i].layer = &(ufs->lower_layers[i]); 1150b9343632SChandan Rajendra } 1151b9343632SChandan Rajendra 115202bcd157SAmir Goldstein if (!(ovl_force_readonly(ufs)) && ufs->config.index) { 11538b88a2e6SAmir Goldstein /* Verify lower root is upper root origin */ 1154b9343632SChandan Rajendra err = ovl_verify_origin(upperpath.dentry, 1155b9343632SChandan Rajendra oe->lowerstack[0].layer->mnt, 1156b9343632SChandan Rajendra oe->lowerstack[0].dentry, 1157b9343632SChandan Rajendra false, true); 11588b88a2e6SAmir Goldstein if (err) { 11598b88a2e6SAmir Goldstein pr_err("overlayfs: failed to verify upper root origin\n"); 1160b9343632SChandan Rajendra goto out_free_oe; 11618b88a2e6SAmir Goldstein } 11628b88a2e6SAmir Goldstein 116302bcd157SAmir Goldstein ufs->indexdir = ovl_workdir_create(sb, ufs, workpath.dentry, 116402bcd157SAmir Goldstein OVL_INDEXDIR_NAME, true); 116554fb347eSAmir Goldstein if (ufs->indexdir) { 116654fb347eSAmir Goldstein /* Verify upper root is index dir origin */ 116754fb347eSAmir Goldstein err = ovl_verify_origin(ufs->indexdir, ufs->upper_mnt, 116854fb347eSAmir Goldstein upperpath.dentry, true, true); 116954fb347eSAmir Goldstein if (err) 117054fb347eSAmir Goldstein pr_err("overlayfs: failed to verify index dir origin\n"); 1171415543d5SAmir Goldstein 1172caf70cb2SAmir Goldstein /* Cleanup bad/stale/orphan index entries */ 1173415543d5SAmir Goldstein if (!err) 1174415543d5SAmir Goldstein err = ovl_indexdir_cleanup(ufs->indexdir, 1175415543d5SAmir Goldstein ufs->upper_mnt, 1176b9343632SChandan Rajendra oe->lowerstack, 1177b9343632SChandan Rajendra numlower); 117854fb347eSAmir Goldstein } 117954fb347eSAmir Goldstein if (err || !ufs->indexdir) 118002bcd157SAmir Goldstein pr_warn("overlayfs: try deleting index dir or mounting with '-o index=off' to disable inodes index.\n"); 118154fb347eSAmir Goldstein if (err) 118254fb347eSAmir Goldstein goto out_put_indexdir; 118302bcd157SAmir Goldstein } 118402bcd157SAmir Goldstein 118502bcd157SAmir Goldstein /* Show index=off/on in /proc/mounts for any of the reasons above */ 118602bcd157SAmir Goldstein if (!ufs->indexdir) 118702bcd157SAmir Goldstein ufs->config.index = false; 118802bcd157SAmir Goldstein 11898fc646b4SAmir Goldstein err = -ENOMEM; 119051f8f3c4SKonstantin Khlebnikov ufs->creator_cred = cred = prepare_creds(); 119151f8f3c4SKonstantin Khlebnikov if (!cred) 119202bcd157SAmir Goldstein goto out_put_indexdir; 11933fe6e52fSAntonio Murdaca 119451f8f3c4SKonstantin Khlebnikov /* Never override disk quota limits or use reserved space */ 119551f8f3c4SKonstantin Khlebnikov cap_lower(cred->cap_effective, CAP_SYS_RESOURCE); 119651f8f3c4SKonstantin Khlebnikov 1197655042ccSVivek Goyal sb->s_magic = OVERLAYFS_SUPER_MAGIC; 1198655042ccSVivek Goyal sb->s_op = &ovl_super_operations; 1199655042ccSVivek Goyal sb->s_xattr = ovl_xattr_handlers; 1200655042ccSVivek Goyal sb->s_fs_info = ufs; 1201655042ccSVivek Goyal sb->s_flags |= MS_POSIXACL | MS_NOREMOTELOCK; 1202655042ccSVivek Goyal 1203ca4c8a3aSMiklos Szeredi root_dentry = d_make_root(ovl_new_inode(sb, S_IFDIR, 0)); 1204e9be9d5eSMiklos Szeredi if (!root_dentry) 1205b9343632SChandan Rajendra goto out_put_cred; 1206e9be9d5eSMiklos Szeredi 1207e9be9d5eSMiklos Szeredi mntput(upperpath.mnt); 1208a78d9f0dSMiklos Szeredi for (i = 0; i < numlower; i++) 1209a78d9f0dSMiklos Szeredi mntput(stack[i].mnt); 1210b9343632SChandan Rajendra kfree(stack); 12112cac0c00SAmir Goldstein mntput(workpath.mnt); 1212e9be9d5eSMiklos Szeredi 1213f3a15685SAmir Goldstein if (upperpath.dentry) { 121455acc661SMiklos Szeredi oe->has_upper = true; 121513c72075SMiklos Szeredi if (ovl_is_impuredir(upperpath.dentry)) 121613c72075SMiklos Szeredi ovl_set_flag(OVL_IMPURE, d_inode(root_dentry)); 1217f3a15685SAmir Goldstein } 1218e9be9d5eSMiklos Szeredi 1219e9be9d5eSMiklos Szeredi root_dentry->d_fsdata = oe; 1220e9be9d5eSMiklos Szeredi 1221b79e05aaSAmir Goldstein /* Root is always merge -> can have whiteouts */ 1222b79e05aaSAmir Goldstein ovl_set_flag(OVL_WHITEOUTS, d_inode(root_dentry)); 122309d8b586SMiklos Szeredi ovl_inode_init(d_inode(root_dentry), upperpath.dentry, 122409d8b586SMiklos Szeredi ovl_dentry_lower(root_dentry)); 1225ed06e069SMiklos Szeredi 1226e9be9d5eSMiklos Szeredi sb->s_root = root_dentry; 1227e9be9d5eSMiklos Szeredi 1228e9be9d5eSMiklos Szeredi return 0; 1229e9be9d5eSMiklos Szeredi 12303fe6e52fSAntonio Murdaca out_put_cred: 12313fe6e52fSAntonio Murdaca put_cred(ufs->creator_cred); 123202bcd157SAmir Goldstein out_put_indexdir: 123302bcd157SAmir Goldstein dput(ufs->indexdir); 1234b9343632SChandan Rajendra out_free_oe: 1235b9343632SChandan Rajendra kfree(oe); 1236b9343632SChandan Rajendra out_put_lower_layers: 12372a9c6d06SChandan Rajendra for (i = 0; i < ufs->numlower; i++) { 12382a9c6d06SChandan Rajendra if (ufs->lower_layers[i].mnt) 12392a9c6d06SChandan Rajendra free_anon_bdev(ufs->lower_layers[i].pseudo_dev); 1240b9343632SChandan Rajendra mntput(ufs->lower_layers[i].mnt); 12412a9c6d06SChandan Rajendra } 1242b9343632SChandan Rajendra kfree(ufs->lower_layers); 12433b7a9a24SMiklos Szeredi out_put_workdir: 12443b7a9a24SMiklos Szeredi dput(ufs->workdir); 1245e9be9d5eSMiklos Szeredi mntput(ufs->upper_mnt); 1246e9be9d5eSMiklos Szeredi out_put_lowerpath: 1247a78d9f0dSMiklos Szeredi for (i = 0; i < numlower; i++) 1248a78d9f0dSMiklos Szeredi path_put(&stack[i]); 1249a78d9f0dSMiklos Szeredi kfree(stack); 12502cac0c00SAmir Goldstein out_unlock_workdentry: 125185fdee1eSAmir Goldstein if (ufs->workdir_locked) 12522cac0c00SAmir Goldstein ovl_inuse_unlock(workpath.dentry); 12533b7a9a24SMiklos Szeredi path_put(&workpath); 12542cac0c00SAmir Goldstein out_unlock_upperdentry: 125585fdee1eSAmir Goldstein if (ufs->upperdir_locked) 12562cac0c00SAmir Goldstein ovl_inuse_unlock(upperpath.dentry); 1257e9be9d5eSMiklos Szeredi path_put(&upperpath); 1258e9be9d5eSMiklos Szeredi out_free_config: 1259f45827e8SErez Zadok kfree(ufs->config.lowerdir); 1260f45827e8SErez Zadok kfree(ufs->config.upperdir); 1261f45827e8SErez Zadok kfree(ufs->config.workdir); 1262f45827e8SErez Zadok kfree(ufs); 1263e9be9d5eSMiklos Szeredi out: 1264e9be9d5eSMiklos Szeredi return err; 1265e9be9d5eSMiklos Szeredi } 1266e9be9d5eSMiklos Szeredi 1267e9be9d5eSMiklos Szeredi static struct dentry *ovl_mount(struct file_system_type *fs_type, int flags, 1268e9be9d5eSMiklos Szeredi const char *dev_name, void *raw_data) 1269e9be9d5eSMiklos Szeredi { 1270e9be9d5eSMiklos Szeredi return mount_nodev(fs_type, flags, raw_data, ovl_fill_super); 1271e9be9d5eSMiklos Szeredi } 1272e9be9d5eSMiklos Szeredi 1273e9be9d5eSMiklos Szeredi static struct file_system_type ovl_fs_type = { 1274e9be9d5eSMiklos Szeredi .owner = THIS_MODULE, 1275ef94b186SMiklos Szeredi .name = "overlay", 1276e9be9d5eSMiklos Szeredi .mount = ovl_mount, 1277e9be9d5eSMiklos Szeredi .kill_sb = kill_anon_super, 1278e9be9d5eSMiklos Szeredi }; 1279ef94b186SMiklos Szeredi MODULE_ALIAS_FS("overlay"); 1280e9be9d5eSMiklos Szeredi 128113cf199dSAmir Goldstein static void ovl_inode_init_once(void *foo) 128213cf199dSAmir Goldstein { 128313cf199dSAmir Goldstein struct ovl_inode *oi = foo; 128413cf199dSAmir Goldstein 128513cf199dSAmir Goldstein inode_init_once(&oi->vfs_inode); 128613cf199dSAmir Goldstein } 128713cf199dSAmir Goldstein 1288e9be9d5eSMiklos Szeredi static int __init ovl_init(void) 1289e9be9d5eSMiklos Szeredi { 129013cf199dSAmir Goldstein int err; 129113cf199dSAmir Goldstein 129213cf199dSAmir Goldstein ovl_inode_cachep = kmem_cache_create("ovl_inode", 129313cf199dSAmir Goldstein sizeof(struct ovl_inode), 0, 129413cf199dSAmir Goldstein (SLAB_RECLAIM_ACCOUNT| 129513cf199dSAmir Goldstein SLAB_MEM_SPREAD|SLAB_ACCOUNT), 129613cf199dSAmir Goldstein ovl_inode_init_once); 129713cf199dSAmir Goldstein if (ovl_inode_cachep == NULL) 129813cf199dSAmir Goldstein return -ENOMEM; 129913cf199dSAmir Goldstein 130013cf199dSAmir Goldstein err = register_filesystem(&ovl_fs_type); 130113cf199dSAmir Goldstein if (err) 130213cf199dSAmir Goldstein kmem_cache_destroy(ovl_inode_cachep); 130313cf199dSAmir Goldstein 130413cf199dSAmir Goldstein return err; 1305e9be9d5eSMiklos Szeredi } 1306e9be9d5eSMiklos Szeredi 1307e9be9d5eSMiklos Szeredi static void __exit ovl_exit(void) 1308e9be9d5eSMiklos Szeredi { 1309e9be9d5eSMiklos Szeredi unregister_filesystem(&ovl_fs_type); 131013cf199dSAmir Goldstein 131113cf199dSAmir Goldstein /* 131213cf199dSAmir Goldstein * Make sure all delayed rcu free inodes are flushed before we 131313cf199dSAmir Goldstein * destroy cache. 131413cf199dSAmir Goldstein */ 131513cf199dSAmir Goldstein rcu_barrier(); 131613cf199dSAmir Goldstein kmem_cache_destroy(ovl_inode_cachep); 131713cf199dSAmir Goldstein 1318e9be9d5eSMiklos Szeredi } 1319e9be9d5eSMiklos Szeredi 1320e9be9d5eSMiklos Szeredi module_init(ovl_init); 1321e9be9d5eSMiklos Szeredi module_exit(ovl_exit); 1322