1e9be9d5eSMiklos Szeredi /* 2e9be9d5eSMiklos Szeredi * 3e9be9d5eSMiklos Szeredi * Copyright (C) 2011 Novell Inc. 4e9be9d5eSMiklos Szeredi * 5e9be9d5eSMiklos Szeredi * This program is free software; you can redistribute it and/or modify it 6e9be9d5eSMiklos Szeredi * under the terms of the GNU General Public License version 2 as published by 7e9be9d5eSMiklos Szeredi * the Free Software Foundation. 8e9be9d5eSMiklos Szeredi */ 9e9be9d5eSMiklos Szeredi 105b825c3aSIngo Molnar #include <uapi/linux/magic.h> 11e9be9d5eSMiklos Szeredi #include <linux/fs.h> 12e9be9d5eSMiklos Szeredi #include <linux/namei.h> 13e9be9d5eSMiklos Szeredi #include <linux/xattr.h> 14e9be9d5eSMiklos Szeredi #include <linux/mount.h> 15e9be9d5eSMiklos Szeredi #include <linux/parser.h> 16e9be9d5eSMiklos Szeredi #include <linux/module.h> 17cc259639SAndy Whitcroft #include <linux/statfs.h> 18f45827e8SErez Zadok #include <linux/seq_file.h> 19d837a49bSMiklos Szeredi #include <linux/posix_acl_xattr.h> 20e9be9d5eSMiklos Szeredi #include "overlayfs.h" 21e9be9d5eSMiklos Szeredi 22e9be9d5eSMiklos Szeredi MODULE_AUTHOR("Miklos Szeredi <miklos@szeredi.hu>"); 23e9be9d5eSMiklos Szeredi MODULE_DESCRIPTION("Overlay filesystem"); 24e9be9d5eSMiklos Szeredi MODULE_LICENSE("GPL"); 25e9be9d5eSMiklos Szeredi 26e9be9d5eSMiklos Szeredi 27e9be9d5eSMiklos Szeredi struct ovl_dir_cache; 28e9be9d5eSMiklos Szeredi 29a78d9f0dSMiklos Szeredi #define OVL_MAX_STACK 500 30a78d9f0dSMiklos Szeredi 31688ea0e5SMiklos Szeredi static bool ovl_redirect_dir_def = IS_ENABLED(CONFIG_OVERLAY_FS_REDIRECT_DIR); 32688ea0e5SMiklos Szeredi module_param_named(redirect_dir, ovl_redirect_dir_def, bool, 0644); 33688ea0e5SMiklos Szeredi MODULE_PARM_DESC(ovl_redirect_dir_def, 34688ea0e5SMiklos Szeredi "Default to on or off for the redirect_dir feature"); 35e9be9d5eSMiklos Szeredi 36438c84c2SMiklos Szeredi static bool ovl_redirect_always_follow = 37438c84c2SMiklos Szeredi IS_ENABLED(CONFIG_OVERLAY_FS_REDIRECT_ALWAYS_FOLLOW); 38438c84c2SMiklos Szeredi module_param_named(redirect_always_follow, ovl_redirect_always_follow, 39438c84c2SMiklos Szeredi bool, 0644); 40438c84c2SMiklos Szeredi MODULE_PARM_DESC(ovl_redirect_always_follow, 41438c84c2SMiklos Szeredi "Follow redirects even if redirect_dir feature is turned off"); 42438c84c2SMiklos Szeredi 4302bcd157SAmir Goldstein static bool ovl_index_def = IS_ENABLED(CONFIG_OVERLAY_FS_INDEX); 4402bcd157SAmir Goldstein module_param_named(index, ovl_index_def, bool, 0644); 4502bcd157SAmir Goldstein MODULE_PARM_DESC(ovl_index_def, 4602bcd157SAmir Goldstein "Default to on or off for the inodes index feature"); 4702bcd157SAmir Goldstein 484155c10aSMiklos Szeredi static void ovl_entry_stack_free(struct ovl_entry *oe) 494155c10aSMiklos Szeredi { 504155c10aSMiklos Szeredi unsigned int i; 514155c10aSMiklos Szeredi 524155c10aSMiklos Szeredi for (i = 0; i < oe->numlower; i++) 534155c10aSMiklos Szeredi dput(oe->lowerstack[i].dentry); 544155c10aSMiklos Szeredi } 554155c10aSMiklos Szeredi 56e9be9d5eSMiklos Szeredi static void ovl_dentry_release(struct dentry *dentry) 57e9be9d5eSMiklos Szeredi { 58e9be9d5eSMiklos Szeredi struct ovl_entry *oe = dentry->d_fsdata; 59e9be9d5eSMiklos Szeredi 60e9be9d5eSMiklos Szeredi if (oe) { 614155c10aSMiklos Szeredi ovl_entry_stack_free(oe); 62e9be9d5eSMiklos Szeredi kfree_rcu(oe, rcu); 63e9be9d5eSMiklos Szeredi } 64e9be9d5eSMiklos Szeredi } 65e9be9d5eSMiklos Szeredi 66b0990fbbSAmir Goldstein static int ovl_check_append_only(struct inode *inode, int flag) 67b0990fbbSAmir Goldstein { 68b0990fbbSAmir Goldstein /* 69b0990fbbSAmir Goldstein * This test was moot in vfs may_open() because overlay inode does 70b0990fbbSAmir Goldstein * not have the S_APPEND flag, so re-check on real upper inode 71b0990fbbSAmir Goldstein */ 72b0990fbbSAmir Goldstein if (IS_APPEND(inode)) { 73b0990fbbSAmir Goldstein if ((flag & O_ACCMODE) != O_RDONLY && !(flag & O_APPEND)) 74b0990fbbSAmir Goldstein return -EPERM; 75b0990fbbSAmir Goldstein if (flag & O_TRUNC) 76b0990fbbSAmir Goldstein return -EPERM; 77b0990fbbSAmir Goldstein } 78b0990fbbSAmir Goldstein 79b0990fbbSAmir Goldstein return 0; 80b0990fbbSAmir Goldstein } 81b0990fbbSAmir Goldstein 822d902671SMiklos Szeredi static struct dentry *ovl_d_real(struct dentry *dentry, 832d902671SMiklos Szeredi const struct inode *inode, 84495e6429SMiklos Szeredi unsigned int open_flags, unsigned int flags) 85d101a125SMiklos Szeredi { 86d101a125SMiklos Szeredi struct dentry *real; 87b0990fbbSAmir Goldstein int err; 88d101a125SMiklos Szeredi 89cd91304eSMiklos Szeredi if (flags & D_REAL_UPPER) 90cd91304eSMiklos Szeredi return ovl_dentry_upper(dentry); 91cd91304eSMiklos Szeredi 92ca4c8a3aSMiklos Szeredi if (!d_is_reg(dentry)) { 93d101a125SMiklos Szeredi if (!inode || inode == d_inode(dentry)) 94d101a125SMiklos Szeredi return dentry; 95d101a125SMiklos Szeredi goto bug; 96d101a125SMiklos Szeredi } 97d101a125SMiklos Szeredi 982d902671SMiklos Szeredi if (open_flags) { 99b0990fbbSAmir Goldstein err = ovl_open_maybe_copy_up(dentry, open_flags); 1002d902671SMiklos Szeredi if (err) 1012d902671SMiklos Szeredi return ERR_PTR(err); 1022d902671SMiklos Szeredi } 1032d902671SMiklos Szeredi 104d101a125SMiklos Szeredi real = ovl_dentry_upper(dentry); 105b0990fbbSAmir Goldstein if (real && (!inode || inode == d_inode(real))) { 106b0990fbbSAmir Goldstein if (!inode) { 107b0990fbbSAmir Goldstein err = ovl_check_append_only(d_inode(real), open_flags); 108b0990fbbSAmir Goldstein if (err) 109b0990fbbSAmir Goldstein return ERR_PTR(err); 110b0990fbbSAmir Goldstein } 111d101a125SMiklos Szeredi return real; 112b0990fbbSAmir Goldstein } 113d101a125SMiklos Szeredi 114d101a125SMiklos Szeredi real = ovl_dentry_lower(dentry); 115d101a125SMiklos Szeredi if (!real) 116d101a125SMiklos Szeredi goto bug; 117d101a125SMiklos Szeredi 118c4fcfc16SMiklos Szeredi /* Handle recursion */ 119495e6429SMiklos Szeredi real = d_real(real, inode, open_flags, 0); 120c4fcfc16SMiklos Szeredi 121d101a125SMiklos Szeredi if (!inode || inode == d_inode(real)) 122d101a125SMiklos Szeredi return real; 123d101a125SMiklos Szeredi bug: 124656189d2SMiklos Szeredi WARN(1, "ovl_d_real(%pd4, %s:%lu): real dentry not found\n", dentry, 125d101a125SMiklos Szeredi inode ? inode->i_sb->s_id : "NULL", inode ? inode->i_ino : 0); 126d101a125SMiklos Szeredi return dentry; 127d101a125SMiklos Szeredi } 128d101a125SMiklos Szeredi 1297c03b5d4SMiklos Szeredi static int ovl_dentry_revalidate(struct dentry *dentry, unsigned int flags) 1307c03b5d4SMiklos Szeredi { 1317c03b5d4SMiklos Szeredi struct ovl_entry *oe = dentry->d_fsdata; 1327c03b5d4SMiklos Szeredi unsigned int i; 1337c03b5d4SMiklos Szeredi int ret = 1; 1347c03b5d4SMiklos Szeredi 1357c03b5d4SMiklos Szeredi for (i = 0; i < oe->numlower; i++) { 1367c03b5d4SMiklos Szeredi struct dentry *d = oe->lowerstack[i].dentry; 1377c03b5d4SMiklos Szeredi 1387c03b5d4SMiklos Szeredi if (d->d_flags & DCACHE_OP_REVALIDATE) { 1397c03b5d4SMiklos Szeredi ret = d->d_op->d_revalidate(d, flags); 1407c03b5d4SMiklos Szeredi if (ret < 0) 1417c03b5d4SMiklos Szeredi return ret; 1427c03b5d4SMiklos Szeredi if (!ret) { 1437c03b5d4SMiklos Szeredi if (!(flags & LOOKUP_RCU)) 1447c03b5d4SMiklos Szeredi d_invalidate(d); 1457c03b5d4SMiklos Szeredi return -ESTALE; 1467c03b5d4SMiklos Szeredi } 1477c03b5d4SMiklos Szeredi } 1487c03b5d4SMiklos Szeredi } 1497c03b5d4SMiklos Szeredi return 1; 1507c03b5d4SMiklos Szeredi } 1517c03b5d4SMiklos Szeredi 1527c03b5d4SMiklos Szeredi static int ovl_dentry_weak_revalidate(struct dentry *dentry, unsigned int flags) 1537c03b5d4SMiklos Szeredi { 1547c03b5d4SMiklos Szeredi struct ovl_entry *oe = dentry->d_fsdata; 1557c03b5d4SMiklos Szeredi unsigned int i; 1567c03b5d4SMiklos Szeredi int ret = 1; 1577c03b5d4SMiklos Szeredi 1587c03b5d4SMiklos Szeredi for (i = 0; i < oe->numlower; i++) { 1597c03b5d4SMiklos Szeredi struct dentry *d = oe->lowerstack[i].dentry; 1607c03b5d4SMiklos Szeredi 1617c03b5d4SMiklos Szeredi if (d->d_flags & DCACHE_OP_WEAK_REVALIDATE) { 1627c03b5d4SMiklos Szeredi ret = d->d_op->d_weak_revalidate(d, flags); 1637c03b5d4SMiklos Szeredi if (ret <= 0) 1647c03b5d4SMiklos Szeredi break; 1657c03b5d4SMiklos Szeredi } 1667c03b5d4SMiklos Szeredi } 1677c03b5d4SMiklos Szeredi return ret; 1687c03b5d4SMiklos Szeredi } 1697c03b5d4SMiklos Szeredi 170e9be9d5eSMiklos Szeredi static const struct dentry_operations ovl_dentry_operations = { 171e9be9d5eSMiklos Szeredi .d_release = ovl_dentry_release, 172d101a125SMiklos Szeredi .d_real = ovl_d_real, 173e9be9d5eSMiklos Szeredi }; 174e9be9d5eSMiklos Szeredi 1757c03b5d4SMiklos Szeredi static const struct dentry_operations ovl_reval_dentry_operations = { 1767c03b5d4SMiklos Szeredi .d_release = ovl_dentry_release, 177d101a125SMiklos Szeredi .d_real = ovl_d_real, 1787c03b5d4SMiklos Szeredi .d_revalidate = ovl_dentry_revalidate, 1797c03b5d4SMiklos Szeredi .d_weak_revalidate = ovl_dentry_weak_revalidate, 1807c03b5d4SMiklos Szeredi }; 1817c03b5d4SMiklos Szeredi 18213cf199dSAmir Goldstein static struct kmem_cache *ovl_inode_cachep; 18313cf199dSAmir Goldstein 18413cf199dSAmir Goldstein static struct inode *ovl_alloc_inode(struct super_block *sb) 18513cf199dSAmir Goldstein { 18613cf199dSAmir Goldstein struct ovl_inode *oi = kmem_cache_alloc(ovl_inode_cachep, GFP_KERNEL); 18713cf199dSAmir Goldstein 188b3885bd6SHirofumi Nakagawa if (!oi) 189b3885bd6SHirofumi Nakagawa return NULL; 190b3885bd6SHirofumi Nakagawa 19104a01ac7SMiklos Szeredi oi->cache = NULL; 192cf31c463SMiklos Szeredi oi->redirect = NULL; 19304a01ac7SMiklos Szeredi oi->version = 0; 19413c72075SMiklos Szeredi oi->flags = 0; 19509d8b586SMiklos Szeredi oi->__upperdentry = NULL; 19625b7713aSMiklos Szeredi oi->lower = NULL; 197a015dafcSAmir Goldstein mutex_init(&oi->lock); 19825b7713aSMiklos Szeredi 19913cf199dSAmir Goldstein return &oi->vfs_inode; 20013cf199dSAmir Goldstein } 20113cf199dSAmir Goldstein 20213cf199dSAmir Goldstein static void ovl_i_callback(struct rcu_head *head) 20313cf199dSAmir Goldstein { 20413cf199dSAmir Goldstein struct inode *inode = container_of(head, struct inode, i_rcu); 20513cf199dSAmir Goldstein 20613cf199dSAmir Goldstein kmem_cache_free(ovl_inode_cachep, OVL_I(inode)); 20713cf199dSAmir Goldstein } 20813cf199dSAmir Goldstein 20913cf199dSAmir Goldstein static void ovl_destroy_inode(struct inode *inode) 21013cf199dSAmir Goldstein { 21109d8b586SMiklos Szeredi struct ovl_inode *oi = OVL_I(inode); 21209d8b586SMiklos Szeredi 21309d8b586SMiklos Szeredi dput(oi->__upperdentry); 214cf31c463SMiklos Szeredi kfree(oi->redirect); 2154edb83bbSMiklos Szeredi ovl_dir_cache_free(inode); 216a015dafcSAmir Goldstein mutex_destroy(&oi->lock); 21709d8b586SMiklos Szeredi 21813cf199dSAmir Goldstein call_rcu(&inode->i_rcu, ovl_i_callback); 21913cf199dSAmir Goldstein } 22013cf199dSAmir Goldstein 221ad204488SMiklos Szeredi static void ovl_free_fs(struct ovl_fs *ofs) 222e9be9d5eSMiklos Szeredi { 223dd662667SMiklos Szeredi unsigned i; 224e9be9d5eSMiklos Szeredi 225ad204488SMiklos Szeredi dput(ofs->indexdir); 226ad204488SMiklos Szeredi dput(ofs->workdir); 227ad204488SMiklos Szeredi if (ofs->workdir_locked) 228ad204488SMiklos Szeredi ovl_inuse_unlock(ofs->workbasedir); 229ad204488SMiklos Szeredi dput(ofs->workbasedir); 230ad204488SMiklos Szeredi if (ofs->upperdir_locked) 231ad204488SMiklos Szeredi ovl_inuse_unlock(ofs->upper_mnt->mnt_root); 232ad204488SMiklos Szeredi mntput(ofs->upper_mnt); 233ad204488SMiklos Szeredi for (i = 0; i < ofs->numlower; i++) { 234ad204488SMiklos Szeredi mntput(ofs->lower_layers[i].mnt); 235ad204488SMiklos Szeredi free_anon_bdev(ofs->lower_layers[i].pseudo_dev); 2362a9c6d06SChandan Rajendra } 237ad204488SMiklos Szeredi kfree(ofs->lower_layers); 238e9be9d5eSMiklos Szeredi 239ad204488SMiklos Szeredi kfree(ofs->config.lowerdir); 240ad204488SMiklos Szeredi kfree(ofs->config.upperdir); 241ad204488SMiklos Szeredi kfree(ofs->config.workdir); 242438c84c2SMiklos Szeredi kfree(ofs->config.redirect_mode); 243ad204488SMiklos Szeredi if (ofs->creator_cred) 244ad204488SMiklos Szeredi put_cred(ofs->creator_cred); 245ad204488SMiklos Szeredi kfree(ofs); 246e9be9d5eSMiklos Szeredi } 247e9be9d5eSMiklos Szeredi 248a9075cdbSMiklos Szeredi static void ovl_put_super(struct super_block *sb) 249a9075cdbSMiklos Szeredi { 250a9075cdbSMiklos Szeredi struct ovl_fs *ofs = sb->s_fs_info; 251a9075cdbSMiklos Szeredi 252a9075cdbSMiklos Szeredi ovl_free_fs(ofs); 253a9075cdbSMiklos Szeredi } 254a9075cdbSMiklos Szeredi 255e8d4bfe3SChengguang Xu /* Sync real dirty inodes in upper filesystem (if it exists) */ 256e593b2bfSAmir Goldstein static int ovl_sync_fs(struct super_block *sb, int wait) 257e593b2bfSAmir Goldstein { 258ad204488SMiklos Szeredi struct ovl_fs *ofs = sb->s_fs_info; 259e593b2bfSAmir Goldstein struct super_block *upper_sb; 260e593b2bfSAmir Goldstein int ret; 261e593b2bfSAmir Goldstein 262ad204488SMiklos Szeredi if (!ofs->upper_mnt) 263e593b2bfSAmir Goldstein return 0; 264e8d4bfe3SChengguang Xu 265e8d4bfe3SChengguang Xu /* 266e8d4bfe3SChengguang Xu * If this is a sync(2) call or an emergency sync, all the super blocks 267e8d4bfe3SChengguang Xu * will be iterated, including upper_sb, so no need to do anything. 268e8d4bfe3SChengguang Xu * 269e8d4bfe3SChengguang Xu * If this is a syncfs(2) call, then we do need to call 270e8d4bfe3SChengguang Xu * sync_filesystem() on upper_sb, but enough if we do it when being 271e8d4bfe3SChengguang Xu * called with wait == 1. 272e8d4bfe3SChengguang Xu */ 273e8d4bfe3SChengguang Xu if (!wait) 274e593b2bfSAmir Goldstein return 0; 275e593b2bfSAmir Goldstein 276e8d4bfe3SChengguang Xu upper_sb = ofs->upper_mnt->mnt_sb; 277e8d4bfe3SChengguang Xu 278e593b2bfSAmir Goldstein down_read(&upper_sb->s_umount); 279e8d4bfe3SChengguang Xu ret = sync_filesystem(upper_sb); 280e593b2bfSAmir Goldstein up_read(&upper_sb->s_umount); 281e8d4bfe3SChengguang Xu 282e593b2bfSAmir Goldstein return ret; 283e593b2bfSAmir Goldstein } 284e593b2bfSAmir Goldstein 285cc259639SAndy Whitcroft /** 286cc259639SAndy Whitcroft * ovl_statfs 287cc259639SAndy Whitcroft * @sb: The overlayfs super block 288cc259639SAndy Whitcroft * @buf: The struct kstatfs to fill in with stats 289cc259639SAndy Whitcroft * 290cc259639SAndy Whitcroft * Get the filesystem statistics. As writes always target the upper layer 2914ebc5818SMiklos Szeredi * filesystem pass the statfs to the upper filesystem (if it exists) 292cc259639SAndy Whitcroft */ 293cc259639SAndy Whitcroft static int ovl_statfs(struct dentry *dentry, struct kstatfs *buf) 294cc259639SAndy Whitcroft { 295cc259639SAndy Whitcroft struct ovl_fs *ofs = dentry->d_sb->s_fs_info; 296cc259639SAndy Whitcroft struct dentry *root_dentry = dentry->d_sb->s_root; 297cc259639SAndy Whitcroft struct path path; 298cc259639SAndy Whitcroft int err; 299cc259639SAndy Whitcroft 3004ebc5818SMiklos Szeredi ovl_path_real(root_dentry, &path); 301cc259639SAndy Whitcroft 302cc259639SAndy Whitcroft err = vfs_statfs(&path, buf); 303cc259639SAndy Whitcroft if (!err) { 3046b2d5fe4SMiklos Szeredi buf->f_namelen = ofs->namelen; 305cc259639SAndy Whitcroft buf->f_type = OVERLAYFS_SUPER_MAGIC; 306cc259639SAndy Whitcroft } 307cc259639SAndy Whitcroft 308cc259639SAndy Whitcroft return err; 309cc259639SAndy Whitcroft } 310cc259639SAndy Whitcroft 31102bcd157SAmir Goldstein /* Will this overlay be forced to mount/remount ro? */ 312ad204488SMiklos Szeredi static bool ovl_force_readonly(struct ovl_fs *ofs) 31302bcd157SAmir Goldstein { 314ad204488SMiklos Szeredi return (!ofs->upper_mnt || !ofs->workdir); 31502bcd157SAmir Goldstein } 31602bcd157SAmir Goldstein 317438c84c2SMiklos Szeredi static const char *ovl_redirect_mode_def(void) 318438c84c2SMiklos Szeredi { 319438c84c2SMiklos Szeredi return ovl_redirect_dir_def ? "on" : "off"; 320438c84c2SMiklos Szeredi } 321438c84c2SMiklos Szeredi 322f45827e8SErez Zadok /** 323f45827e8SErez Zadok * ovl_show_options 324f45827e8SErez Zadok * 325f45827e8SErez Zadok * Prints the mount options for a given superblock. 326f45827e8SErez Zadok * Returns zero; does not fail. 327f45827e8SErez Zadok */ 328f45827e8SErez Zadok static int ovl_show_options(struct seq_file *m, struct dentry *dentry) 329f45827e8SErez Zadok { 330f45827e8SErez Zadok struct super_block *sb = dentry->d_sb; 331ad204488SMiklos Szeredi struct ovl_fs *ofs = sb->s_fs_info; 332f45827e8SErez Zadok 333ad204488SMiklos Szeredi seq_show_option(m, "lowerdir", ofs->config.lowerdir); 334ad204488SMiklos Szeredi if (ofs->config.upperdir) { 335ad204488SMiklos Szeredi seq_show_option(m, "upperdir", ofs->config.upperdir); 336ad204488SMiklos Szeredi seq_show_option(m, "workdir", ofs->config.workdir); 33753a08cb9SMiklos Szeredi } 338ad204488SMiklos Szeredi if (ofs->config.default_permissions) 3398d3095f4SMiklos Szeredi seq_puts(m, ",default_permissions"); 340438c84c2SMiklos Szeredi if (strcmp(ofs->config.redirect_mode, ovl_redirect_mode_def()) != 0) 341438c84c2SMiklos Szeredi seq_printf(m, ",redirect_dir=%s", ofs->config.redirect_mode); 342ad204488SMiklos Szeredi if (ofs->config.index != ovl_index_def) 343438c84c2SMiklos Szeredi seq_printf(m, ",index=%s", ofs->config.index ? "on" : "off"); 344f45827e8SErez Zadok return 0; 345f45827e8SErez Zadok } 346f45827e8SErez Zadok 3473cdf6fe9SSeunghun Lee static int ovl_remount(struct super_block *sb, int *flags, char *data) 3483cdf6fe9SSeunghun Lee { 349ad204488SMiklos Szeredi struct ovl_fs *ofs = sb->s_fs_info; 3503cdf6fe9SSeunghun Lee 3511751e8a6SLinus Torvalds if (!(*flags & SB_RDONLY) && ovl_force_readonly(ofs)) 3523cdf6fe9SSeunghun Lee return -EROFS; 3533cdf6fe9SSeunghun Lee 3543cdf6fe9SSeunghun Lee return 0; 3553cdf6fe9SSeunghun Lee } 3563cdf6fe9SSeunghun Lee 357e9be9d5eSMiklos Szeredi static const struct super_operations ovl_super_operations = { 35813cf199dSAmir Goldstein .alloc_inode = ovl_alloc_inode, 35913cf199dSAmir Goldstein .destroy_inode = ovl_destroy_inode, 36013cf199dSAmir Goldstein .drop_inode = generic_delete_inode, 361e9be9d5eSMiklos Szeredi .put_super = ovl_put_super, 362e593b2bfSAmir Goldstein .sync_fs = ovl_sync_fs, 363cc259639SAndy Whitcroft .statfs = ovl_statfs, 364f45827e8SErez Zadok .show_options = ovl_show_options, 3653cdf6fe9SSeunghun Lee .remount_fs = ovl_remount, 366e9be9d5eSMiklos Szeredi }; 367e9be9d5eSMiklos Szeredi 368e9be9d5eSMiklos Szeredi enum { 369e9be9d5eSMiklos Szeredi OPT_LOWERDIR, 370e9be9d5eSMiklos Szeredi OPT_UPPERDIR, 371e9be9d5eSMiklos Szeredi OPT_WORKDIR, 3728d3095f4SMiklos Szeredi OPT_DEFAULT_PERMISSIONS, 373438c84c2SMiklos Szeredi OPT_REDIRECT_DIR, 37402bcd157SAmir Goldstein OPT_INDEX_ON, 37502bcd157SAmir Goldstein OPT_INDEX_OFF, 376e9be9d5eSMiklos Szeredi OPT_ERR, 377e9be9d5eSMiklos Szeredi }; 378e9be9d5eSMiklos Szeredi 379e9be9d5eSMiklos Szeredi static const match_table_t ovl_tokens = { 380e9be9d5eSMiklos Szeredi {OPT_LOWERDIR, "lowerdir=%s"}, 381e9be9d5eSMiklos Szeredi {OPT_UPPERDIR, "upperdir=%s"}, 382e9be9d5eSMiklos Szeredi {OPT_WORKDIR, "workdir=%s"}, 3838d3095f4SMiklos Szeredi {OPT_DEFAULT_PERMISSIONS, "default_permissions"}, 384438c84c2SMiklos Szeredi {OPT_REDIRECT_DIR, "redirect_dir=%s"}, 38502bcd157SAmir Goldstein {OPT_INDEX_ON, "index=on"}, 38602bcd157SAmir Goldstein {OPT_INDEX_OFF, "index=off"}, 387e9be9d5eSMiklos Szeredi {OPT_ERR, NULL} 388e9be9d5eSMiklos Szeredi }; 389e9be9d5eSMiklos Szeredi 39091c77947SMiklos Szeredi static char *ovl_next_opt(char **s) 39191c77947SMiklos Szeredi { 39291c77947SMiklos Szeredi char *sbegin = *s; 39391c77947SMiklos Szeredi char *p; 39491c77947SMiklos Szeredi 39591c77947SMiklos Szeredi if (sbegin == NULL) 39691c77947SMiklos Szeredi return NULL; 39791c77947SMiklos Szeredi 39891c77947SMiklos Szeredi for (p = sbegin; *p; p++) { 39991c77947SMiklos Szeredi if (*p == '\\') { 40091c77947SMiklos Szeredi p++; 40191c77947SMiklos Szeredi if (!*p) 40291c77947SMiklos Szeredi break; 40391c77947SMiklos Szeredi } else if (*p == ',') { 40491c77947SMiklos Szeredi *p = '\0'; 40591c77947SMiklos Szeredi *s = p + 1; 40691c77947SMiklos Szeredi return sbegin; 40791c77947SMiklos Szeredi } 40891c77947SMiklos Szeredi } 40991c77947SMiklos Szeredi *s = NULL; 41091c77947SMiklos Szeredi return sbegin; 41191c77947SMiklos Szeredi } 41291c77947SMiklos Szeredi 413438c84c2SMiklos Szeredi static int ovl_parse_redirect_mode(struct ovl_config *config, const char *mode) 414438c84c2SMiklos Szeredi { 415438c84c2SMiklos Szeredi if (strcmp(mode, "on") == 0) { 416438c84c2SMiklos Szeredi config->redirect_dir = true; 417438c84c2SMiklos Szeredi /* 418438c84c2SMiklos Szeredi * Does not make sense to have redirect creation without 419438c84c2SMiklos Szeredi * redirect following. 420438c84c2SMiklos Szeredi */ 421438c84c2SMiklos Szeredi config->redirect_follow = true; 422438c84c2SMiklos Szeredi } else if (strcmp(mode, "follow") == 0) { 423438c84c2SMiklos Szeredi config->redirect_follow = true; 424438c84c2SMiklos Szeredi } else if (strcmp(mode, "off") == 0) { 425438c84c2SMiklos Szeredi if (ovl_redirect_always_follow) 426438c84c2SMiklos Szeredi config->redirect_follow = true; 427438c84c2SMiklos Szeredi } else if (strcmp(mode, "nofollow") != 0) { 428438c84c2SMiklos Szeredi pr_err("overlayfs: bad mount option \"redirect_dir=%s\"\n", 429438c84c2SMiklos Szeredi mode); 430438c84c2SMiklos Szeredi return -EINVAL; 431438c84c2SMiklos Szeredi } 432438c84c2SMiklos Szeredi 433438c84c2SMiklos Szeredi return 0; 434438c84c2SMiklos Szeredi } 435438c84c2SMiklos Szeredi 436e9be9d5eSMiklos Szeredi static int ovl_parse_opt(char *opt, struct ovl_config *config) 437e9be9d5eSMiklos Szeredi { 438e9be9d5eSMiklos Szeredi char *p; 439e9be9d5eSMiklos Szeredi 440438c84c2SMiklos Szeredi config->redirect_mode = kstrdup(ovl_redirect_mode_def(), GFP_KERNEL); 441438c84c2SMiklos Szeredi if (!config->redirect_mode) 442438c84c2SMiklos Szeredi return -ENOMEM; 443438c84c2SMiklos Szeredi 44491c77947SMiklos Szeredi while ((p = ovl_next_opt(&opt)) != NULL) { 445e9be9d5eSMiklos Szeredi int token; 446e9be9d5eSMiklos Szeredi substring_t args[MAX_OPT_ARGS]; 447e9be9d5eSMiklos Szeredi 448e9be9d5eSMiklos Szeredi if (!*p) 449e9be9d5eSMiklos Szeredi continue; 450e9be9d5eSMiklos Szeredi 451e9be9d5eSMiklos Szeredi token = match_token(p, ovl_tokens, args); 452e9be9d5eSMiklos Szeredi switch (token) { 453e9be9d5eSMiklos Szeredi case OPT_UPPERDIR: 454e9be9d5eSMiklos Szeredi kfree(config->upperdir); 455e9be9d5eSMiklos Szeredi config->upperdir = match_strdup(&args[0]); 456e9be9d5eSMiklos Szeredi if (!config->upperdir) 457e9be9d5eSMiklos Szeredi return -ENOMEM; 458e9be9d5eSMiklos Szeredi break; 459e9be9d5eSMiklos Szeredi 460e9be9d5eSMiklos Szeredi case OPT_LOWERDIR: 461e9be9d5eSMiklos Szeredi kfree(config->lowerdir); 462e9be9d5eSMiklos Szeredi config->lowerdir = match_strdup(&args[0]); 463e9be9d5eSMiklos Szeredi if (!config->lowerdir) 464e9be9d5eSMiklos Szeredi return -ENOMEM; 465e9be9d5eSMiklos Szeredi break; 466e9be9d5eSMiklos Szeredi 467e9be9d5eSMiklos Szeredi case OPT_WORKDIR: 468e9be9d5eSMiklos Szeredi kfree(config->workdir); 469e9be9d5eSMiklos Szeredi config->workdir = match_strdup(&args[0]); 470e9be9d5eSMiklos Szeredi if (!config->workdir) 471e9be9d5eSMiklos Szeredi return -ENOMEM; 472e9be9d5eSMiklos Szeredi break; 473e9be9d5eSMiklos Szeredi 4748d3095f4SMiklos Szeredi case OPT_DEFAULT_PERMISSIONS: 4758d3095f4SMiklos Szeredi config->default_permissions = true; 4768d3095f4SMiklos Szeredi break; 4778d3095f4SMiklos Szeredi 478438c84c2SMiklos Szeredi case OPT_REDIRECT_DIR: 479438c84c2SMiklos Szeredi kfree(config->redirect_mode); 480438c84c2SMiklos Szeredi config->redirect_mode = match_strdup(&args[0]); 481438c84c2SMiklos Szeredi if (!config->redirect_mode) 482438c84c2SMiklos Szeredi return -ENOMEM; 483a6c60655SMiklos Szeredi break; 484a6c60655SMiklos Szeredi 48502bcd157SAmir Goldstein case OPT_INDEX_ON: 48602bcd157SAmir Goldstein config->index = true; 48702bcd157SAmir Goldstein break; 48802bcd157SAmir Goldstein 48902bcd157SAmir Goldstein case OPT_INDEX_OFF: 49002bcd157SAmir Goldstein config->index = false; 49102bcd157SAmir Goldstein break; 49202bcd157SAmir Goldstein 493e9be9d5eSMiklos Szeredi default: 494bead55efShujianyang pr_err("overlayfs: unrecognized mount option \"%s\" or missing value\n", p); 495e9be9d5eSMiklos Szeredi return -EINVAL; 496e9be9d5eSMiklos Szeredi } 497e9be9d5eSMiklos Szeredi } 49871cbad7eShujianyang 49971cbad7eShujianyang /* Workdir is useless in non-upper mount */ 50071cbad7eShujianyang if (!config->upperdir && config->workdir) { 50171cbad7eShujianyang pr_info("overlayfs: option \"workdir=%s\" is useless in a non-upper mount, ignore\n", 50271cbad7eShujianyang config->workdir); 50371cbad7eShujianyang kfree(config->workdir); 50471cbad7eShujianyang config->workdir = NULL; 50571cbad7eShujianyang } 50671cbad7eShujianyang 507438c84c2SMiklos Szeredi return ovl_parse_redirect_mode(config, config->redirect_mode); 508e9be9d5eSMiklos Szeredi } 509e9be9d5eSMiklos Szeredi 510e9be9d5eSMiklos Szeredi #define OVL_WORKDIR_NAME "work" 51102bcd157SAmir Goldstein #define OVL_INDEXDIR_NAME "index" 512e9be9d5eSMiklos Szeredi 513ad204488SMiklos Szeredi static struct dentry *ovl_workdir_create(struct ovl_fs *ofs, 5146b8aa129SAmir Goldstein const char *name, bool persist) 515e9be9d5eSMiklos Szeredi { 516ad204488SMiklos Szeredi struct inode *dir = ofs->workbasedir->d_inode; 517ad204488SMiklos Szeredi struct vfsmount *mnt = ofs->upper_mnt; 518e9be9d5eSMiklos Szeredi struct dentry *work; 519e9be9d5eSMiklos Szeredi int err; 520e9be9d5eSMiklos Szeredi bool retried = false; 5216b8aa129SAmir Goldstein bool locked = false; 522e9be9d5eSMiklos Szeredi 523e9be9d5eSMiklos Szeredi err = mnt_want_write(mnt); 524e9be9d5eSMiklos Szeredi if (err) 5256b8aa129SAmir Goldstein goto out_err; 526e9be9d5eSMiklos Szeredi 5275955102cSAl Viro inode_lock_nested(dir, I_MUTEX_PARENT); 5286b8aa129SAmir Goldstein locked = true; 5296b8aa129SAmir Goldstein 530e9be9d5eSMiklos Szeredi retry: 531ad204488SMiklos Szeredi work = lookup_one_len(name, ofs->workbasedir, strlen(name)); 532e9be9d5eSMiklos Szeredi 533e9be9d5eSMiklos Szeredi if (!IS_ERR(work)) { 534c11b9fddSMiklos Szeredi struct iattr attr = { 535c11b9fddSMiklos Szeredi .ia_valid = ATTR_MODE, 53632a3d848SAl Viro .ia_mode = S_IFDIR | 0, 537c11b9fddSMiklos Szeredi }; 538e9be9d5eSMiklos Szeredi 539e9be9d5eSMiklos Szeredi if (work->d_inode) { 540e9be9d5eSMiklos Szeredi err = -EEXIST; 541e9be9d5eSMiklos Szeredi if (retried) 542e9be9d5eSMiklos Szeredi goto out_dput; 543e9be9d5eSMiklos Szeredi 5446b8aa129SAmir Goldstein if (persist) 5456b8aa129SAmir Goldstein goto out_unlock; 5466b8aa129SAmir Goldstein 547e9be9d5eSMiklos Szeredi retried = true; 548eea2fb48SMiklos Szeredi ovl_workdir_cleanup(dir, mnt, work, 0); 549e9be9d5eSMiklos Szeredi dput(work); 550e9be9d5eSMiklos Szeredi goto retry; 551e9be9d5eSMiklos Szeredi } 552e9be9d5eSMiklos Szeredi 55332a3d848SAl Viro err = ovl_create_real(dir, work, 55432a3d848SAl Viro &(struct cattr){.mode = S_IFDIR | 0}, 55532a3d848SAl Viro NULL, true); 556e9be9d5eSMiklos Szeredi if (err) 557e9be9d5eSMiklos Szeredi goto out_dput; 558c11b9fddSMiklos Szeredi 559cb348edbSMiklos Szeredi /* 560cb348edbSMiklos Szeredi * Try to remove POSIX ACL xattrs from workdir. We are good if: 561cb348edbSMiklos Szeredi * 562cb348edbSMiklos Szeredi * a) success (there was a POSIX ACL xattr and was removed) 563cb348edbSMiklos Szeredi * b) -ENODATA (there was no POSIX ACL xattr) 564cb348edbSMiklos Szeredi * c) -EOPNOTSUPP (POSIX ACL xattrs are not supported) 565cb348edbSMiklos Szeredi * 566cb348edbSMiklos Szeredi * There are various other error values that could effectively 567cb348edbSMiklos Szeredi * mean that the xattr doesn't exist (e.g. -ERANGE is returned 568cb348edbSMiklos Szeredi * if the xattr name is too long), but the set of filesystems 569cb348edbSMiklos Szeredi * allowed as upper are limited to "normal" ones, where checking 570cb348edbSMiklos Szeredi * for the above two errors is sufficient. 571cb348edbSMiklos Szeredi */ 572c11b9fddSMiklos Szeredi err = vfs_removexattr(work, XATTR_NAME_POSIX_ACL_DEFAULT); 573e1ff3dd1SMiklos Szeredi if (err && err != -ENODATA && err != -EOPNOTSUPP) 574c11b9fddSMiklos Szeredi goto out_dput; 575c11b9fddSMiklos Szeredi 576c11b9fddSMiklos Szeredi err = vfs_removexattr(work, XATTR_NAME_POSIX_ACL_ACCESS); 577e1ff3dd1SMiklos Szeredi if (err && err != -ENODATA && err != -EOPNOTSUPP) 578c11b9fddSMiklos Szeredi goto out_dput; 579c11b9fddSMiklos Szeredi 580c11b9fddSMiklos Szeredi /* Clear any inherited mode bits */ 581c11b9fddSMiklos Szeredi inode_lock(work->d_inode); 582c11b9fddSMiklos Szeredi err = notify_change(work, &attr, NULL); 583c11b9fddSMiklos Szeredi inode_unlock(work->d_inode); 584c11b9fddSMiklos Szeredi if (err) 585c11b9fddSMiklos Szeredi goto out_dput; 5866b8aa129SAmir Goldstein } else { 5876b8aa129SAmir Goldstein err = PTR_ERR(work); 5886b8aa129SAmir Goldstein goto out_err; 589e9be9d5eSMiklos Szeredi } 590e9be9d5eSMiklos Szeredi out_unlock: 591e9be9d5eSMiklos Szeredi mnt_drop_write(mnt); 5926b8aa129SAmir Goldstein if (locked) 5936b8aa129SAmir Goldstein inode_unlock(dir); 594e9be9d5eSMiklos Szeredi 595e9be9d5eSMiklos Szeredi return work; 596e9be9d5eSMiklos Szeredi 597e9be9d5eSMiklos Szeredi out_dput: 598e9be9d5eSMiklos Szeredi dput(work); 5996b8aa129SAmir Goldstein out_err: 6006b8aa129SAmir Goldstein pr_warn("overlayfs: failed to create directory %s/%s (errno: %i); mounting read-only\n", 601ad204488SMiklos Szeredi ofs->config.workdir, name, -err); 6026b8aa129SAmir Goldstein work = NULL; 603e9be9d5eSMiklos Szeredi goto out_unlock; 604e9be9d5eSMiklos Szeredi } 605e9be9d5eSMiklos Szeredi 60691c77947SMiklos Szeredi static void ovl_unescape(char *s) 60791c77947SMiklos Szeredi { 60891c77947SMiklos Szeredi char *d = s; 60991c77947SMiklos Szeredi 61091c77947SMiklos Szeredi for (;; s++, d++) { 61191c77947SMiklos Szeredi if (*s == '\\') 61291c77947SMiklos Szeredi s++; 61391c77947SMiklos Szeredi *d = *s; 61491c77947SMiklos Szeredi if (!*s) 61591c77947SMiklos Szeredi break; 61691c77947SMiklos Szeredi } 61791c77947SMiklos Szeredi } 61891c77947SMiklos Szeredi 619ab508822SMiklos Szeredi static int ovl_mount_dir_noesc(const char *name, struct path *path) 620ab508822SMiklos Szeredi { 621a78d9f0dSMiklos Szeredi int err = -EINVAL; 622ab508822SMiklos Szeredi 623a78d9f0dSMiklos Szeredi if (!*name) { 624a78d9f0dSMiklos Szeredi pr_err("overlayfs: empty lowerdir\n"); 625a78d9f0dSMiklos Szeredi goto out; 626a78d9f0dSMiklos Szeredi } 627ab508822SMiklos Szeredi err = kern_path(name, LOOKUP_FOLLOW, path); 628ab508822SMiklos Szeredi if (err) { 629ab508822SMiklos Szeredi pr_err("overlayfs: failed to resolve '%s': %i\n", name, err); 630ab508822SMiklos Szeredi goto out; 631ab508822SMiklos Szeredi } 632ab508822SMiklos Szeredi err = -EINVAL; 6337c03b5d4SMiklos Szeredi if (ovl_dentry_weird(path->dentry)) { 634ab508822SMiklos Szeredi pr_err("overlayfs: filesystem on '%s' not supported\n", name); 635ab508822SMiklos Szeredi goto out_put; 636ab508822SMiklos Szeredi } 6372b8c30e9SMiklos Szeredi if (!d_is_dir(path->dentry)) { 638ab508822SMiklos Szeredi pr_err("overlayfs: '%s' not a directory\n", name); 639ab508822SMiklos Szeredi goto out_put; 640ab508822SMiklos Szeredi } 641ab508822SMiklos Szeredi return 0; 642ab508822SMiklos Szeredi 643ab508822SMiklos Szeredi out_put: 6448aafcb59SMiklos Szeredi path_put_init(path); 645ab508822SMiklos Szeredi out: 646ab508822SMiklos Szeredi return err; 647ab508822SMiklos Szeredi } 648ab508822SMiklos Szeredi 649ab508822SMiklos Szeredi static int ovl_mount_dir(const char *name, struct path *path) 650ab508822SMiklos Szeredi { 651ab508822SMiklos Szeredi int err = -ENOMEM; 652ab508822SMiklos Szeredi char *tmp = kstrdup(name, GFP_KERNEL); 653ab508822SMiklos Szeredi 654ab508822SMiklos Szeredi if (tmp) { 655ab508822SMiklos Szeredi ovl_unescape(tmp); 656ab508822SMiklos Szeredi err = ovl_mount_dir_noesc(tmp, path); 6577c03b5d4SMiklos Szeredi 6587c03b5d4SMiklos Szeredi if (!err) 6597c03b5d4SMiklos Szeredi if (ovl_dentry_remote(path->dentry)) { 6607c03b5d4SMiklos Szeredi pr_err("overlayfs: filesystem on '%s' not supported as upperdir\n", 6617c03b5d4SMiklos Szeredi tmp); 6628aafcb59SMiklos Szeredi path_put_init(path); 6637c03b5d4SMiklos Szeredi err = -EINVAL; 6647c03b5d4SMiklos Szeredi } 665ab508822SMiklos Szeredi kfree(tmp); 666ab508822SMiklos Szeredi } 667ab508822SMiklos Szeredi return err; 668ab508822SMiklos Szeredi } 669ab508822SMiklos Szeredi 6706b2d5fe4SMiklos Szeredi static int ovl_check_namelen(struct path *path, struct ovl_fs *ofs, 6716b2d5fe4SMiklos Szeredi const char *name) 6726b2d5fe4SMiklos Szeredi { 6736b2d5fe4SMiklos Szeredi struct kstatfs statfs; 6746b2d5fe4SMiklos Szeredi int err = vfs_statfs(path, &statfs); 6756b2d5fe4SMiklos Szeredi 6766b2d5fe4SMiklos Szeredi if (err) 6776b2d5fe4SMiklos Szeredi pr_err("overlayfs: statfs failed on '%s'\n", name); 6786b2d5fe4SMiklos Szeredi else 6796b2d5fe4SMiklos Szeredi ofs->namelen = max(ofs->namelen, statfs.f_namelen); 6806b2d5fe4SMiklos Szeredi 6816b2d5fe4SMiklos Szeredi return err; 6826b2d5fe4SMiklos Szeredi } 6836b2d5fe4SMiklos Szeredi 6846b2d5fe4SMiklos Szeredi static int ovl_lower_dir(const char *name, struct path *path, 6856b2d5fe4SMiklos Szeredi struct ovl_fs *ofs, int *stack_depth, bool *remote) 686ab508822SMiklos Szeredi { 687ab508822SMiklos Szeredi int err; 688ab508822SMiklos Szeredi 689a78d9f0dSMiklos Szeredi err = ovl_mount_dir_noesc(name, path); 690ab508822SMiklos Szeredi if (err) 691ab508822SMiklos Szeredi goto out; 692ab508822SMiklos Szeredi 6936b2d5fe4SMiklos Szeredi err = ovl_check_namelen(path, ofs, name); 6946b2d5fe4SMiklos Szeredi if (err) 695ab508822SMiklos Szeredi goto out_put; 6966b2d5fe4SMiklos Szeredi 697ab508822SMiklos Szeredi *stack_depth = max(*stack_depth, path->mnt->mnt_sb->s_stack_depth); 698ab508822SMiklos Szeredi 6997c03b5d4SMiklos Szeredi if (ovl_dentry_remote(path->dentry)) 7007c03b5d4SMiklos Szeredi *remote = true; 7017c03b5d4SMiklos Szeredi 70202bcd157SAmir Goldstein /* 70302bcd157SAmir Goldstein * The inodes index feature needs to encode and decode file 70402bcd157SAmir Goldstein * handles, so it requires that all layers support them. 70502bcd157SAmir Goldstein */ 70602bcd157SAmir Goldstein if (ofs->config.index && !ovl_can_decode_fh(path->dentry->d_sb)) { 70702bcd157SAmir Goldstein ofs->config.index = false; 70802bcd157SAmir Goldstein pr_warn("overlayfs: fs on '%s' does not support file handles, falling back to index=off.\n", name); 70902bcd157SAmir Goldstein } 71002bcd157SAmir Goldstein 711ab508822SMiklos Szeredi return 0; 712ab508822SMiklos Szeredi 713ab508822SMiklos Szeredi out_put: 7148aafcb59SMiklos Szeredi path_put_init(path); 715ab508822SMiklos Szeredi out: 716ab508822SMiklos Szeredi return err; 717ab508822SMiklos Szeredi } 718ab508822SMiklos Szeredi 719e9be9d5eSMiklos Szeredi /* Workdir should not be subdir of upperdir and vice versa */ 720e9be9d5eSMiklos Szeredi static bool ovl_workdir_ok(struct dentry *workdir, struct dentry *upperdir) 721e9be9d5eSMiklos Szeredi { 722e9be9d5eSMiklos Szeredi bool ok = false; 723e9be9d5eSMiklos Szeredi 724e9be9d5eSMiklos Szeredi if (workdir != upperdir) { 725e9be9d5eSMiklos Szeredi ok = (lock_rename(workdir, upperdir) == NULL); 726e9be9d5eSMiklos Szeredi unlock_rename(workdir, upperdir); 727e9be9d5eSMiklos Szeredi } 728e9be9d5eSMiklos Szeredi return ok; 729e9be9d5eSMiklos Szeredi } 730e9be9d5eSMiklos Szeredi 731a78d9f0dSMiklos Szeredi static unsigned int ovl_split_lowerdirs(char *str) 732a78d9f0dSMiklos Szeredi { 733a78d9f0dSMiklos Szeredi unsigned int ctr = 1; 734a78d9f0dSMiklos Szeredi char *s, *d; 735a78d9f0dSMiklos Szeredi 736a78d9f0dSMiklos Szeredi for (s = d = str;; s++, d++) { 737a78d9f0dSMiklos Szeredi if (*s == '\\') { 738a78d9f0dSMiklos Szeredi s++; 739a78d9f0dSMiklos Szeredi } else if (*s == ':') { 740a78d9f0dSMiklos Szeredi *d = '\0'; 741a78d9f0dSMiklos Szeredi ctr++; 742a78d9f0dSMiklos Szeredi continue; 743a78d9f0dSMiklos Szeredi } 744a78d9f0dSMiklos Szeredi *d = *s; 745a78d9f0dSMiklos Szeredi if (!*s) 746a78d9f0dSMiklos Szeredi break; 747a78d9f0dSMiklos Szeredi } 748a78d9f0dSMiklos Szeredi return ctr; 749a78d9f0dSMiklos Szeredi } 750a78d9f0dSMiklos Szeredi 7510c97be22SAndreas Gruenbacher static int __maybe_unused 7520eb45fc3SAndreas Gruenbacher ovl_posix_acl_xattr_get(const struct xattr_handler *handler, 7530eb45fc3SAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 7540eb45fc3SAndreas Gruenbacher const char *name, void *buffer, size_t size) 7550eb45fc3SAndreas Gruenbacher { 7561d88f183SMiklos Szeredi return ovl_xattr_get(dentry, inode, handler->name, buffer, size); 7570eb45fc3SAndreas Gruenbacher } 7580eb45fc3SAndreas Gruenbacher 7590eb45fc3SAndreas Gruenbacher static int __maybe_unused 7600c97be22SAndreas Gruenbacher ovl_posix_acl_xattr_set(const struct xattr_handler *handler, 761d837a49bSMiklos Szeredi struct dentry *dentry, struct inode *inode, 762d837a49bSMiklos Szeredi const char *name, const void *value, 763d837a49bSMiklos Szeredi size_t size, int flags) 764d837a49bSMiklos Szeredi { 765d837a49bSMiklos Szeredi struct dentry *workdir = ovl_workdir(dentry); 76609d8b586SMiklos Szeredi struct inode *realinode = ovl_inode_real(inode); 767d837a49bSMiklos Szeredi struct posix_acl *acl = NULL; 768d837a49bSMiklos Szeredi int err; 769d837a49bSMiklos Szeredi 770d837a49bSMiklos Szeredi /* Check that everything is OK before copy-up */ 771d837a49bSMiklos Szeredi if (value) { 772d837a49bSMiklos Szeredi acl = posix_acl_from_xattr(&init_user_ns, value, size); 773d837a49bSMiklos Szeredi if (IS_ERR(acl)) 774d837a49bSMiklos Szeredi return PTR_ERR(acl); 775d837a49bSMiklos Szeredi } 776d837a49bSMiklos Szeredi err = -EOPNOTSUPP; 777d837a49bSMiklos Szeredi if (!IS_POSIXACL(d_inode(workdir))) 778d837a49bSMiklos Szeredi goto out_acl_release; 779d837a49bSMiklos Szeredi if (!realinode->i_op->set_acl) 780d837a49bSMiklos Szeredi goto out_acl_release; 781d837a49bSMiklos Szeredi if (handler->flags == ACL_TYPE_DEFAULT && !S_ISDIR(inode->i_mode)) { 782d837a49bSMiklos Szeredi err = acl ? -EACCES : 0; 783d837a49bSMiklos Szeredi goto out_acl_release; 784d837a49bSMiklos Szeredi } 785d837a49bSMiklos Szeredi err = -EPERM; 786d837a49bSMiklos Szeredi if (!inode_owner_or_capable(inode)) 787d837a49bSMiklos Szeredi goto out_acl_release; 788d837a49bSMiklos Szeredi 789d837a49bSMiklos Szeredi posix_acl_release(acl); 790d837a49bSMiklos Szeredi 791fd3220d3SMiklos Szeredi /* 792fd3220d3SMiklos Szeredi * Check if sgid bit needs to be cleared (actual setacl operation will 793fd3220d3SMiklos Szeredi * be done with mounter's capabilities and so that won't do it for us). 794fd3220d3SMiklos Szeredi */ 795fd3220d3SMiklos Szeredi if (unlikely(inode->i_mode & S_ISGID) && 796fd3220d3SMiklos Szeredi handler->flags == ACL_TYPE_ACCESS && 797fd3220d3SMiklos Szeredi !in_group_p(inode->i_gid) && 798fd3220d3SMiklos Szeredi !capable_wrt_inode_uidgid(inode, CAP_FSETID)) { 799fd3220d3SMiklos Szeredi struct iattr iattr = { .ia_valid = ATTR_KILL_SGID }; 800fd3220d3SMiklos Szeredi 801fd3220d3SMiklos Szeredi err = ovl_setattr(dentry, &iattr); 802fd3220d3SMiklos Szeredi if (err) 803fd3220d3SMiklos Szeredi return err; 804fd3220d3SMiklos Szeredi } 805fd3220d3SMiklos Szeredi 8061d88f183SMiklos Szeredi err = ovl_xattr_set(dentry, inode, handler->name, value, size, flags); 807ce31513aSMiklos Szeredi if (!err) 80809d8b586SMiklos Szeredi ovl_copyattr(ovl_inode_real(inode), inode); 809ce31513aSMiklos Szeredi 810ce31513aSMiklos Szeredi return err; 811d837a49bSMiklos Szeredi 812d837a49bSMiklos Szeredi out_acl_release: 813d837a49bSMiklos Szeredi posix_acl_release(acl); 814d837a49bSMiklos Szeredi return err; 815d837a49bSMiklos Szeredi } 816d837a49bSMiklos Szeredi 8170eb45fc3SAndreas Gruenbacher static int ovl_own_xattr_get(const struct xattr_handler *handler, 8180eb45fc3SAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 8190eb45fc3SAndreas Gruenbacher const char *name, void *buffer, size_t size) 8200eb45fc3SAndreas Gruenbacher { 82148fab5d7SAmir Goldstein return -EOPNOTSUPP; 8220eb45fc3SAndreas Gruenbacher } 8230eb45fc3SAndreas Gruenbacher 824d837a49bSMiklos Szeredi static int ovl_own_xattr_set(const struct xattr_handler *handler, 825d837a49bSMiklos Szeredi struct dentry *dentry, struct inode *inode, 826d837a49bSMiklos Szeredi const char *name, const void *value, 827d837a49bSMiklos Szeredi size_t size, int flags) 828d837a49bSMiklos Szeredi { 82948fab5d7SAmir Goldstein return -EOPNOTSUPP; 830d837a49bSMiklos Szeredi } 831d837a49bSMiklos Szeredi 8320eb45fc3SAndreas Gruenbacher static int ovl_other_xattr_get(const struct xattr_handler *handler, 8330eb45fc3SAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 8340eb45fc3SAndreas Gruenbacher const char *name, void *buffer, size_t size) 8350eb45fc3SAndreas Gruenbacher { 8361d88f183SMiklos Szeredi return ovl_xattr_get(dentry, inode, name, buffer, size); 8370eb45fc3SAndreas Gruenbacher } 8380eb45fc3SAndreas Gruenbacher 8390e585cccSAndreas Gruenbacher static int ovl_other_xattr_set(const struct xattr_handler *handler, 8400e585cccSAndreas Gruenbacher struct dentry *dentry, struct inode *inode, 8410e585cccSAndreas Gruenbacher const char *name, const void *value, 8420e585cccSAndreas Gruenbacher size_t size, int flags) 8430e585cccSAndreas Gruenbacher { 8441d88f183SMiklos Szeredi return ovl_xattr_set(dentry, inode, name, value, size, flags); 8450e585cccSAndreas Gruenbacher } 8460e585cccSAndreas Gruenbacher 8470c97be22SAndreas Gruenbacher static const struct xattr_handler __maybe_unused 8480c97be22SAndreas Gruenbacher ovl_posix_acl_access_xattr_handler = { 849d837a49bSMiklos Szeredi .name = XATTR_NAME_POSIX_ACL_ACCESS, 850d837a49bSMiklos Szeredi .flags = ACL_TYPE_ACCESS, 8510eb45fc3SAndreas Gruenbacher .get = ovl_posix_acl_xattr_get, 852d837a49bSMiklos Szeredi .set = ovl_posix_acl_xattr_set, 853d837a49bSMiklos Szeredi }; 854d837a49bSMiklos Szeredi 8550c97be22SAndreas Gruenbacher static const struct xattr_handler __maybe_unused 8560c97be22SAndreas Gruenbacher ovl_posix_acl_default_xattr_handler = { 857d837a49bSMiklos Szeredi .name = XATTR_NAME_POSIX_ACL_DEFAULT, 858d837a49bSMiklos Szeredi .flags = ACL_TYPE_DEFAULT, 8590eb45fc3SAndreas Gruenbacher .get = ovl_posix_acl_xattr_get, 860d837a49bSMiklos Szeredi .set = ovl_posix_acl_xattr_set, 861d837a49bSMiklos Szeredi }; 862d837a49bSMiklos Szeredi 863d837a49bSMiklos Szeredi static const struct xattr_handler ovl_own_xattr_handler = { 864d837a49bSMiklos Szeredi .prefix = OVL_XATTR_PREFIX, 8650eb45fc3SAndreas Gruenbacher .get = ovl_own_xattr_get, 866d837a49bSMiklos Szeredi .set = ovl_own_xattr_set, 867d837a49bSMiklos Szeredi }; 868d837a49bSMiklos Szeredi 869d837a49bSMiklos Szeredi static const struct xattr_handler ovl_other_xattr_handler = { 870d837a49bSMiklos Szeredi .prefix = "", /* catch all */ 8710eb45fc3SAndreas Gruenbacher .get = ovl_other_xattr_get, 872d837a49bSMiklos Szeredi .set = ovl_other_xattr_set, 873d837a49bSMiklos Szeredi }; 874d837a49bSMiklos Szeredi 875d837a49bSMiklos Szeredi static const struct xattr_handler *ovl_xattr_handlers[] = { 8760c97be22SAndreas Gruenbacher #ifdef CONFIG_FS_POSIX_ACL 877d837a49bSMiklos Szeredi &ovl_posix_acl_access_xattr_handler, 878d837a49bSMiklos Szeredi &ovl_posix_acl_default_xattr_handler, 8790c97be22SAndreas Gruenbacher #endif 880d837a49bSMiklos Szeredi &ovl_own_xattr_handler, 881d837a49bSMiklos Szeredi &ovl_other_xattr_handler, 882d837a49bSMiklos Szeredi NULL 883d837a49bSMiklos Szeredi }; 884d837a49bSMiklos Szeredi 885ad204488SMiklos Szeredi static int ovl_get_upper(struct ovl_fs *ofs, struct path *upperpath) 8866ee8acf0SMiklos Szeredi { 8875064975eSMiklos Szeredi struct vfsmount *upper_mnt; 8886ee8acf0SMiklos Szeredi int err; 8896ee8acf0SMiklos Szeredi 890ad204488SMiklos Szeredi err = ovl_mount_dir(ofs->config.upperdir, upperpath); 8916ee8acf0SMiklos Szeredi if (err) 8926ee8acf0SMiklos Szeredi goto out; 8936ee8acf0SMiklos Szeredi 8946ee8acf0SMiklos Szeredi /* Upper fs should not be r/o */ 8956ee8acf0SMiklos Szeredi if (sb_rdonly(upperpath->mnt->mnt_sb)) { 8966ee8acf0SMiklos Szeredi pr_err("overlayfs: upper fs is r/o, try multi-lower layers mount\n"); 8976ee8acf0SMiklos Szeredi err = -EINVAL; 8986ee8acf0SMiklos Szeredi goto out; 8996ee8acf0SMiklos Szeredi } 9006ee8acf0SMiklos Szeredi 901ad204488SMiklos Szeredi err = ovl_check_namelen(upperpath, ofs, ofs->config.upperdir); 9026ee8acf0SMiklos Szeredi if (err) 9036ee8acf0SMiklos Szeredi goto out; 9046ee8acf0SMiklos Szeredi 9056ee8acf0SMiklos Szeredi err = -EBUSY; 9066ee8acf0SMiklos Szeredi if (ovl_inuse_trylock(upperpath->dentry)) { 907ad204488SMiklos Szeredi ofs->upperdir_locked = true; 908ad204488SMiklos Szeredi } else if (ofs->config.index) { 9096ee8acf0SMiklos Szeredi pr_err("overlayfs: upperdir is in-use by another mount, mount with '-o index=off' to override exclusive upperdir protection.\n"); 9106ee8acf0SMiklos Szeredi goto out; 9116ee8acf0SMiklos Szeredi } else { 9126ee8acf0SMiklos Szeredi pr_warn("overlayfs: upperdir is in-use by another mount, accessing files from both mounts will result in undefined behavior.\n"); 9136ee8acf0SMiklos Szeredi } 9145064975eSMiklos Szeredi 9155064975eSMiklos Szeredi upper_mnt = clone_private_mount(upperpath); 9165064975eSMiklos Szeredi err = PTR_ERR(upper_mnt); 9175064975eSMiklos Szeredi if (IS_ERR(upper_mnt)) { 9185064975eSMiklos Szeredi pr_err("overlayfs: failed to clone upperpath\n"); 9195064975eSMiklos Szeredi goto out; 9205064975eSMiklos Szeredi } 9215064975eSMiklos Szeredi 9225064975eSMiklos Szeredi /* Don't inherit atime flags */ 9235064975eSMiklos Szeredi upper_mnt->mnt_flags &= ~(MNT_NOATIME | MNT_NODIRATIME | MNT_RELATIME); 924ad204488SMiklos Szeredi ofs->upper_mnt = upper_mnt; 9256ee8acf0SMiklos Szeredi err = 0; 9266ee8acf0SMiklos Szeredi out: 9276ee8acf0SMiklos Szeredi return err; 9286ee8acf0SMiklos Szeredi } 9296ee8acf0SMiklos Szeredi 930ad204488SMiklos Szeredi static int ovl_make_workdir(struct ovl_fs *ofs, struct path *workpath) 9318ed61dc3SMiklos Szeredi { 9328ed61dc3SMiklos Szeredi struct dentry *temp; 9338ed61dc3SMiklos Szeredi int err; 9348ed61dc3SMiklos Szeredi 935ad204488SMiklos Szeredi ofs->workdir = ovl_workdir_create(ofs, OVL_WORKDIR_NAME, false); 936ad204488SMiklos Szeredi if (!ofs->workdir) 9378ed61dc3SMiklos Szeredi return 0; 9388ed61dc3SMiklos Szeredi 9398ed61dc3SMiklos Szeredi /* 9408ed61dc3SMiklos Szeredi * Upper should support d_type, else whiteouts are visible. Given 9418ed61dc3SMiklos Szeredi * workdir and upper are on same fs, we can do iterate_dir() on 9428ed61dc3SMiklos Szeredi * workdir. This check requires successful creation of workdir in 9438ed61dc3SMiklos Szeredi * previous step. 9448ed61dc3SMiklos Szeredi */ 9458ed61dc3SMiklos Szeredi err = ovl_check_d_type_supported(workpath); 9468ed61dc3SMiklos Szeredi if (err < 0) 9478ed61dc3SMiklos Szeredi return err; 9488ed61dc3SMiklos Szeredi 9498ed61dc3SMiklos Szeredi /* 9508ed61dc3SMiklos Szeredi * We allowed this configuration and don't want to break users over 9518ed61dc3SMiklos Szeredi * kernel upgrade. So warn instead of erroring out. 9528ed61dc3SMiklos Szeredi */ 9538ed61dc3SMiklos Szeredi if (!err) 9548ed61dc3SMiklos Szeredi pr_warn("overlayfs: upper fs needs to support d_type.\n"); 9558ed61dc3SMiklos Szeredi 9568ed61dc3SMiklos Szeredi /* Check if upper/work fs supports O_TMPFILE */ 957ad204488SMiklos Szeredi temp = ovl_do_tmpfile(ofs->workdir, S_IFREG | 0); 958ad204488SMiklos Szeredi ofs->tmpfile = !IS_ERR(temp); 959ad204488SMiklos Szeredi if (ofs->tmpfile) 9608ed61dc3SMiklos Szeredi dput(temp); 9618ed61dc3SMiklos Szeredi else 9628ed61dc3SMiklos Szeredi pr_warn("overlayfs: upper fs does not support tmpfile.\n"); 9638ed61dc3SMiklos Szeredi 9648ed61dc3SMiklos Szeredi /* 9658ed61dc3SMiklos Szeredi * Check if upper/work fs supports trusted.overlay.* xattr 9668ed61dc3SMiklos Szeredi */ 967ad204488SMiklos Szeredi err = ovl_do_setxattr(ofs->workdir, OVL_XATTR_OPAQUE, "0", 1, 0); 9688ed61dc3SMiklos Szeredi if (err) { 969ad204488SMiklos Szeredi ofs->noxattr = true; 9708ed61dc3SMiklos Szeredi pr_warn("overlayfs: upper fs does not support xattr.\n"); 9718ed61dc3SMiklos Szeredi } else { 972ad204488SMiklos Szeredi vfs_removexattr(ofs->workdir, OVL_XATTR_OPAQUE); 9738ed61dc3SMiklos Szeredi } 9748ed61dc3SMiklos Szeredi 9758ed61dc3SMiklos Szeredi /* Check if upper/work fs supports file handles */ 976ad204488SMiklos Szeredi if (ofs->config.index && 977ad204488SMiklos Szeredi !ovl_can_decode_fh(ofs->workdir->d_sb)) { 978ad204488SMiklos Szeredi ofs->config.index = false; 9798ed61dc3SMiklos Szeredi pr_warn("overlayfs: upper fs does not support file handles, falling back to index=off.\n"); 9808ed61dc3SMiklos Szeredi } 9818ed61dc3SMiklos Szeredi 9828ed61dc3SMiklos Szeredi return 0; 9838ed61dc3SMiklos Szeredi } 9848ed61dc3SMiklos Szeredi 985ad204488SMiklos Szeredi static int ovl_get_workdir(struct ovl_fs *ofs, struct path *upperpath) 986520d7c86SMiklos Szeredi { 987520d7c86SMiklos Szeredi int err; 988bca44b52SMiklos Szeredi struct path workpath = { }; 989520d7c86SMiklos Szeredi 990ad204488SMiklos Szeredi err = ovl_mount_dir(ofs->config.workdir, &workpath); 991520d7c86SMiklos Szeredi if (err) 992520d7c86SMiklos Szeredi goto out; 993520d7c86SMiklos Szeredi 994520d7c86SMiklos Szeredi err = -EINVAL; 995bca44b52SMiklos Szeredi if (upperpath->mnt != workpath.mnt) { 996520d7c86SMiklos Szeredi pr_err("overlayfs: workdir and upperdir must reside under the same mount\n"); 997520d7c86SMiklos Szeredi goto out; 998520d7c86SMiklos Szeredi } 999bca44b52SMiklos Szeredi if (!ovl_workdir_ok(workpath.dentry, upperpath->dentry)) { 1000520d7c86SMiklos Szeredi pr_err("overlayfs: workdir and upperdir must be separate subtrees\n"); 1001520d7c86SMiklos Szeredi goto out; 1002520d7c86SMiklos Szeredi } 1003520d7c86SMiklos Szeredi 1004520d7c86SMiklos Szeredi err = -EBUSY; 1005bca44b52SMiklos Szeredi if (ovl_inuse_trylock(workpath.dentry)) { 1006ad204488SMiklos Szeredi ofs->workdir_locked = true; 1007ad204488SMiklos Szeredi } else if (ofs->config.index) { 1008520d7c86SMiklos Szeredi pr_err("overlayfs: workdir is in-use by another mount, mount with '-o index=off' to override exclusive workdir protection.\n"); 1009520d7c86SMiklos Szeredi goto out; 1010520d7c86SMiklos Szeredi } else { 1011520d7c86SMiklos Szeredi pr_warn("overlayfs: workdir is in-use by another mount, accessing files from both mounts will result in undefined behavior.\n"); 1012520d7c86SMiklos Szeredi } 1013520d7c86SMiklos Szeredi 1014ad204488SMiklos Szeredi ofs->workbasedir = dget(workpath.dentry); 1015ad204488SMiklos Szeredi err = ovl_make_workdir(ofs, &workpath); 1016bca44b52SMiklos Szeredi if (err) 1017bca44b52SMiklos Szeredi goto out; 1018bca44b52SMiklos Szeredi 1019520d7c86SMiklos Szeredi err = 0; 1020520d7c86SMiklos Szeredi out: 1021bca44b52SMiklos Szeredi path_put(&workpath); 1022bca44b52SMiklos Szeredi 1023520d7c86SMiklos Szeredi return err; 1024520d7c86SMiklos Szeredi } 1025520d7c86SMiklos Szeredi 1026ad204488SMiklos Szeredi static int ovl_get_indexdir(struct ovl_fs *ofs, struct ovl_entry *oe, 102795e6d417SMiklos Szeredi struct path *upperpath) 1028f7e3a7d9SMiklos Szeredi { 1029f7e3a7d9SMiklos Szeredi int err; 1030f7e3a7d9SMiklos Szeredi 1031f7e3a7d9SMiklos Szeredi /* Verify lower root is upper root origin */ 1032d9768076SAmir Goldstein err = ovl_verify_origin(upperpath->dentry, oe->lowerstack[0].dentry, 1033f7e3a7d9SMiklos Szeredi false, true); 1034f7e3a7d9SMiklos Szeredi if (err) { 1035f7e3a7d9SMiklos Szeredi pr_err("overlayfs: failed to verify upper root origin\n"); 1036f7e3a7d9SMiklos Szeredi goto out; 1037f7e3a7d9SMiklos Szeredi } 1038f7e3a7d9SMiklos Szeredi 1039ad204488SMiklos Szeredi ofs->indexdir = ovl_workdir_create(ofs, OVL_INDEXDIR_NAME, true); 1040ad204488SMiklos Szeredi if (ofs->indexdir) { 1041f7e3a7d9SMiklos Szeredi /* Verify upper root is index dir origin */ 1042d9768076SAmir Goldstein err = ovl_verify_origin(ofs->indexdir, upperpath->dentry, 1043d9768076SAmir Goldstein true, true); 1044f7e3a7d9SMiklos Szeredi if (err) 1045f7e3a7d9SMiklos Szeredi pr_err("overlayfs: failed to verify index dir origin\n"); 1046f7e3a7d9SMiklos Szeredi 1047f7e3a7d9SMiklos Szeredi /* Cleanup bad/stale/orphan index entries */ 1048f7e3a7d9SMiklos Szeredi if (!err) 1049ad204488SMiklos Szeredi err = ovl_indexdir_cleanup(ofs->indexdir, 1050ad204488SMiklos Szeredi ofs->upper_mnt, 1051f7e3a7d9SMiklos Szeredi oe->lowerstack, 1052f7e3a7d9SMiklos Szeredi oe->numlower); 1053f7e3a7d9SMiklos Szeredi } 1054ad204488SMiklos Szeredi if (err || !ofs->indexdir) 1055f7e3a7d9SMiklos Szeredi pr_warn("overlayfs: try deleting index dir or mounting with '-o index=off' to disable inodes index.\n"); 1056f7e3a7d9SMiklos Szeredi 1057f7e3a7d9SMiklos Szeredi out: 1058f7e3a7d9SMiklos Szeredi return err; 1059f7e3a7d9SMiklos Szeredi } 1060f7e3a7d9SMiklos Szeredi 1061ad204488SMiklos Szeredi static int ovl_get_lower_layers(struct ovl_fs *ofs, struct path *stack, 1062520d7c86SMiklos Szeredi unsigned int numlower) 1063520d7c86SMiklos Szeredi { 1064520d7c86SMiklos Szeredi int err; 1065520d7c86SMiklos Szeredi unsigned int i; 1066520d7c86SMiklos Szeredi 1067520d7c86SMiklos Szeredi err = -ENOMEM; 1068ad204488SMiklos Szeredi ofs->lower_layers = kcalloc(numlower, sizeof(struct ovl_layer), 1069520d7c86SMiklos Szeredi GFP_KERNEL); 1070ad204488SMiklos Szeredi if (ofs->lower_layers == NULL) 1071520d7c86SMiklos Szeredi goto out; 1072520d7c86SMiklos Szeredi for (i = 0; i < numlower; i++) { 1073520d7c86SMiklos Szeredi struct vfsmount *mnt; 1074520d7c86SMiklos Szeredi dev_t dev; 1075520d7c86SMiklos Szeredi 1076520d7c86SMiklos Szeredi err = get_anon_bdev(&dev); 1077520d7c86SMiklos Szeredi if (err) { 1078520d7c86SMiklos Szeredi pr_err("overlayfs: failed to get anonymous bdev for lowerpath\n"); 1079520d7c86SMiklos Szeredi goto out; 1080520d7c86SMiklos Szeredi } 1081520d7c86SMiklos Szeredi 1082520d7c86SMiklos Szeredi mnt = clone_private_mount(&stack[i]); 1083520d7c86SMiklos Szeredi err = PTR_ERR(mnt); 1084520d7c86SMiklos Szeredi if (IS_ERR(mnt)) { 1085520d7c86SMiklos Szeredi pr_err("overlayfs: failed to clone lowerpath\n"); 1086520d7c86SMiklos Szeredi free_anon_bdev(dev); 1087520d7c86SMiklos Szeredi goto out; 1088520d7c86SMiklos Szeredi } 1089520d7c86SMiklos Szeredi /* 1090520d7c86SMiklos Szeredi * Make lower layers R/O. That way fchmod/fchown on lower file 1091520d7c86SMiklos Szeredi * will fail instead of modifying lower fs. 1092520d7c86SMiklos Szeredi */ 1093520d7c86SMiklos Szeredi mnt->mnt_flags |= MNT_READONLY | MNT_NOATIME; 1094520d7c86SMiklos Szeredi 1095ad204488SMiklos Szeredi ofs->lower_layers[ofs->numlower].mnt = mnt; 1096ad204488SMiklos Szeredi ofs->lower_layers[ofs->numlower].pseudo_dev = dev; 1097ad204488SMiklos Szeredi ofs->numlower++; 1098520d7c86SMiklos Szeredi 1099520d7c86SMiklos Szeredi /* Check if all lower layers are on same sb */ 1100520d7c86SMiklos Szeredi if (i == 0) 1101ad204488SMiklos Szeredi ofs->same_sb = mnt->mnt_sb; 1102ad204488SMiklos Szeredi else if (ofs->same_sb != mnt->mnt_sb) 1103ad204488SMiklos Szeredi ofs->same_sb = NULL; 1104520d7c86SMiklos Szeredi } 1105520d7c86SMiklos Szeredi err = 0; 1106520d7c86SMiklos Szeredi out: 1107520d7c86SMiklos Szeredi return err; 1108520d7c86SMiklos Szeredi } 1109520d7c86SMiklos Szeredi 11104155c10aSMiklos Szeredi static struct ovl_entry *ovl_get_lowerstack(struct super_block *sb, 1111ad204488SMiklos Szeredi struct ovl_fs *ofs) 111253dbb0b4SMiklos Szeredi { 111353dbb0b4SMiklos Szeredi int err; 111453dbb0b4SMiklos Szeredi char *lowertmp, *lower; 11154155c10aSMiklos Szeredi struct path *stack = NULL; 11164155c10aSMiklos Szeredi unsigned int stacklen, numlower = 0, i; 111753dbb0b4SMiklos Szeredi bool remote = false; 11184155c10aSMiklos Szeredi struct ovl_entry *oe; 111953dbb0b4SMiklos Szeredi 112053dbb0b4SMiklos Szeredi err = -ENOMEM; 1121ad204488SMiklos Szeredi lowertmp = kstrdup(ofs->config.lowerdir, GFP_KERNEL); 112253dbb0b4SMiklos Szeredi if (!lowertmp) 11234155c10aSMiklos Szeredi goto out_err; 112453dbb0b4SMiklos Szeredi 112553dbb0b4SMiklos Szeredi err = -EINVAL; 112653dbb0b4SMiklos Szeredi stacklen = ovl_split_lowerdirs(lowertmp); 112753dbb0b4SMiklos Szeredi if (stacklen > OVL_MAX_STACK) { 112853dbb0b4SMiklos Szeredi pr_err("overlayfs: too many lower directories, limit is %d\n", 112953dbb0b4SMiklos Szeredi OVL_MAX_STACK); 11304155c10aSMiklos Szeredi goto out_err; 1131ad204488SMiklos Szeredi } else if (!ofs->config.upperdir && stacklen == 1) { 113253dbb0b4SMiklos Szeredi pr_err("overlayfs: at least 2 lowerdir are needed while upperdir nonexistent\n"); 11334155c10aSMiklos Szeredi goto out_err; 113453dbb0b4SMiklos Szeredi } 113553dbb0b4SMiklos Szeredi 113653dbb0b4SMiklos Szeredi err = -ENOMEM; 113753dbb0b4SMiklos Szeredi stack = kcalloc(stacklen, sizeof(struct path), GFP_KERNEL); 113853dbb0b4SMiklos Szeredi if (!stack) 11394155c10aSMiklos Szeredi goto out_err; 114053dbb0b4SMiklos Szeredi 114153dbb0b4SMiklos Szeredi err = -EINVAL; 114253dbb0b4SMiklos Szeredi lower = lowertmp; 114353dbb0b4SMiklos Szeredi for (numlower = 0; numlower < stacklen; numlower++) { 1144ad204488SMiklos Szeredi err = ovl_lower_dir(lower, &stack[numlower], ofs, 114553dbb0b4SMiklos Szeredi &sb->s_stack_depth, &remote); 114653dbb0b4SMiklos Szeredi if (err) 11474155c10aSMiklos Szeredi goto out_err; 114853dbb0b4SMiklos Szeredi 114953dbb0b4SMiklos Szeredi lower = strchr(lower, '\0') + 1; 115053dbb0b4SMiklos Szeredi } 115153dbb0b4SMiklos Szeredi 115253dbb0b4SMiklos Szeredi err = -EINVAL; 115353dbb0b4SMiklos Szeredi sb->s_stack_depth++; 115453dbb0b4SMiklos Szeredi if (sb->s_stack_depth > FILESYSTEM_MAX_STACK_DEPTH) { 115553dbb0b4SMiklos Szeredi pr_err("overlayfs: maximum fs stacking depth exceeded\n"); 11564155c10aSMiklos Szeredi goto out_err; 115753dbb0b4SMiklos Szeredi } 115853dbb0b4SMiklos Szeredi 1159ad204488SMiklos Szeredi err = ovl_get_lower_layers(ofs, stack, numlower); 11604155c10aSMiklos Szeredi if (err) 11614155c10aSMiklos Szeredi goto out_err; 11624155c10aSMiklos Szeredi 11634155c10aSMiklos Szeredi err = -ENOMEM; 11644155c10aSMiklos Szeredi oe = ovl_alloc_entry(numlower); 11654155c10aSMiklos Szeredi if (!oe) 11664155c10aSMiklos Szeredi goto out_err; 11674155c10aSMiklos Szeredi 11684155c10aSMiklos Szeredi for (i = 0; i < numlower; i++) { 11694155c10aSMiklos Szeredi oe->lowerstack[i].dentry = dget(stack[i].dentry); 1170ad204488SMiklos Szeredi oe->lowerstack[i].layer = &ofs->lower_layers[i]; 11714155c10aSMiklos Szeredi } 117253dbb0b4SMiklos Szeredi 117353dbb0b4SMiklos Szeredi if (remote) 117453dbb0b4SMiklos Szeredi sb->s_d_op = &ovl_reval_dentry_operations; 117553dbb0b4SMiklos Szeredi else 117653dbb0b4SMiklos Szeredi sb->s_d_op = &ovl_dentry_operations; 117753dbb0b4SMiklos Szeredi 117853dbb0b4SMiklos Szeredi out: 117953dbb0b4SMiklos Szeredi for (i = 0; i < numlower; i++) 118053dbb0b4SMiklos Szeredi path_put(&stack[i]); 118153dbb0b4SMiklos Szeredi kfree(stack); 11824155c10aSMiklos Szeredi kfree(lowertmp); 11834155c10aSMiklos Szeredi 11844155c10aSMiklos Szeredi return oe; 11854155c10aSMiklos Szeredi 11864155c10aSMiklos Szeredi out_err: 11874155c10aSMiklos Szeredi oe = ERR_PTR(err); 118853dbb0b4SMiklos Szeredi goto out; 118953dbb0b4SMiklos Szeredi } 119053dbb0b4SMiklos Szeredi 1191e9be9d5eSMiklos Szeredi static int ovl_fill_super(struct super_block *sb, void *data, int silent) 1192e9be9d5eSMiklos Szeredi { 119333006cdfSKees Cook struct path upperpath = { }; 1194e9be9d5eSMiklos Szeredi struct dentry *root_dentry; 11954155c10aSMiklos Szeredi struct ovl_entry *oe; 1196ad204488SMiklos Szeredi struct ovl_fs *ofs; 119751f8f3c4SKonstantin Khlebnikov struct cred *cred; 1198e9be9d5eSMiklos Szeredi int err; 1199e9be9d5eSMiklos Szeredi 1200f45827e8SErez Zadok err = -ENOMEM; 1201ad204488SMiklos Szeredi ofs = kzalloc(sizeof(struct ovl_fs), GFP_KERNEL); 1202ad204488SMiklos Szeredi if (!ofs) 1203e9be9d5eSMiklos Szeredi goto out; 1204e9be9d5eSMiklos Szeredi 1205ad204488SMiklos Szeredi ofs->creator_cred = cred = prepare_creds(); 1206c6fe6254SMiklos Szeredi if (!cred) 1207c6fe6254SMiklos Szeredi goto out_err; 1208c6fe6254SMiklos Szeredi 1209ad204488SMiklos Szeredi ofs->config.index = ovl_index_def; 1210ad204488SMiklos Szeredi err = ovl_parse_opt((char *) data, &ofs->config); 1211f45827e8SErez Zadok if (err) 1212a9075cdbSMiklos Szeredi goto out_err; 1213f45827e8SErez Zadok 1214e9be9d5eSMiklos Szeredi err = -EINVAL; 1215ad204488SMiklos Szeredi if (!ofs->config.lowerdir) { 121607f2af7bSKonstantin Khlebnikov if (!silent) 121753a08cb9SMiklos Szeredi pr_err("overlayfs: missing 'lowerdir'\n"); 1218a9075cdbSMiklos Szeredi goto out_err; 121953a08cb9SMiklos Szeredi } 122053a08cb9SMiklos Szeredi 122153a08cb9SMiklos Szeredi sb->s_stack_depth = 0; 1222cf9a6784SMiklos Szeredi sb->s_maxbytes = MAX_LFS_FILESIZE; 1223ad204488SMiklos Szeredi if (ofs->config.upperdir) { 1224ad204488SMiklos Szeredi if (!ofs->config.workdir) { 122553a08cb9SMiklos Szeredi pr_err("overlayfs: missing 'workdir'\n"); 1226a9075cdbSMiklos Szeredi goto out_err; 1227e9be9d5eSMiklos Szeredi } 1228e9be9d5eSMiklos Szeredi 1229ad204488SMiklos Szeredi err = ovl_get_upper(ofs, &upperpath); 123021a3b317SMiklos Szeredi if (err) 1231a9075cdbSMiklos Szeredi goto out_err; 1232d719e8f2SMiklos Szeredi 1233ad204488SMiklos Szeredi err = ovl_get_workdir(ofs, &upperpath); 12348ed61dc3SMiklos Szeredi if (err) 1235a9075cdbSMiklos Szeredi goto out_err; 1236c6fe6254SMiklos Szeredi 1237ad204488SMiklos Szeredi if (!ofs->workdir) 12381751e8a6SLinus Torvalds sb->s_flags |= SB_RDONLY; 12396e88256eSMiklos Szeredi 1240ad204488SMiklos Szeredi sb->s_stack_depth = ofs->upper_mnt->mnt_sb->s_stack_depth; 1241ad204488SMiklos Szeredi sb->s_time_gran = ofs->upper_mnt->mnt_sb->s_time_gran; 1242c6fe6254SMiklos Szeredi 124321765194SVivek Goyal } 1244ad204488SMiklos Szeredi oe = ovl_get_lowerstack(sb, ofs); 12454155c10aSMiklos Szeredi err = PTR_ERR(oe); 12464155c10aSMiklos Szeredi if (IS_ERR(oe)) 1247a9075cdbSMiklos Szeredi goto out_err; 1248e9be9d5eSMiklos Szeredi 124971cbad7eShujianyang /* If the upper fs is nonexistent, we mark overlayfs r/o too */ 1250ad204488SMiklos Szeredi if (!ofs->upper_mnt) 12511751e8a6SLinus Torvalds sb->s_flags |= SB_RDONLY; 1252ad204488SMiklos Szeredi else if (ofs->upper_mnt->mnt_sb != ofs->same_sb) 1253ad204488SMiklos Szeredi ofs->same_sb = NULL; 1254e9be9d5eSMiklos Szeredi 1255ad204488SMiklos Szeredi if (!(ovl_force_readonly(ofs)) && ofs->config.index) { 1256ad204488SMiklos Szeredi err = ovl_get_indexdir(ofs, oe, &upperpath); 125754fb347eSAmir Goldstein if (err) 12584155c10aSMiklos Szeredi goto out_free_oe; 12596e88256eSMiklos Szeredi 1260ad204488SMiklos Szeredi if (!ofs->indexdir) 12611751e8a6SLinus Torvalds sb->s_flags |= SB_RDONLY; 126202bcd157SAmir Goldstein } 126302bcd157SAmir Goldstein 126402bcd157SAmir Goldstein /* Show index=off/on in /proc/mounts for any of the reasons above */ 1265ad204488SMiklos Szeredi if (!ofs->indexdir) 1266ad204488SMiklos Szeredi ofs->config.index = false; 126702bcd157SAmir Goldstein 126851f8f3c4SKonstantin Khlebnikov /* Never override disk quota limits or use reserved space */ 126951f8f3c4SKonstantin Khlebnikov cap_lower(cred->cap_effective, CAP_SYS_RESOURCE); 127051f8f3c4SKonstantin Khlebnikov 1271655042ccSVivek Goyal sb->s_magic = OVERLAYFS_SUPER_MAGIC; 1272655042ccSVivek Goyal sb->s_op = &ovl_super_operations; 1273655042ccSVivek Goyal sb->s_xattr = ovl_xattr_handlers; 1274ad204488SMiklos Szeredi sb->s_fs_info = ofs; 12751751e8a6SLinus Torvalds sb->s_flags |= SB_POSIXACL | SB_NOREMOTELOCK; 1276655042ccSVivek Goyal 1277c6fe6254SMiklos Szeredi err = -ENOMEM; 1278ca4c8a3aSMiklos Szeredi root_dentry = d_make_root(ovl_new_inode(sb, S_IFDIR, 0)); 1279e9be9d5eSMiklos Szeredi if (!root_dentry) 12804155c10aSMiklos Szeredi goto out_free_oe; 1281e9be9d5eSMiklos Szeredi 1282e9be9d5eSMiklos Szeredi mntput(upperpath.mnt); 1283f3a15685SAmir Goldstein if (upperpath.dentry) { 128455acc661SMiklos Szeredi oe->has_upper = true; 128513c72075SMiklos Szeredi if (ovl_is_impuredir(upperpath.dentry)) 128613c72075SMiklos Szeredi ovl_set_flag(OVL_IMPURE, d_inode(root_dentry)); 1287f3a15685SAmir Goldstein } 1288e9be9d5eSMiklos Szeredi 1289e9be9d5eSMiklos Szeredi root_dentry->d_fsdata = oe; 1290e9be9d5eSMiklos Szeredi 1291b79e05aaSAmir Goldstein /* Root is always merge -> can have whiteouts */ 1292b79e05aaSAmir Goldstein ovl_set_flag(OVL_WHITEOUTS, d_inode(root_dentry)); 129309d8b586SMiklos Szeredi ovl_inode_init(d_inode(root_dentry), upperpath.dentry, 129409d8b586SMiklos Szeredi ovl_dentry_lower(root_dentry)); 1295ed06e069SMiklos Szeredi 1296e9be9d5eSMiklos Szeredi sb->s_root = root_dentry; 1297e9be9d5eSMiklos Szeredi 1298e9be9d5eSMiklos Szeredi return 0; 1299e9be9d5eSMiklos Szeredi 13004155c10aSMiklos Szeredi out_free_oe: 13014155c10aSMiklos Szeredi ovl_entry_stack_free(oe); 1302b9343632SChandan Rajendra kfree(oe); 13034155c10aSMiklos Szeredi out_err: 1304e9be9d5eSMiklos Szeredi path_put(&upperpath); 1305ad204488SMiklos Szeredi ovl_free_fs(ofs); 1306e9be9d5eSMiklos Szeredi out: 1307e9be9d5eSMiklos Szeredi return err; 1308e9be9d5eSMiklos Szeredi } 1309e9be9d5eSMiklos Szeredi 1310e9be9d5eSMiklos Szeredi static struct dentry *ovl_mount(struct file_system_type *fs_type, int flags, 1311e9be9d5eSMiklos Szeredi const char *dev_name, void *raw_data) 1312e9be9d5eSMiklos Szeredi { 1313e9be9d5eSMiklos Szeredi return mount_nodev(fs_type, flags, raw_data, ovl_fill_super); 1314e9be9d5eSMiklos Szeredi } 1315e9be9d5eSMiklos Szeredi 1316e9be9d5eSMiklos Szeredi static struct file_system_type ovl_fs_type = { 1317e9be9d5eSMiklos Szeredi .owner = THIS_MODULE, 1318ef94b186SMiklos Szeredi .name = "overlay", 1319e9be9d5eSMiklos Szeredi .mount = ovl_mount, 1320e9be9d5eSMiklos Szeredi .kill_sb = kill_anon_super, 1321e9be9d5eSMiklos Szeredi }; 1322ef94b186SMiklos Szeredi MODULE_ALIAS_FS("overlay"); 1323e9be9d5eSMiklos Szeredi 132413cf199dSAmir Goldstein static void ovl_inode_init_once(void *foo) 132513cf199dSAmir Goldstein { 132613cf199dSAmir Goldstein struct ovl_inode *oi = foo; 132713cf199dSAmir Goldstein 132813cf199dSAmir Goldstein inode_init_once(&oi->vfs_inode); 132913cf199dSAmir Goldstein } 133013cf199dSAmir Goldstein 1331e9be9d5eSMiklos Szeredi static int __init ovl_init(void) 1332e9be9d5eSMiklos Szeredi { 133313cf199dSAmir Goldstein int err; 133413cf199dSAmir Goldstein 133513cf199dSAmir Goldstein ovl_inode_cachep = kmem_cache_create("ovl_inode", 133613cf199dSAmir Goldstein sizeof(struct ovl_inode), 0, 133713cf199dSAmir Goldstein (SLAB_RECLAIM_ACCOUNT| 133813cf199dSAmir Goldstein SLAB_MEM_SPREAD|SLAB_ACCOUNT), 133913cf199dSAmir Goldstein ovl_inode_init_once); 134013cf199dSAmir Goldstein if (ovl_inode_cachep == NULL) 134113cf199dSAmir Goldstein return -ENOMEM; 134213cf199dSAmir Goldstein 134313cf199dSAmir Goldstein err = register_filesystem(&ovl_fs_type); 134413cf199dSAmir Goldstein if (err) 134513cf199dSAmir Goldstein kmem_cache_destroy(ovl_inode_cachep); 134613cf199dSAmir Goldstein 134713cf199dSAmir Goldstein return err; 1348e9be9d5eSMiklos Szeredi } 1349e9be9d5eSMiklos Szeredi 1350e9be9d5eSMiklos Szeredi static void __exit ovl_exit(void) 1351e9be9d5eSMiklos Szeredi { 1352e9be9d5eSMiklos Szeredi unregister_filesystem(&ovl_fs_type); 135313cf199dSAmir Goldstein 135413cf199dSAmir Goldstein /* 135513cf199dSAmir Goldstein * Make sure all delayed rcu free inodes are flushed before we 135613cf199dSAmir Goldstein * destroy cache. 135713cf199dSAmir Goldstein */ 135813cf199dSAmir Goldstein rcu_barrier(); 135913cf199dSAmir Goldstein kmem_cache_destroy(ovl_inode_cachep); 136013cf199dSAmir Goldstein 1361e9be9d5eSMiklos Szeredi } 1362e9be9d5eSMiklos Szeredi 1363e9be9d5eSMiklos Szeredi module_init(ovl_init); 1364e9be9d5eSMiklos Szeredi module_exit(ovl_exit); 1365