xref: /openbmc/linux/fs/overlayfs/super.c (revision e8d4bfe3)
1e9be9d5eSMiklos Szeredi /*
2e9be9d5eSMiklos Szeredi  *
3e9be9d5eSMiklos Szeredi  * Copyright (C) 2011 Novell Inc.
4e9be9d5eSMiklos Szeredi  *
5e9be9d5eSMiklos Szeredi  * This program is free software; you can redistribute it and/or modify it
6e9be9d5eSMiklos Szeredi  * under the terms of the GNU General Public License version 2 as published by
7e9be9d5eSMiklos Szeredi  * the Free Software Foundation.
8e9be9d5eSMiklos Szeredi  */
9e9be9d5eSMiklos Szeredi 
105b825c3aSIngo Molnar #include <uapi/linux/magic.h>
11e9be9d5eSMiklos Szeredi #include <linux/fs.h>
12e9be9d5eSMiklos Szeredi #include <linux/namei.h>
13e9be9d5eSMiklos Szeredi #include <linux/xattr.h>
14e9be9d5eSMiklos Szeredi #include <linux/mount.h>
15e9be9d5eSMiklos Szeredi #include <linux/parser.h>
16e9be9d5eSMiklos Szeredi #include <linux/module.h>
17cc259639SAndy Whitcroft #include <linux/statfs.h>
18f45827e8SErez Zadok #include <linux/seq_file.h>
19d837a49bSMiklos Szeredi #include <linux/posix_acl_xattr.h>
20e9be9d5eSMiklos Szeredi #include "overlayfs.h"
21e9be9d5eSMiklos Szeredi 
22e9be9d5eSMiklos Szeredi MODULE_AUTHOR("Miklos Szeredi <miklos@szeredi.hu>");
23e9be9d5eSMiklos Szeredi MODULE_DESCRIPTION("Overlay filesystem");
24e9be9d5eSMiklos Szeredi MODULE_LICENSE("GPL");
25e9be9d5eSMiklos Szeredi 
26e9be9d5eSMiklos Szeredi 
27e9be9d5eSMiklos Szeredi struct ovl_dir_cache;
28e9be9d5eSMiklos Szeredi 
29a78d9f0dSMiklos Szeredi #define OVL_MAX_STACK 500
30a78d9f0dSMiklos Szeredi 
31688ea0e5SMiklos Szeredi static bool ovl_redirect_dir_def = IS_ENABLED(CONFIG_OVERLAY_FS_REDIRECT_DIR);
32688ea0e5SMiklos Szeredi module_param_named(redirect_dir, ovl_redirect_dir_def, bool, 0644);
33688ea0e5SMiklos Szeredi MODULE_PARM_DESC(ovl_redirect_dir_def,
34688ea0e5SMiklos Szeredi 		 "Default to on or off for the redirect_dir feature");
35e9be9d5eSMiklos Szeredi 
36438c84c2SMiklos Szeredi static bool ovl_redirect_always_follow =
37438c84c2SMiklos Szeredi 	IS_ENABLED(CONFIG_OVERLAY_FS_REDIRECT_ALWAYS_FOLLOW);
38438c84c2SMiklos Szeredi module_param_named(redirect_always_follow, ovl_redirect_always_follow,
39438c84c2SMiklos Szeredi 		   bool, 0644);
40438c84c2SMiklos Szeredi MODULE_PARM_DESC(ovl_redirect_always_follow,
41438c84c2SMiklos Szeredi 		 "Follow redirects even if redirect_dir feature is turned off");
42438c84c2SMiklos Szeredi 
4302bcd157SAmir Goldstein static bool ovl_index_def = IS_ENABLED(CONFIG_OVERLAY_FS_INDEX);
4402bcd157SAmir Goldstein module_param_named(index, ovl_index_def, bool, 0644);
4502bcd157SAmir Goldstein MODULE_PARM_DESC(ovl_index_def,
4602bcd157SAmir Goldstein 		 "Default to on or off for the inodes index feature");
4702bcd157SAmir Goldstein 
484155c10aSMiklos Szeredi static void ovl_entry_stack_free(struct ovl_entry *oe)
494155c10aSMiklos Szeredi {
504155c10aSMiklos Szeredi 	unsigned int i;
514155c10aSMiklos Szeredi 
524155c10aSMiklos Szeredi 	for (i = 0; i < oe->numlower; i++)
534155c10aSMiklos Szeredi 		dput(oe->lowerstack[i].dentry);
544155c10aSMiklos Szeredi }
554155c10aSMiklos Szeredi 
56e9be9d5eSMiklos Szeredi static void ovl_dentry_release(struct dentry *dentry)
57e9be9d5eSMiklos Szeredi {
58e9be9d5eSMiklos Szeredi 	struct ovl_entry *oe = dentry->d_fsdata;
59e9be9d5eSMiklos Szeredi 
60e9be9d5eSMiklos Szeredi 	if (oe) {
614155c10aSMiklos Szeredi 		ovl_entry_stack_free(oe);
62e9be9d5eSMiklos Szeredi 		kfree_rcu(oe, rcu);
63e9be9d5eSMiklos Szeredi 	}
64e9be9d5eSMiklos Szeredi }
65e9be9d5eSMiklos Szeredi 
66b0990fbbSAmir Goldstein static int ovl_check_append_only(struct inode *inode, int flag)
67b0990fbbSAmir Goldstein {
68b0990fbbSAmir Goldstein 	/*
69b0990fbbSAmir Goldstein 	 * This test was moot in vfs may_open() because overlay inode does
70b0990fbbSAmir Goldstein 	 * not have the S_APPEND flag, so re-check on real upper inode
71b0990fbbSAmir Goldstein 	 */
72b0990fbbSAmir Goldstein 	if (IS_APPEND(inode)) {
73b0990fbbSAmir Goldstein 		if  ((flag & O_ACCMODE) != O_RDONLY && !(flag & O_APPEND))
74b0990fbbSAmir Goldstein 			return -EPERM;
75b0990fbbSAmir Goldstein 		if (flag & O_TRUNC)
76b0990fbbSAmir Goldstein 			return -EPERM;
77b0990fbbSAmir Goldstein 	}
78b0990fbbSAmir Goldstein 
79b0990fbbSAmir Goldstein 	return 0;
80b0990fbbSAmir Goldstein }
81b0990fbbSAmir Goldstein 
822d902671SMiklos Szeredi static struct dentry *ovl_d_real(struct dentry *dentry,
832d902671SMiklos Szeredi 				 const struct inode *inode,
84495e6429SMiklos Szeredi 				 unsigned int open_flags, unsigned int flags)
85d101a125SMiklos Szeredi {
86d101a125SMiklos Szeredi 	struct dentry *real;
87b0990fbbSAmir Goldstein 	int err;
88d101a125SMiklos Szeredi 
89cd91304eSMiklos Szeredi 	if (flags & D_REAL_UPPER)
90cd91304eSMiklos Szeredi 		return ovl_dentry_upper(dentry);
91cd91304eSMiklos Szeredi 
92ca4c8a3aSMiklos Szeredi 	if (!d_is_reg(dentry)) {
93d101a125SMiklos Szeredi 		if (!inode || inode == d_inode(dentry))
94d101a125SMiklos Szeredi 			return dentry;
95d101a125SMiklos Szeredi 		goto bug;
96d101a125SMiklos Szeredi 	}
97d101a125SMiklos Szeredi 
982d902671SMiklos Szeredi 	if (open_flags) {
99b0990fbbSAmir Goldstein 		err = ovl_open_maybe_copy_up(dentry, open_flags);
1002d902671SMiklos Szeredi 		if (err)
1012d902671SMiklos Szeredi 			return ERR_PTR(err);
1022d902671SMiklos Szeredi 	}
1032d902671SMiklos Szeredi 
104d101a125SMiklos Szeredi 	real = ovl_dentry_upper(dentry);
105b0990fbbSAmir Goldstein 	if (real && (!inode || inode == d_inode(real))) {
106b0990fbbSAmir Goldstein 		if (!inode) {
107b0990fbbSAmir Goldstein 			err = ovl_check_append_only(d_inode(real), open_flags);
108b0990fbbSAmir Goldstein 			if (err)
109b0990fbbSAmir Goldstein 				return ERR_PTR(err);
110b0990fbbSAmir Goldstein 		}
111d101a125SMiklos Szeredi 		return real;
112b0990fbbSAmir Goldstein 	}
113d101a125SMiklos Szeredi 
114d101a125SMiklos Szeredi 	real = ovl_dentry_lower(dentry);
115d101a125SMiklos Szeredi 	if (!real)
116d101a125SMiklos Szeredi 		goto bug;
117d101a125SMiklos Szeredi 
118c4fcfc16SMiklos Szeredi 	/* Handle recursion */
119495e6429SMiklos Szeredi 	real = d_real(real, inode, open_flags, 0);
120c4fcfc16SMiklos Szeredi 
121d101a125SMiklos Szeredi 	if (!inode || inode == d_inode(real))
122d101a125SMiklos Szeredi 		return real;
123d101a125SMiklos Szeredi bug:
124656189d2SMiklos Szeredi 	WARN(1, "ovl_d_real(%pd4, %s:%lu): real dentry not found\n", dentry,
125d101a125SMiklos Szeredi 	     inode ? inode->i_sb->s_id : "NULL", inode ? inode->i_ino : 0);
126d101a125SMiklos Szeredi 	return dentry;
127d101a125SMiklos Szeredi }
128d101a125SMiklos Szeredi 
1297c03b5d4SMiklos Szeredi static int ovl_dentry_revalidate(struct dentry *dentry, unsigned int flags)
1307c03b5d4SMiklos Szeredi {
1317c03b5d4SMiklos Szeredi 	struct ovl_entry *oe = dentry->d_fsdata;
1327c03b5d4SMiklos Szeredi 	unsigned int i;
1337c03b5d4SMiklos Szeredi 	int ret = 1;
1347c03b5d4SMiklos Szeredi 
1357c03b5d4SMiklos Szeredi 	for (i = 0; i < oe->numlower; i++) {
1367c03b5d4SMiklos Szeredi 		struct dentry *d = oe->lowerstack[i].dentry;
1377c03b5d4SMiklos Szeredi 
1387c03b5d4SMiklos Szeredi 		if (d->d_flags & DCACHE_OP_REVALIDATE) {
1397c03b5d4SMiklos Szeredi 			ret = d->d_op->d_revalidate(d, flags);
1407c03b5d4SMiklos Szeredi 			if (ret < 0)
1417c03b5d4SMiklos Szeredi 				return ret;
1427c03b5d4SMiklos Szeredi 			if (!ret) {
1437c03b5d4SMiklos Szeredi 				if (!(flags & LOOKUP_RCU))
1447c03b5d4SMiklos Szeredi 					d_invalidate(d);
1457c03b5d4SMiklos Szeredi 				return -ESTALE;
1467c03b5d4SMiklos Szeredi 			}
1477c03b5d4SMiklos Szeredi 		}
1487c03b5d4SMiklos Szeredi 	}
1497c03b5d4SMiklos Szeredi 	return 1;
1507c03b5d4SMiklos Szeredi }
1517c03b5d4SMiklos Szeredi 
1527c03b5d4SMiklos Szeredi static int ovl_dentry_weak_revalidate(struct dentry *dentry, unsigned int flags)
1537c03b5d4SMiklos Szeredi {
1547c03b5d4SMiklos Szeredi 	struct ovl_entry *oe = dentry->d_fsdata;
1557c03b5d4SMiklos Szeredi 	unsigned int i;
1567c03b5d4SMiklos Szeredi 	int ret = 1;
1577c03b5d4SMiklos Szeredi 
1587c03b5d4SMiklos Szeredi 	for (i = 0; i < oe->numlower; i++) {
1597c03b5d4SMiklos Szeredi 		struct dentry *d = oe->lowerstack[i].dentry;
1607c03b5d4SMiklos Szeredi 
1617c03b5d4SMiklos Szeredi 		if (d->d_flags & DCACHE_OP_WEAK_REVALIDATE) {
1627c03b5d4SMiklos Szeredi 			ret = d->d_op->d_weak_revalidate(d, flags);
1637c03b5d4SMiklos Szeredi 			if (ret <= 0)
1647c03b5d4SMiklos Szeredi 				break;
1657c03b5d4SMiklos Szeredi 		}
1667c03b5d4SMiklos Szeredi 	}
1677c03b5d4SMiklos Szeredi 	return ret;
1687c03b5d4SMiklos Szeredi }
1697c03b5d4SMiklos Szeredi 
170e9be9d5eSMiklos Szeredi static const struct dentry_operations ovl_dentry_operations = {
171e9be9d5eSMiklos Szeredi 	.d_release = ovl_dentry_release,
172d101a125SMiklos Szeredi 	.d_real = ovl_d_real,
173e9be9d5eSMiklos Szeredi };
174e9be9d5eSMiklos Szeredi 
1757c03b5d4SMiklos Szeredi static const struct dentry_operations ovl_reval_dentry_operations = {
1767c03b5d4SMiklos Szeredi 	.d_release = ovl_dentry_release,
177d101a125SMiklos Szeredi 	.d_real = ovl_d_real,
1787c03b5d4SMiklos Szeredi 	.d_revalidate = ovl_dentry_revalidate,
1797c03b5d4SMiklos Szeredi 	.d_weak_revalidate = ovl_dentry_weak_revalidate,
1807c03b5d4SMiklos Szeredi };
1817c03b5d4SMiklos Szeredi 
18213cf199dSAmir Goldstein static struct kmem_cache *ovl_inode_cachep;
18313cf199dSAmir Goldstein 
18413cf199dSAmir Goldstein static struct inode *ovl_alloc_inode(struct super_block *sb)
18513cf199dSAmir Goldstein {
18613cf199dSAmir Goldstein 	struct ovl_inode *oi = kmem_cache_alloc(ovl_inode_cachep, GFP_KERNEL);
18713cf199dSAmir Goldstein 
188b3885bd6SHirofumi Nakagawa 	if (!oi)
189b3885bd6SHirofumi Nakagawa 		return NULL;
190b3885bd6SHirofumi Nakagawa 
19104a01ac7SMiklos Szeredi 	oi->cache = NULL;
192cf31c463SMiklos Szeredi 	oi->redirect = NULL;
19304a01ac7SMiklos Szeredi 	oi->version = 0;
19413c72075SMiklos Szeredi 	oi->flags = 0;
19509d8b586SMiklos Szeredi 	oi->__upperdentry = NULL;
19625b7713aSMiklos Szeredi 	oi->lower = NULL;
197a015dafcSAmir Goldstein 	mutex_init(&oi->lock);
19825b7713aSMiklos Szeredi 
19913cf199dSAmir Goldstein 	return &oi->vfs_inode;
20013cf199dSAmir Goldstein }
20113cf199dSAmir Goldstein 
20213cf199dSAmir Goldstein static void ovl_i_callback(struct rcu_head *head)
20313cf199dSAmir Goldstein {
20413cf199dSAmir Goldstein 	struct inode *inode = container_of(head, struct inode, i_rcu);
20513cf199dSAmir Goldstein 
20613cf199dSAmir Goldstein 	kmem_cache_free(ovl_inode_cachep, OVL_I(inode));
20713cf199dSAmir Goldstein }
20813cf199dSAmir Goldstein 
20913cf199dSAmir Goldstein static void ovl_destroy_inode(struct inode *inode)
21013cf199dSAmir Goldstein {
21109d8b586SMiklos Szeredi 	struct ovl_inode *oi = OVL_I(inode);
21209d8b586SMiklos Szeredi 
21309d8b586SMiklos Szeredi 	dput(oi->__upperdentry);
214cf31c463SMiklos Szeredi 	kfree(oi->redirect);
2154edb83bbSMiklos Szeredi 	ovl_dir_cache_free(inode);
216a015dafcSAmir Goldstein 	mutex_destroy(&oi->lock);
21709d8b586SMiklos Szeredi 
21813cf199dSAmir Goldstein 	call_rcu(&inode->i_rcu, ovl_i_callback);
21913cf199dSAmir Goldstein }
22013cf199dSAmir Goldstein 
221ad204488SMiklos Szeredi static void ovl_free_fs(struct ovl_fs *ofs)
222e9be9d5eSMiklos Szeredi {
223dd662667SMiklos Szeredi 	unsigned i;
224e9be9d5eSMiklos Szeredi 
225ad204488SMiklos Szeredi 	dput(ofs->indexdir);
226ad204488SMiklos Szeredi 	dput(ofs->workdir);
227ad204488SMiklos Szeredi 	if (ofs->workdir_locked)
228ad204488SMiklos Szeredi 		ovl_inuse_unlock(ofs->workbasedir);
229ad204488SMiklos Szeredi 	dput(ofs->workbasedir);
230ad204488SMiklos Szeredi 	if (ofs->upperdir_locked)
231ad204488SMiklos Szeredi 		ovl_inuse_unlock(ofs->upper_mnt->mnt_root);
232ad204488SMiklos Szeredi 	mntput(ofs->upper_mnt);
233ad204488SMiklos Szeredi 	for (i = 0; i < ofs->numlower; i++) {
234ad204488SMiklos Szeredi 		mntput(ofs->lower_layers[i].mnt);
235ad204488SMiklos Szeredi 		free_anon_bdev(ofs->lower_layers[i].pseudo_dev);
2362a9c6d06SChandan Rajendra 	}
237ad204488SMiklos Szeredi 	kfree(ofs->lower_layers);
238e9be9d5eSMiklos Szeredi 
239ad204488SMiklos Szeredi 	kfree(ofs->config.lowerdir);
240ad204488SMiklos Szeredi 	kfree(ofs->config.upperdir);
241ad204488SMiklos Szeredi 	kfree(ofs->config.workdir);
242438c84c2SMiklos Szeredi 	kfree(ofs->config.redirect_mode);
243ad204488SMiklos Szeredi 	if (ofs->creator_cred)
244ad204488SMiklos Szeredi 		put_cred(ofs->creator_cred);
245ad204488SMiklos Szeredi 	kfree(ofs);
246e9be9d5eSMiklos Szeredi }
247e9be9d5eSMiklos Szeredi 
248a9075cdbSMiklos Szeredi static void ovl_put_super(struct super_block *sb)
249a9075cdbSMiklos Szeredi {
250a9075cdbSMiklos Szeredi 	struct ovl_fs *ofs = sb->s_fs_info;
251a9075cdbSMiklos Szeredi 
252a9075cdbSMiklos Szeredi 	ovl_free_fs(ofs);
253a9075cdbSMiklos Szeredi }
254a9075cdbSMiklos Szeredi 
255e8d4bfe3SChengguang Xu /* Sync real dirty inodes in upper filesystem (if it exists) */
256e593b2bfSAmir Goldstein static int ovl_sync_fs(struct super_block *sb, int wait)
257e593b2bfSAmir Goldstein {
258ad204488SMiklos Szeredi 	struct ovl_fs *ofs = sb->s_fs_info;
259e593b2bfSAmir Goldstein 	struct super_block *upper_sb;
260e593b2bfSAmir Goldstein 	int ret;
261e593b2bfSAmir Goldstein 
262ad204488SMiklos Szeredi 	if (!ofs->upper_mnt)
263e593b2bfSAmir Goldstein 		return 0;
264e8d4bfe3SChengguang Xu 
265e8d4bfe3SChengguang Xu 	/*
266e8d4bfe3SChengguang Xu 	 * If this is a sync(2) call or an emergency sync, all the super blocks
267e8d4bfe3SChengguang Xu 	 * will be iterated, including upper_sb, so no need to do anything.
268e8d4bfe3SChengguang Xu 	 *
269e8d4bfe3SChengguang Xu 	 * If this is a syncfs(2) call, then we do need to call
270e8d4bfe3SChengguang Xu 	 * sync_filesystem() on upper_sb, but enough if we do it when being
271e8d4bfe3SChengguang Xu 	 * called with wait == 1.
272e8d4bfe3SChengguang Xu 	 */
273e8d4bfe3SChengguang Xu 	if (!wait)
274e593b2bfSAmir Goldstein 		return 0;
275e593b2bfSAmir Goldstein 
276e8d4bfe3SChengguang Xu 	upper_sb = ofs->upper_mnt->mnt_sb;
277e8d4bfe3SChengguang Xu 
278e593b2bfSAmir Goldstein 	down_read(&upper_sb->s_umount);
279e8d4bfe3SChengguang Xu 	ret = sync_filesystem(upper_sb);
280e593b2bfSAmir Goldstein 	up_read(&upper_sb->s_umount);
281e8d4bfe3SChengguang Xu 
282e593b2bfSAmir Goldstein 	return ret;
283e593b2bfSAmir Goldstein }
284e593b2bfSAmir Goldstein 
285cc259639SAndy Whitcroft /**
286cc259639SAndy Whitcroft  * ovl_statfs
287cc259639SAndy Whitcroft  * @sb: The overlayfs super block
288cc259639SAndy Whitcroft  * @buf: The struct kstatfs to fill in with stats
289cc259639SAndy Whitcroft  *
290cc259639SAndy Whitcroft  * Get the filesystem statistics.  As writes always target the upper layer
2914ebc5818SMiklos Szeredi  * filesystem pass the statfs to the upper filesystem (if it exists)
292cc259639SAndy Whitcroft  */
293cc259639SAndy Whitcroft static int ovl_statfs(struct dentry *dentry, struct kstatfs *buf)
294cc259639SAndy Whitcroft {
295cc259639SAndy Whitcroft 	struct ovl_fs *ofs = dentry->d_sb->s_fs_info;
296cc259639SAndy Whitcroft 	struct dentry *root_dentry = dentry->d_sb->s_root;
297cc259639SAndy Whitcroft 	struct path path;
298cc259639SAndy Whitcroft 	int err;
299cc259639SAndy Whitcroft 
3004ebc5818SMiklos Szeredi 	ovl_path_real(root_dentry, &path);
301cc259639SAndy Whitcroft 
302cc259639SAndy Whitcroft 	err = vfs_statfs(&path, buf);
303cc259639SAndy Whitcroft 	if (!err) {
3046b2d5fe4SMiklos Szeredi 		buf->f_namelen = ofs->namelen;
305cc259639SAndy Whitcroft 		buf->f_type = OVERLAYFS_SUPER_MAGIC;
306cc259639SAndy Whitcroft 	}
307cc259639SAndy Whitcroft 
308cc259639SAndy Whitcroft 	return err;
309cc259639SAndy Whitcroft }
310cc259639SAndy Whitcroft 
31102bcd157SAmir Goldstein /* Will this overlay be forced to mount/remount ro? */
312ad204488SMiklos Szeredi static bool ovl_force_readonly(struct ovl_fs *ofs)
31302bcd157SAmir Goldstein {
314ad204488SMiklos Szeredi 	return (!ofs->upper_mnt || !ofs->workdir);
31502bcd157SAmir Goldstein }
31602bcd157SAmir Goldstein 
317438c84c2SMiklos Szeredi static const char *ovl_redirect_mode_def(void)
318438c84c2SMiklos Szeredi {
319438c84c2SMiklos Szeredi 	return ovl_redirect_dir_def ? "on" : "off";
320438c84c2SMiklos Szeredi }
321438c84c2SMiklos Szeredi 
322f45827e8SErez Zadok /**
323f45827e8SErez Zadok  * ovl_show_options
324f45827e8SErez Zadok  *
325f45827e8SErez Zadok  * Prints the mount options for a given superblock.
326f45827e8SErez Zadok  * Returns zero; does not fail.
327f45827e8SErez Zadok  */
328f45827e8SErez Zadok static int ovl_show_options(struct seq_file *m, struct dentry *dentry)
329f45827e8SErez Zadok {
330f45827e8SErez Zadok 	struct super_block *sb = dentry->d_sb;
331ad204488SMiklos Szeredi 	struct ovl_fs *ofs = sb->s_fs_info;
332f45827e8SErez Zadok 
333ad204488SMiklos Szeredi 	seq_show_option(m, "lowerdir", ofs->config.lowerdir);
334ad204488SMiklos Szeredi 	if (ofs->config.upperdir) {
335ad204488SMiklos Szeredi 		seq_show_option(m, "upperdir", ofs->config.upperdir);
336ad204488SMiklos Szeredi 		seq_show_option(m, "workdir", ofs->config.workdir);
33753a08cb9SMiklos Szeredi 	}
338ad204488SMiklos Szeredi 	if (ofs->config.default_permissions)
3398d3095f4SMiklos Szeredi 		seq_puts(m, ",default_permissions");
340438c84c2SMiklos Szeredi 	if (strcmp(ofs->config.redirect_mode, ovl_redirect_mode_def()) != 0)
341438c84c2SMiklos Szeredi 		seq_printf(m, ",redirect_dir=%s", ofs->config.redirect_mode);
342ad204488SMiklos Szeredi 	if (ofs->config.index != ovl_index_def)
343438c84c2SMiklos Szeredi 		seq_printf(m, ",index=%s", ofs->config.index ? "on" : "off");
344f45827e8SErez Zadok 	return 0;
345f45827e8SErez Zadok }
346f45827e8SErez Zadok 
3473cdf6fe9SSeunghun Lee static int ovl_remount(struct super_block *sb, int *flags, char *data)
3483cdf6fe9SSeunghun Lee {
349ad204488SMiklos Szeredi 	struct ovl_fs *ofs = sb->s_fs_info;
3503cdf6fe9SSeunghun Lee 
3511751e8a6SLinus Torvalds 	if (!(*flags & SB_RDONLY) && ovl_force_readonly(ofs))
3523cdf6fe9SSeunghun Lee 		return -EROFS;
3533cdf6fe9SSeunghun Lee 
3543cdf6fe9SSeunghun Lee 	return 0;
3553cdf6fe9SSeunghun Lee }
3563cdf6fe9SSeunghun Lee 
357e9be9d5eSMiklos Szeredi static const struct super_operations ovl_super_operations = {
35813cf199dSAmir Goldstein 	.alloc_inode	= ovl_alloc_inode,
35913cf199dSAmir Goldstein 	.destroy_inode	= ovl_destroy_inode,
36013cf199dSAmir Goldstein 	.drop_inode	= generic_delete_inode,
361e9be9d5eSMiklos Szeredi 	.put_super	= ovl_put_super,
362e593b2bfSAmir Goldstein 	.sync_fs	= ovl_sync_fs,
363cc259639SAndy Whitcroft 	.statfs		= ovl_statfs,
364f45827e8SErez Zadok 	.show_options	= ovl_show_options,
3653cdf6fe9SSeunghun Lee 	.remount_fs	= ovl_remount,
366e9be9d5eSMiklos Szeredi };
367e9be9d5eSMiklos Szeredi 
368e9be9d5eSMiklos Szeredi enum {
369e9be9d5eSMiklos Szeredi 	OPT_LOWERDIR,
370e9be9d5eSMiklos Szeredi 	OPT_UPPERDIR,
371e9be9d5eSMiklos Szeredi 	OPT_WORKDIR,
3728d3095f4SMiklos Szeredi 	OPT_DEFAULT_PERMISSIONS,
373438c84c2SMiklos Szeredi 	OPT_REDIRECT_DIR,
37402bcd157SAmir Goldstein 	OPT_INDEX_ON,
37502bcd157SAmir Goldstein 	OPT_INDEX_OFF,
376e9be9d5eSMiklos Szeredi 	OPT_ERR,
377e9be9d5eSMiklos Szeredi };
378e9be9d5eSMiklos Szeredi 
379e9be9d5eSMiklos Szeredi static const match_table_t ovl_tokens = {
380e9be9d5eSMiklos Szeredi 	{OPT_LOWERDIR,			"lowerdir=%s"},
381e9be9d5eSMiklos Szeredi 	{OPT_UPPERDIR,			"upperdir=%s"},
382e9be9d5eSMiklos Szeredi 	{OPT_WORKDIR,			"workdir=%s"},
3838d3095f4SMiklos Szeredi 	{OPT_DEFAULT_PERMISSIONS,	"default_permissions"},
384438c84c2SMiklos Szeredi 	{OPT_REDIRECT_DIR,		"redirect_dir=%s"},
38502bcd157SAmir Goldstein 	{OPT_INDEX_ON,			"index=on"},
38602bcd157SAmir Goldstein 	{OPT_INDEX_OFF,			"index=off"},
387e9be9d5eSMiklos Szeredi 	{OPT_ERR,			NULL}
388e9be9d5eSMiklos Szeredi };
389e9be9d5eSMiklos Szeredi 
39091c77947SMiklos Szeredi static char *ovl_next_opt(char **s)
39191c77947SMiklos Szeredi {
39291c77947SMiklos Szeredi 	char *sbegin = *s;
39391c77947SMiklos Szeredi 	char *p;
39491c77947SMiklos Szeredi 
39591c77947SMiklos Szeredi 	if (sbegin == NULL)
39691c77947SMiklos Szeredi 		return NULL;
39791c77947SMiklos Szeredi 
39891c77947SMiklos Szeredi 	for (p = sbegin; *p; p++) {
39991c77947SMiklos Szeredi 		if (*p == '\\') {
40091c77947SMiklos Szeredi 			p++;
40191c77947SMiklos Szeredi 			if (!*p)
40291c77947SMiklos Szeredi 				break;
40391c77947SMiklos Szeredi 		} else if (*p == ',') {
40491c77947SMiklos Szeredi 			*p = '\0';
40591c77947SMiklos Szeredi 			*s = p + 1;
40691c77947SMiklos Szeredi 			return sbegin;
40791c77947SMiklos Szeredi 		}
40891c77947SMiklos Szeredi 	}
40991c77947SMiklos Szeredi 	*s = NULL;
41091c77947SMiklos Szeredi 	return sbegin;
41191c77947SMiklos Szeredi }
41291c77947SMiklos Szeredi 
413438c84c2SMiklos Szeredi static int ovl_parse_redirect_mode(struct ovl_config *config, const char *mode)
414438c84c2SMiklos Szeredi {
415438c84c2SMiklos Szeredi 	if (strcmp(mode, "on") == 0) {
416438c84c2SMiklos Szeredi 		config->redirect_dir = true;
417438c84c2SMiklos Szeredi 		/*
418438c84c2SMiklos Szeredi 		 * Does not make sense to have redirect creation without
419438c84c2SMiklos Szeredi 		 * redirect following.
420438c84c2SMiklos Szeredi 		 */
421438c84c2SMiklos Szeredi 		config->redirect_follow = true;
422438c84c2SMiklos Szeredi 	} else if (strcmp(mode, "follow") == 0) {
423438c84c2SMiklos Szeredi 		config->redirect_follow = true;
424438c84c2SMiklos Szeredi 	} else if (strcmp(mode, "off") == 0) {
425438c84c2SMiklos Szeredi 		if (ovl_redirect_always_follow)
426438c84c2SMiklos Szeredi 			config->redirect_follow = true;
427438c84c2SMiklos Szeredi 	} else if (strcmp(mode, "nofollow") != 0) {
428438c84c2SMiklos Szeredi 		pr_err("overlayfs: bad mount option \"redirect_dir=%s\"\n",
429438c84c2SMiklos Szeredi 		       mode);
430438c84c2SMiklos Szeredi 		return -EINVAL;
431438c84c2SMiklos Szeredi 	}
432438c84c2SMiklos Szeredi 
433438c84c2SMiklos Szeredi 	return 0;
434438c84c2SMiklos Szeredi }
435438c84c2SMiklos Szeredi 
436e9be9d5eSMiklos Szeredi static int ovl_parse_opt(char *opt, struct ovl_config *config)
437e9be9d5eSMiklos Szeredi {
438e9be9d5eSMiklos Szeredi 	char *p;
439e9be9d5eSMiklos Szeredi 
440438c84c2SMiklos Szeredi 	config->redirect_mode = kstrdup(ovl_redirect_mode_def(), GFP_KERNEL);
441438c84c2SMiklos Szeredi 	if (!config->redirect_mode)
442438c84c2SMiklos Szeredi 		return -ENOMEM;
443438c84c2SMiklos Szeredi 
44491c77947SMiklos Szeredi 	while ((p = ovl_next_opt(&opt)) != NULL) {
445e9be9d5eSMiklos Szeredi 		int token;
446e9be9d5eSMiklos Szeredi 		substring_t args[MAX_OPT_ARGS];
447e9be9d5eSMiklos Szeredi 
448e9be9d5eSMiklos Szeredi 		if (!*p)
449e9be9d5eSMiklos Szeredi 			continue;
450e9be9d5eSMiklos Szeredi 
451e9be9d5eSMiklos Szeredi 		token = match_token(p, ovl_tokens, args);
452e9be9d5eSMiklos Szeredi 		switch (token) {
453e9be9d5eSMiklos Szeredi 		case OPT_UPPERDIR:
454e9be9d5eSMiklos Szeredi 			kfree(config->upperdir);
455e9be9d5eSMiklos Szeredi 			config->upperdir = match_strdup(&args[0]);
456e9be9d5eSMiklos Szeredi 			if (!config->upperdir)
457e9be9d5eSMiklos Szeredi 				return -ENOMEM;
458e9be9d5eSMiklos Szeredi 			break;
459e9be9d5eSMiklos Szeredi 
460e9be9d5eSMiklos Szeredi 		case OPT_LOWERDIR:
461e9be9d5eSMiklos Szeredi 			kfree(config->lowerdir);
462e9be9d5eSMiklos Szeredi 			config->lowerdir = match_strdup(&args[0]);
463e9be9d5eSMiklos Szeredi 			if (!config->lowerdir)
464e9be9d5eSMiklos Szeredi 				return -ENOMEM;
465e9be9d5eSMiklos Szeredi 			break;
466e9be9d5eSMiklos Szeredi 
467e9be9d5eSMiklos Szeredi 		case OPT_WORKDIR:
468e9be9d5eSMiklos Szeredi 			kfree(config->workdir);
469e9be9d5eSMiklos Szeredi 			config->workdir = match_strdup(&args[0]);
470e9be9d5eSMiklos Szeredi 			if (!config->workdir)
471e9be9d5eSMiklos Szeredi 				return -ENOMEM;
472e9be9d5eSMiklos Szeredi 			break;
473e9be9d5eSMiklos Szeredi 
4748d3095f4SMiklos Szeredi 		case OPT_DEFAULT_PERMISSIONS:
4758d3095f4SMiklos Szeredi 			config->default_permissions = true;
4768d3095f4SMiklos Szeredi 			break;
4778d3095f4SMiklos Szeredi 
478438c84c2SMiklos Szeredi 		case OPT_REDIRECT_DIR:
479438c84c2SMiklos Szeredi 			kfree(config->redirect_mode);
480438c84c2SMiklos Szeredi 			config->redirect_mode = match_strdup(&args[0]);
481438c84c2SMiklos Szeredi 			if (!config->redirect_mode)
482438c84c2SMiklos Szeredi 				return -ENOMEM;
483a6c60655SMiklos Szeredi 			break;
484a6c60655SMiklos Szeredi 
48502bcd157SAmir Goldstein 		case OPT_INDEX_ON:
48602bcd157SAmir Goldstein 			config->index = true;
48702bcd157SAmir Goldstein 			break;
48802bcd157SAmir Goldstein 
48902bcd157SAmir Goldstein 		case OPT_INDEX_OFF:
49002bcd157SAmir Goldstein 			config->index = false;
49102bcd157SAmir Goldstein 			break;
49202bcd157SAmir Goldstein 
493e9be9d5eSMiklos Szeredi 		default:
494bead55efShujianyang 			pr_err("overlayfs: unrecognized mount option \"%s\" or missing value\n", p);
495e9be9d5eSMiklos Szeredi 			return -EINVAL;
496e9be9d5eSMiklos Szeredi 		}
497e9be9d5eSMiklos Szeredi 	}
49871cbad7eShujianyang 
49971cbad7eShujianyang 	/* Workdir is useless in non-upper mount */
50071cbad7eShujianyang 	if (!config->upperdir && config->workdir) {
50171cbad7eShujianyang 		pr_info("overlayfs: option \"workdir=%s\" is useless in a non-upper mount, ignore\n",
50271cbad7eShujianyang 			config->workdir);
50371cbad7eShujianyang 		kfree(config->workdir);
50471cbad7eShujianyang 		config->workdir = NULL;
50571cbad7eShujianyang 	}
50671cbad7eShujianyang 
507438c84c2SMiklos Szeredi 	return ovl_parse_redirect_mode(config, config->redirect_mode);
508e9be9d5eSMiklos Szeredi }
509e9be9d5eSMiklos Szeredi 
510e9be9d5eSMiklos Szeredi #define OVL_WORKDIR_NAME "work"
51102bcd157SAmir Goldstein #define OVL_INDEXDIR_NAME "index"
512e9be9d5eSMiklos Szeredi 
513ad204488SMiklos Szeredi static struct dentry *ovl_workdir_create(struct ovl_fs *ofs,
5146b8aa129SAmir Goldstein 					 const char *name, bool persist)
515e9be9d5eSMiklos Szeredi {
516ad204488SMiklos Szeredi 	struct inode *dir =  ofs->workbasedir->d_inode;
517ad204488SMiklos Szeredi 	struct vfsmount *mnt = ofs->upper_mnt;
518e9be9d5eSMiklos Szeredi 	struct dentry *work;
519e9be9d5eSMiklos Szeredi 	int err;
520e9be9d5eSMiklos Szeredi 	bool retried = false;
5216b8aa129SAmir Goldstein 	bool locked = false;
522e9be9d5eSMiklos Szeredi 
523e9be9d5eSMiklos Szeredi 	err = mnt_want_write(mnt);
524e9be9d5eSMiklos Szeredi 	if (err)
5256b8aa129SAmir Goldstein 		goto out_err;
526e9be9d5eSMiklos Szeredi 
5275955102cSAl Viro 	inode_lock_nested(dir, I_MUTEX_PARENT);
5286b8aa129SAmir Goldstein 	locked = true;
5296b8aa129SAmir Goldstein 
530e9be9d5eSMiklos Szeredi retry:
531ad204488SMiklos Szeredi 	work = lookup_one_len(name, ofs->workbasedir, strlen(name));
532e9be9d5eSMiklos Szeredi 
533e9be9d5eSMiklos Szeredi 	if (!IS_ERR(work)) {
534c11b9fddSMiklos Szeredi 		struct iattr attr = {
535c11b9fddSMiklos Szeredi 			.ia_valid = ATTR_MODE,
53632a3d848SAl Viro 			.ia_mode = S_IFDIR | 0,
537c11b9fddSMiklos Szeredi 		};
538e9be9d5eSMiklos Szeredi 
539e9be9d5eSMiklos Szeredi 		if (work->d_inode) {
540e9be9d5eSMiklos Szeredi 			err = -EEXIST;
541e9be9d5eSMiklos Szeredi 			if (retried)
542e9be9d5eSMiklos Szeredi 				goto out_dput;
543e9be9d5eSMiklos Szeredi 
5446b8aa129SAmir Goldstein 			if (persist)
5456b8aa129SAmir Goldstein 				goto out_unlock;
5466b8aa129SAmir Goldstein 
547e9be9d5eSMiklos Szeredi 			retried = true;
548eea2fb48SMiklos Szeredi 			ovl_workdir_cleanup(dir, mnt, work, 0);
549e9be9d5eSMiklos Szeredi 			dput(work);
550e9be9d5eSMiklos Szeredi 			goto retry;
551e9be9d5eSMiklos Szeredi 		}
552e9be9d5eSMiklos Szeredi 
55332a3d848SAl Viro 		err = ovl_create_real(dir, work,
55432a3d848SAl Viro 				      &(struct cattr){.mode = S_IFDIR | 0},
55532a3d848SAl Viro 				      NULL, true);
556e9be9d5eSMiklos Szeredi 		if (err)
557e9be9d5eSMiklos Szeredi 			goto out_dput;
558c11b9fddSMiklos Szeredi 
559cb348edbSMiklos Szeredi 		/*
560cb348edbSMiklos Szeredi 		 * Try to remove POSIX ACL xattrs from workdir.  We are good if:
561cb348edbSMiklos Szeredi 		 *
562cb348edbSMiklos Szeredi 		 * a) success (there was a POSIX ACL xattr and was removed)
563cb348edbSMiklos Szeredi 		 * b) -ENODATA (there was no POSIX ACL xattr)
564cb348edbSMiklos Szeredi 		 * c) -EOPNOTSUPP (POSIX ACL xattrs are not supported)
565cb348edbSMiklos Szeredi 		 *
566cb348edbSMiklos Szeredi 		 * There are various other error values that could effectively
567cb348edbSMiklos Szeredi 		 * mean that the xattr doesn't exist (e.g. -ERANGE is returned
568cb348edbSMiklos Szeredi 		 * if the xattr name is too long), but the set of filesystems
569cb348edbSMiklos Szeredi 		 * allowed as upper are limited to "normal" ones, where checking
570cb348edbSMiklos Szeredi 		 * for the above two errors is sufficient.
571cb348edbSMiklos Szeredi 		 */
572c11b9fddSMiklos Szeredi 		err = vfs_removexattr(work, XATTR_NAME_POSIX_ACL_DEFAULT);
573e1ff3dd1SMiklos Szeredi 		if (err && err != -ENODATA && err != -EOPNOTSUPP)
574c11b9fddSMiklos Szeredi 			goto out_dput;
575c11b9fddSMiklos Szeredi 
576c11b9fddSMiklos Szeredi 		err = vfs_removexattr(work, XATTR_NAME_POSIX_ACL_ACCESS);
577e1ff3dd1SMiklos Szeredi 		if (err && err != -ENODATA && err != -EOPNOTSUPP)
578c11b9fddSMiklos Szeredi 			goto out_dput;
579c11b9fddSMiklos Szeredi 
580c11b9fddSMiklos Szeredi 		/* Clear any inherited mode bits */
581c11b9fddSMiklos Szeredi 		inode_lock(work->d_inode);
582c11b9fddSMiklos Szeredi 		err = notify_change(work, &attr, NULL);
583c11b9fddSMiklos Szeredi 		inode_unlock(work->d_inode);
584c11b9fddSMiklos Szeredi 		if (err)
585c11b9fddSMiklos Szeredi 			goto out_dput;
5866b8aa129SAmir Goldstein 	} else {
5876b8aa129SAmir Goldstein 		err = PTR_ERR(work);
5886b8aa129SAmir Goldstein 		goto out_err;
589e9be9d5eSMiklos Szeredi 	}
590e9be9d5eSMiklos Szeredi out_unlock:
591e9be9d5eSMiklos Szeredi 	mnt_drop_write(mnt);
5926b8aa129SAmir Goldstein 	if (locked)
5936b8aa129SAmir Goldstein 		inode_unlock(dir);
594e9be9d5eSMiklos Szeredi 
595e9be9d5eSMiklos Szeredi 	return work;
596e9be9d5eSMiklos Szeredi 
597e9be9d5eSMiklos Szeredi out_dput:
598e9be9d5eSMiklos Szeredi 	dput(work);
5996b8aa129SAmir Goldstein out_err:
6006b8aa129SAmir Goldstein 	pr_warn("overlayfs: failed to create directory %s/%s (errno: %i); mounting read-only\n",
601ad204488SMiklos Szeredi 		ofs->config.workdir, name, -err);
6026b8aa129SAmir Goldstein 	work = NULL;
603e9be9d5eSMiklos Szeredi 	goto out_unlock;
604e9be9d5eSMiklos Szeredi }
605e9be9d5eSMiklos Szeredi 
60691c77947SMiklos Szeredi static void ovl_unescape(char *s)
60791c77947SMiklos Szeredi {
60891c77947SMiklos Szeredi 	char *d = s;
60991c77947SMiklos Szeredi 
61091c77947SMiklos Szeredi 	for (;; s++, d++) {
61191c77947SMiklos Szeredi 		if (*s == '\\')
61291c77947SMiklos Szeredi 			s++;
61391c77947SMiklos Szeredi 		*d = *s;
61491c77947SMiklos Szeredi 		if (!*s)
61591c77947SMiklos Szeredi 			break;
61691c77947SMiklos Szeredi 	}
61791c77947SMiklos Szeredi }
61891c77947SMiklos Szeredi 
619ab508822SMiklos Szeredi static int ovl_mount_dir_noesc(const char *name, struct path *path)
620ab508822SMiklos Szeredi {
621a78d9f0dSMiklos Szeredi 	int err = -EINVAL;
622ab508822SMiklos Szeredi 
623a78d9f0dSMiklos Szeredi 	if (!*name) {
624a78d9f0dSMiklos Szeredi 		pr_err("overlayfs: empty lowerdir\n");
625a78d9f0dSMiklos Szeredi 		goto out;
626a78d9f0dSMiklos Szeredi 	}
627ab508822SMiklos Szeredi 	err = kern_path(name, LOOKUP_FOLLOW, path);
628ab508822SMiklos Szeredi 	if (err) {
629ab508822SMiklos Szeredi 		pr_err("overlayfs: failed to resolve '%s': %i\n", name, err);
630ab508822SMiklos Szeredi 		goto out;
631ab508822SMiklos Szeredi 	}
632ab508822SMiklos Szeredi 	err = -EINVAL;
6337c03b5d4SMiklos Szeredi 	if (ovl_dentry_weird(path->dentry)) {
634ab508822SMiklos Szeredi 		pr_err("overlayfs: filesystem on '%s' not supported\n", name);
635ab508822SMiklos Szeredi 		goto out_put;
636ab508822SMiklos Szeredi 	}
6372b8c30e9SMiklos Szeredi 	if (!d_is_dir(path->dentry)) {
638ab508822SMiklos Szeredi 		pr_err("overlayfs: '%s' not a directory\n", name);
639ab508822SMiklos Szeredi 		goto out_put;
640ab508822SMiklos Szeredi 	}
641ab508822SMiklos Szeredi 	return 0;
642ab508822SMiklos Szeredi 
643ab508822SMiklos Szeredi out_put:
6448aafcb59SMiklos Szeredi 	path_put_init(path);
645ab508822SMiklos Szeredi out:
646ab508822SMiklos Szeredi 	return err;
647ab508822SMiklos Szeredi }
648ab508822SMiklos Szeredi 
649ab508822SMiklos Szeredi static int ovl_mount_dir(const char *name, struct path *path)
650ab508822SMiklos Szeredi {
651ab508822SMiklos Szeredi 	int err = -ENOMEM;
652ab508822SMiklos Szeredi 	char *tmp = kstrdup(name, GFP_KERNEL);
653ab508822SMiklos Szeredi 
654ab508822SMiklos Szeredi 	if (tmp) {
655ab508822SMiklos Szeredi 		ovl_unescape(tmp);
656ab508822SMiklos Szeredi 		err = ovl_mount_dir_noesc(tmp, path);
6577c03b5d4SMiklos Szeredi 
6587c03b5d4SMiklos Szeredi 		if (!err)
6597c03b5d4SMiklos Szeredi 			if (ovl_dentry_remote(path->dentry)) {
6607c03b5d4SMiklos Szeredi 				pr_err("overlayfs: filesystem on '%s' not supported as upperdir\n",
6617c03b5d4SMiklos Szeredi 				       tmp);
6628aafcb59SMiklos Szeredi 				path_put_init(path);
6637c03b5d4SMiklos Szeredi 				err = -EINVAL;
6647c03b5d4SMiklos Szeredi 			}
665ab508822SMiklos Szeredi 		kfree(tmp);
666ab508822SMiklos Szeredi 	}
667ab508822SMiklos Szeredi 	return err;
668ab508822SMiklos Szeredi }
669ab508822SMiklos Szeredi 
6706b2d5fe4SMiklos Szeredi static int ovl_check_namelen(struct path *path, struct ovl_fs *ofs,
6716b2d5fe4SMiklos Szeredi 			     const char *name)
6726b2d5fe4SMiklos Szeredi {
6736b2d5fe4SMiklos Szeredi 	struct kstatfs statfs;
6746b2d5fe4SMiklos Szeredi 	int err = vfs_statfs(path, &statfs);
6756b2d5fe4SMiklos Szeredi 
6766b2d5fe4SMiklos Szeredi 	if (err)
6776b2d5fe4SMiklos Szeredi 		pr_err("overlayfs: statfs failed on '%s'\n", name);
6786b2d5fe4SMiklos Szeredi 	else
6796b2d5fe4SMiklos Szeredi 		ofs->namelen = max(ofs->namelen, statfs.f_namelen);
6806b2d5fe4SMiklos Szeredi 
6816b2d5fe4SMiklos Szeredi 	return err;
6826b2d5fe4SMiklos Szeredi }
6836b2d5fe4SMiklos Szeredi 
6846b2d5fe4SMiklos Szeredi static int ovl_lower_dir(const char *name, struct path *path,
6856b2d5fe4SMiklos Szeredi 			 struct ovl_fs *ofs, int *stack_depth, bool *remote)
686ab508822SMiklos Szeredi {
687ab508822SMiklos Szeredi 	int err;
688ab508822SMiklos Szeredi 
689a78d9f0dSMiklos Szeredi 	err = ovl_mount_dir_noesc(name, path);
690ab508822SMiklos Szeredi 	if (err)
691ab508822SMiklos Szeredi 		goto out;
692ab508822SMiklos Szeredi 
6936b2d5fe4SMiklos Szeredi 	err = ovl_check_namelen(path, ofs, name);
6946b2d5fe4SMiklos Szeredi 	if (err)
695ab508822SMiklos Szeredi 		goto out_put;
6966b2d5fe4SMiklos Szeredi 
697ab508822SMiklos Szeredi 	*stack_depth = max(*stack_depth, path->mnt->mnt_sb->s_stack_depth);
698ab508822SMiklos Szeredi 
6997c03b5d4SMiklos Szeredi 	if (ovl_dentry_remote(path->dentry))
7007c03b5d4SMiklos Szeredi 		*remote = true;
7017c03b5d4SMiklos Szeredi 
70202bcd157SAmir Goldstein 	/*
70302bcd157SAmir Goldstein 	 * The inodes index feature needs to encode and decode file
70402bcd157SAmir Goldstein 	 * handles, so it requires that all layers support them.
70502bcd157SAmir Goldstein 	 */
70602bcd157SAmir Goldstein 	if (ofs->config.index && !ovl_can_decode_fh(path->dentry->d_sb)) {
70702bcd157SAmir Goldstein 		ofs->config.index = false;
70802bcd157SAmir Goldstein 		pr_warn("overlayfs: fs on '%s' does not support file handles, falling back to index=off.\n", name);
70902bcd157SAmir Goldstein 	}
71002bcd157SAmir Goldstein 
711ab508822SMiklos Szeredi 	return 0;
712ab508822SMiklos Szeredi 
713ab508822SMiklos Szeredi out_put:
7148aafcb59SMiklos Szeredi 	path_put_init(path);
715ab508822SMiklos Szeredi out:
716ab508822SMiklos Szeredi 	return err;
717ab508822SMiklos Szeredi }
718ab508822SMiklos Szeredi 
719e9be9d5eSMiklos Szeredi /* Workdir should not be subdir of upperdir and vice versa */
720e9be9d5eSMiklos Szeredi static bool ovl_workdir_ok(struct dentry *workdir, struct dentry *upperdir)
721e9be9d5eSMiklos Szeredi {
722e9be9d5eSMiklos Szeredi 	bool ok = false;
723e9be9d5eSMiklos Szeredi 
724e9be9d5eSMiklos Szeredi 	if (workdir != upperdir) {
725e9be9d5eSMiklos Szeredi 		ok = (lock_rename(workdir, upperdir) == NULL);
726e9be9d5eSMiklos Szeredi 		unlock_rename(workdir, upperdir);
727e9be9d5eSMiklos Szeredi 	}
728e9be9d5eSMiklos Szeredi 	return ok;
729e9be9d5eSMiklos Szeredi }
730e9be9d5eSMiklos Szeredi 
731a78d9f0dSMiklos Szeredi static unsigned int ovl_split_lowerdirs(char *str)
732a78d9f0dSMiklos Szeredi {
733a78d9f0dSMiklos Szeredi 	unsigned int ctr = 1;
734a78d9f0dSMiklos Szeredi 	char *s, *d;
735a78d9f0dSMiklos Szeredi 
736a78d9f0dSMiklos Szeredi 	for (s = d = str;; s++, d++) {
737a78d9f0dSMiklos Szeredi 		if (*s == '\\') {
738a78d9f0dSMiklos Szeredi 			s++;
739a78d9f0dSMiklos Szeredi 		} else if (*s == ':') {
740a78d9f0dSMiklos Szeredi 			*d = '\0';
741a78d9f0dSMiklos Szeredi 			ctr++;
742a78d9f0dSMiklos Szeredi 			continue;
743a78d9f0dSMiklos Szeredi 		}
744a78d9f0dSMiklos Szeredi 		*d = *s;
745a78d9f0dSMiklos Szeredi 		if (!*s)
746a78d9f0dSMiklos Szeredi 			break;
747a78d9f0dSMiklos Szeredi 	}
748a78d9f0dSMiklos Szeredi 	return ctr;
749a78d9f0dSMiklos Szeredi }
750a78d9f0dSMiklos Szeredi 
7510c97be22SAndreas Gruenbacher static int __maybe_unused
7520eb45fc3SAndreas Gruenbacher ovl_posix_acl_xattr_get(const struct xattr_handler *handler,
7530eb45fc3SAndreas Gruenbacher 			struct dentry *dentry, struct inode *inode,
7540eb45fc3SAndreas Gruenbacher 			const char *name, void *buffer, size_t size)
7550eb45fc3SAndreas Gruenbacher {
7561d88f183SMiklos Szeredi 	return ovl_xattr_get(dentry, inode, handler->name, buffer, size);
7570eb45fc3SAndreas Gruenbacher }
7580eb45fc3SAndreas Gruenbacher 
7590eb45fc3SAndreas Gruenbacher static int __maybe_unused
7600c97be22SAndreas Gruenbacher ovl_posix_acl_xattr_set(const struct xattr_handler *handler,
761d837a49bSMiklos Szeredi 			struct dentry *dentry, struct inode *inode,
762d837a49bSMiklos Szeredi 			const char *name, const void *value,
763d837a49bSMiklos Szeredi 			size_t size, int flags)
764d837a49bSMiklos Szeredi {
765d837a49bSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
76609d8b586SMiklos Szeredi 	struct inode *realinode = ovl_inode_real(inode);
767d837a49bSMiklos Szeredi 	struct posix_acl *acl = NULL;
768d837a49bSMiklos Szeredi 	int err;
769d837a49bSMiklos Szeredi 
770d837a49bSMiklos Szeredi 	/* Check that everything is OK before copy-up */
771d837a49bSMiklos Szeredi 	if (value) {
772d837a49bSMiklos Szeredi 		acl = posix_acl_from_xattr(&init_user_ns, value, size);
773d837a49bSMiklos Szeredi 		if (IS_ERR(acl))
774d837a49bSMiklos Szeredi 			return PTR_ERR(acl);
775d837a49bSMiklos Szeredi 	}
776d837a49bSMiklos Szeredi 	err = -EOPNOTSUPP;
777d837a49bSMiklos Szeredi 	if (!IS_POSIXACL(d_inode(workdir)))
778d837a49bSMiklos Szeredi 		goto out_acl_release;
779d837a49bSMiklos Szeredi 	if (!realinode->i_op->set_acl)
780d837a49bSMiklos Szeredi 		goto out_acl_release;
781d837a49bSMiklos Szeredi 	if (handler->flags == ACL_TYPE_DEFAULT && !S_ISDIR(inode->i_mode)) {
782d837a49bSMiklos Szeredi 		err = acl ? -EACCES : 0;
783d837a49bSMiklos Szeredi 		goto out_acl_release;
784d837a49bSMiklos Szeredi 	}
785d837a49bSMiklos Szeredi 	err = -EPERM;
786d837a49bSMiklos Szeredi 	if (!inode_owner_or_capable(inode))
787d837a49bSMiklos Szeredi 		goto out_acl_release;
788d837a49bSMiklos Szeredi 
789d837a49bSMiklos Szeredi 	posix_acl_release(acl);
790d837a49bSMiklos Szeredi 
791fd3220d3SMiklos Szeredi 	/*
792fd3220d3SMiklos Szeredi 	 * Check if sgid bit needs to be cleared (actual setacl operation will
793fd3220d3SMiklos Szeredi 	 * be done with mounter's capabilities and so that won't do it for us).
794fd3220d3SMiklos Szeredi 	 */
795fd3220d3SMiklos Szeredi 	if (unlikely(inode->i_mode & S_ISGID) &&
796fd3220d3SMiklos Szeredi 	    handler->flags == ACL_TYPE_ACCESS &&
797fd3220d3SMiklos Szeredi 	    !in_group_p(inode->i_gid) &&
798fd3220d3SMiklos Szeredi 	    !capable_wrt_inode_uidgid(inode, CAP_FSETID)) {
799fd3220d3SMiklos Szeredi 		struct iattr iattr = { .ia_valid = ATTR_KILL_SGID };
800fd3220d3SMiklos Szeredi 
801fd3220d3SMiklos Szeredi 		err = ovl_setattr(dentry, &iattr);
802fd3220d3SMiklos Szeredi 		if (err)
803fd3220d3SMiklos Szeredi 			return err;
804fd3220d3SMiklos Szeredi 	}
805fd3220d3SMiklos Szeredi 
8061d88f183SMiklos Szeredi 	err = ovl_xattr_set(dentry, inode, handler->name, value, size, flags);
807ce31513aSMiklos Szeredi 	if (!err)
80809d8b586SMiklos Szeredi 		ovl_copyattr(ovl_inode_real(inode), inode);
809ce31513aSMiklos Szeredi 
810ce31513aSMiklos Szeredi 	return err;
811d837a49bSMiklos Szeredi 
812d837a49bSMiklos Szeredi out_acl_release:
813d837a49bSMiklos Szeredi 	posix_acl_release(acl);
814d837a49bSMiklos Szeredi 	return err;
815d837a49bSMiklos Szeredi }
816d837a49bSMiklos Szeredi 
8170eb45fc3SAndreas Gruenbacher static int ovl_own_xattr_get(const struct xattr_handler *handler,
8180eb45fc3SAndreas Gruenbacher 			     struct dentry *dentry, struct inode *inode,
8190eb45fc3SAndreas Gruenbacher 			     const char *name, void *buffer, size_t size)
8200eb45fc3SAndreas Gruenbacher {
82148fab5d7SAmir Goldstein 	return -EOPNOTSUPP;
8220eb45fc3SAndreas Gruenbacher }
8230eb45fc3SAndreas Gruenbacher 
824d837a49bSMiklos Szeredi static int ovl_own_xattr_set(const struct xattr_handler *handler,
825d837a49bSMiklos Szeredi 			     struct dentry *dentry, struct inode *inode,
826d837a49bSMiklos Szeredi 			     const char *name, const void *value,
827d837a49bSMiklos Szeredi 			     size_t size, int flags)
828d837a49bSMiklos Szeredi {
82948fab5d7SAmir Goldstein 	return -EOPNOTSUPP;
830d837a49bSMiklos Szeredi }
831d837a49bSMiklos Szeredi 
8320eb45fc3SAndreas Gruenbacher static int ovl_other_xattr_get(const struct xattr_handler *handler,
8330eb45fc3SAndreas Gruenbacher 			       struct dentry *dentry, struct inode *inode,
8340eb45fc3SAndreas Gruenbacher 			       const char *name, void *buffer, size_t size)
8350eb45fc3SAndreas Gruenbacher {
8361d88f183SMiklos Szeredi 	return ovl_xattr_get(dentry, inode, name, buffer, size);
8370eb45fc3SAndreas Gruenbacher }
8380eb45fc3SAndreas Gruenbacher 
8390e585cccSAndreas Gruenbacher static int ovl_other_xattr_set(const struct xattr_handler *handler,
8400e585cccSAndreas Gruenbacher 			       struct dentry *dentry, struct inode *inode,
8410e585cccSAndreas Gruenbacher 			       const char *name, const void *value,
8420e585cccSAndreas Gruenbacher 			       size_t size, int flags)
8430e585cccSAndreas Gruenbacher {
8441d88f183SMiklos Szeredi 	return ovl_xattr_set(dentry, inode, name, value, size, flags);
8450e585cccSAndreas Gruenbacher }
8460e585cccSAndreas Gruenbacher 
8470c97be22SAndreas Gruenbacher static const struct xattr_handler __maybe_unused
8480c97be22SAndreas Gruenbacher ovl_posix_acl_access_xattr_handler = {
849d837a49bSMiklos Szeredi 	.name = XATTR_NAME_POSIX_ACL_ACCESS,
850d837a49bSMiklos Szeredi 	.flags = ACL_TYPE_ACCESS,
8510eb45fc3SAndreas Gruenbacher 	.get = ovl_posix_acl_xattr_get,
852d837a49bSMiklos Szeredi 	.set = ovl_posix_acl_xattr_set,
853d837a49bSMiklos Szeredi };
854d837a49bSMiklos Szeredi 
8550c97be22SAndreas Gruenbacher static const struct xattr_handler __maybe_unused
8560c97be22SAndreas Gruenbacher ovl_posix_acl_default_xattr_handler = {
857d837a49bSMiklos Szeredi 	.name = XATTR_NAME_POSIX_ACL_DEFAULT,
858d837a49bSMiklos Szeredi 	.flags = ACL_TYPE_DEFAULT,
8590eb45fc3SAndreas Gruenbacher 	.get = ovl_posix_acl_xattr_get,
860d837a49bSMiklos Szeredi 	.set = ovl_posix_acl_xattr_set,
861d837a49bSMiklos Szeredi };
862d837a49bSMiklos Szeredi 
863d837a49bSMiklos Szeredi static const struct xattr_handler ovl_own_xattr_handler = {
864d837a49bSMiklos Szeredi 	.prefix	= OVL_XATTR_PREFIX,
8650eb45fc3SAndreas Gruenbacher 	.get = ovl_own_xattr_get,
866d837a49bSMiklos Szeredi 	.set = ovl_own_xattr_set,
867d837a49bSMiklos Szeredi };
868d837a49bSMiklos Szeredi 
869d837a49bSMiklos Szeredi static const struct xattr_handler ovl_other_xattr_handler = {
870d837a49bSMiklos Szeredi 	.prefix	= "", /* catch all */
8710eb45fc3SAndreas Gruenbacher 	.get = ovl_other_xattr_get,
872d837a49bSMiklos Szeredi 	.set = ovl_other_xattr_set,
873d837a49bSMiklos Szeredi };
874d837a49bSMiklos Szeredi 
875d837a49bSMiklos Szeredi static const struct xattr_handler *ovl_xattr_handlers[] = {
8760c97be22SAndreas Gruenbacher #ifdef CONFIG_FS_POSIX_ACL
877d837a49bSMiklos Szeredi 	&ovl_posix_acl_access_xattr_handler,
878d837a49bSMiklos Szeredi 	&ovl_posix_acl_default_xattr_handler,
8790c97be22SAndreas Gruenbacher #endif
880d837a49bSMiklos Szeredi 	&ovl_own_xattr_handler,
881d837a49bSMiklos Szeredi 	&ovl_other_xattr_handler,
882d837a49bSMiklos Szeredi 	NULL
883d837a49bSMiklos Szeredi };
884d837a49bSMiklos Szeredi 
885ad204488SMiklos Szeredi static int ovl_get_upper(struct ovl_fs *ofs, struct path *upperpath)
8866ee8acf0SMiklos Szeredi {
8875064975eSMiklos Szeredi 	struct vfsmount *upper_mnt;
8886ee8acf0SMiklos Szeredi 	int err;
8896ee8acf0SMiklos Szeredi 
890ad204488SMiklos Szeredi 	err = ovl_mount_dir(ofs->config.upperdir, upperpath);
8916ee8acf0SMiklos Szeredi 	if (err)
8926ee8acf0SMiklos Szeredi 		goto out;
8936ee8acf0SMiklos Szeredi 
8946ee8acf0SMiklos Szeredi 	/* Upper fs should not be r/o */
8956ee8acf0SMiklos Szeredi 	if (sb_rdonly(upperpath->mnt->mnt_sb)) {
8966ee8acf0SMiklos Szeredi 		pr_err("overlayfs: upper fs is r/o, try multi-lower layers mount\n");
8976ee8acf0SMiklos Szeredi 		err = -EINVAL;
8986ee8acf0SMiklos Szeredi 		goto out;
8996ee8acf0SMiklos Szeredi 	}
9006ee8acf0SMiklos Szeredi 
901ad204488SMiklos Szeredi 	err = ovl_check_namelen(upperpath, ofs, ofs->config.upperdir);
9026ee8acf0SMiklos Szeredi 	if (err)
9036ee8acf0SMiklos Szeredi 		goto out;
9046ee8acf0SMiklos Szeredi 
9056ee8acf0SMiklos Szeredi 	err = -EBUSY;
9066ee8acf0SMiklos Szeredi 	if (ovl_inuse_trylock(upperpath->dentry)) {
907ad204488SMiklos Szeredi 		ofs->upperdir_locked = true;
908ad204488SMiklos Szeredi 	} else if (ofs->config.index) {
9096ee8acf0SMiklos Szeredi 		pr_err("overlayfs: upperdir is in-use by another mount, mount with '-o index=off' to override exclusive upperdir protection.\n");
9106ee8acf0SMiklos Szeredi 		goto out;
9116ee8acf0SMiklos Szeredi 	} else {
9126ee8acf0SMiklos Szeredi 		pr_warn("overlayfs: upperdir is in-use by another mount, accessing files from both mounts will result in undefined behavior.\n");
9136ee8acf0SMiklos Szeredi 	}
9145064975eSMiklos Szeredi 
9155064975eSMiklos Szeredi 	upper_mnt = clone_private_mount(upperpath);
9165064975eSMiklos Szeredi 	err = PTR_ERR(upper_mnt);
9175064975eSMiklos Szeredi 	if (IS_ERR(upper_mnt)) {
9185064975eSMiklos Szeredi 		pr_err("overlayfs: failed to clone upperpath\n");
9195064975eSMiklos Szeredi 		goto out;
9205064975eSMiklos Szeredi 	}
9215064975eSMiklos Szeredi 
9225064975eSMiklos Szeredi 	/* Don't inherit atime flags */
9235064975eSMiklos Szeredi 	upper_mnt->mnt_flags &= ~(MNT_NOATIME | MNT_NODIRATIME | MNT_RELATIME);
924ad204488SMiklos Szeredi 	ofs->upper_mnt = upper_mnt;
9256ee8acf0SMiklos Szeredi 	err = 0;
9266ee8acf0SMiklos Szeredi out:
9276ee8acf0SMiklos Szeredi 	return err;
9286ee8acf0SMiklos Szeredi }
9296ee8acf0SMiklos Szeredi 
930ad204488SMiklos Szeredi static int ovl_make_workdir(struct ovl_fs *ofs, struct path *workpath)
9318ed61dc3SMiklos Szeredi {
9328ed61dc3SMiklos Szeredi 	struct dentry *temp;
9338ed61dc3SMiklos Szeredi 	int err;
9348ed61dc3SMiklos Szeredi 
935ad204488SMiklos Szeredi 	ofs->workdir = ovl_workdir_create(ofs, OVL_WORKDIR_NAME, false);
936ad204488SMiklos Szeredi 	if (!ofs->workdir)
9378ed61dc3SMiklos Szeredi 		return 0;
9388ed61dc3SMiklos Szeredi 
9398ed61dc3SMiklos Szeredi 	/*
9408ed61dc3SMiklos Szeredi 	 * Upper should support d_type, else whiteouts are visible.  Given
9418ed61dc3SMiklos Szeredi 	 * workdir and upper are on same fs, we can do iterate_dir() on
9428ed61dc3SMiklos Szeredi 	 * workdir. This check requires successful creation of workdir in
9438ed61dc3SMiklos Szeredi 	 * previous step.
9448ed61dc3SMiklos Szeredi 	 */
9458ed61dc3SMiklos Szeredi 	err = ovl_check_d_type_supported(workpath);
9468ed61dc3SMiklos Szeredi 	if (err < 0)
9478ed61dc3SMiklos Szeredi 		return err;
9488ed61dc3SMiklos Szeredi 
9498ed61dc3SMiklos Szeredi 	/*
9508ed61dc3SMiklos Szeredi 	 * We allowed this configuration and don't want to break users over
9518ed61dc3SMiklos Szeredi 	 * kernel upgrade. So warn instead of erroring out.
9528ed61dc3SMiklos Szeredi 	 */
9538ed61dc3SMiklos Szeredi 	if (!err)
9548ed61dc3SMiklos Szeredi 		pr_warn("overlayfs: upper fs needs to support d_type.\n");
9558ed61dc3SMiklos Szeredi 
9568ed61dc3SMiklos Szeredi 	/* Check if upper/work fs supports O_TMPFILE */
957ad204488SMiklos Szeredi 	temp = ovl_do_tmpfile(ofs->workdir, S_IFREG | 0);
958ad204488SMiklos Szeredi 	ofs->tmpfile = !IS_ERR(temp);
959ad204488SMiklos Szeredi 	if (ofs->tmpfile)
9608ed61dc3SMiklos Szeredi 		dput(temp);
9618ed61dc3SMiklos Szeredi 	else
9628ed61dc3SMiklos Szeredi 		pr_warn("overlayfs: upper fs does not support tmpfile.\n");
9638ed61dc3SMiklos Szeredi 
9648ed61dc3SMiklos Szeredi 	/*
9658ed61dc3SMiklos Szeredi 	 * Check if upper/work fs supports trusted.overlay.* xattr
9668ed61dc3SMiklos Szeredi 	 */
967ad204488SMiklos Szeredi 	err = ovl_do_setxattr(ofs->workdir, OVL_XATTR_OPAQUE, "0", 1, 0);
9688ed61dc3SMiklos Szeredi 	if (err) {
969ad204488SMiklos Szeredi 		ofs->noxattr = true;
9708ed61dc3SMiklos Szeredi 		pr_warn("overlayfs: upper fs does not support xattr.\n");
9718ed61dc3SMiklos Szeredi 	} else {
972ad204488SMiklos Szeredi 		vfs_removexattr(ofs->workdir, OVL_XATTR_OPAQUE);
9738ed61dc3SMiklos Szeredi 	}
9748ed61dc3SMiklos Szeredi 
9758ed61dc3SMiklos Szeredi 	/* Check if upper/work fs supports file handles */
976ad204488SMiklos Szeredi 	if (ofs->config.index &&
977ad204488SMiklos Szeredi 	    !ovl_can_decode_fh(ofs->workdir->d_sb)) {
978ad204488SMiklos Szeredi 		ofs->config.index = false;
9798ed61dc3SMiklos Szeredi 		pr_warn("overlayfs: upper fs does not support file handles, falling back to index=off.\n");
9808ed61dc3SMiklos Szeredi 	}
9818ed61dc3SMiklos Szeredi 
9828ed61dc3SMiklos Szeredi 	return 0;
9838ed61dc3SMiklos Szeredi }
9848ed61dc3SMiklos Szeredi 
985ad204488SMiklos Szeredi static int ovl_get_workdir(struct ovl_fs *ofs, struct path *upperpath)
986520d7c86SMiklos Szeredi {
987520d7c86SMiklos Szeredi 	int err;
988bca44b52SMiklos Szeredi 	struct path workpath = { };
989520d7c86SMiklos Szeredi 
990ad204488SMiklos Szeredi 	err = ovl_mount_dir(ofs->config.workdir, &workpath);
991520d7c86SMiklos Szeredi 	if (err)
992520d7c86SMiklos Szeredi 		goto out;
993520d7c86SMiklos Szeredi 
994520d7c86SMiklos Szeredi 	err = -EINVAL;
995bca44b52SMiklos Szeredi 	if (upperpath->mnt != workpath.mnt) {
996520d7c86SMiklos Szeredi 		pr_err("overlayfs: workdir and upperdir must reside under the same mount\n");
997520d7c86SMiklos Szeredi 		goto out;
998520d7c86SMiklos Szeredi 	}
999bca44b52SMiklos Szeredi 	if (!ovl_workdir_ok(workpath.dentry, upperpath->dentry)) {
1000520d7c86SMiklos Szeredi 		pr_err("overlayfs: workdir and upperdir must be separate subtrees\n");
1001520d7c86SMiklos Szeredi 		goto out;
1002520d7c86SMiklos Szeredi 	}
1003520d7c86SMiklos Szeredi 
1004520d7c86SMiklos Szeredi 	err = -EBUSY;
1005bca44b52SMiklos Szeredi 	if (ovl_inuse_trylock(workpath.dentry)) {
1006ad204488SMiklos Szeredi 		ofs->workdir_locked = true;
1007ad204488SMiklos Szeredi 	} else if (ofs->config.index) {
1008520d7c86SMiklos Szeredi 		pr_err("overlayfs: workdir is in-use by another mount, mount with '-o index=off' to override exclusive workdir protection.\n");
1009520d7c86SMiklos Szeredi 		goto out;
1010520d7c86SMiklos Szeredi 	} else {
1011520d7c86SMiklos Szeredi 		pr_warn("overlayfs: workdir is in-use by another mount, accessing files from both mounts will result in undefined behavior.\n");
1012520d7c86SMiklos Szeredi 	}
1013520d7c86SMiklos Szeredi 
1014ad204488SMiklos Szeredi 	ofs->workbasedir = dget(workpath.dentry);
1015ad204488SMiklos Szeredi 	err = ovl_make_workdir(ofs, &workpath);
1016bca44b52SMiklos Szeredi 	if (err)
1017bca44b52SMiklos Szeredi 		goto out;
1018bca44b52SMiklos Szeredi 
1019520d7c86SMiklos Szeredi 	err = 0;
1020520d7c86SMiklos Szeredi out:
1021bca44b52SMiklos Szeredi 	path_put(&workpath);
1022bca44b52SMiklos Szeredi 
1023520d7c86SMiklos Szeredi 	return err;
1024520d7c86SMiklos Szeredi }
1025520d7c86SMiklos Szeredi 
1026ad204488SMiklos Szeredi static int ovl_get_indexdir(struct ovl_fs *ofs, struct ovl_entry *oe,
102795e6d417SMiklos Szeredi 			    struct path *upperpath)
1028f7e3a7d9SMiklos Szeredi {
1029f7e3a7d9SMiklos Szeredi 	int err;
1030f7e3a7d9SMiklos Szeredi 
1031f7e3a7d9SMiklos Szeredi 	/* Verify lower root is upper root origin */
1032d9768076SAmir Goldstein 	err = ovl_verify_origin(upperpath->dentry, oe->lowerstack[0].dentry,
1033f7e3a7d9SMiklos Szeredi 				false, true);
1034f7e3a7d9SMiklos Szeredi 	if (err) {
1035f7e3a7d9SMiklos Szeredi 		pr_err("overlayfs: failed to verify upper root origin\n");
1036f7e3a7d9SMiklos Szeredi 		goto out;
1037f7e3a7d9SMiklos Szeredi 	}
1038f7e3a7d9SMiklos Szeredi 
1039ad204488SMiklos Szeredi 	ofs->indexdir = ovl_workdir_create(ofs, OVL_INDEXDIR_NAME, true);
1040ad204488SMiklos Szeredi 	if (ofs->indexdir) {
1041f7e3a7d9SMiklos Szeredi 		/* Verify upper root is index dir origin */
1042d9768076SAmir Goldstein 		err = ovl_verify_origin(ofs->indexdir, upperpath->dentry,
1043d9768076SAmir Goldstein 					true, true);
1044f7e3a7d9SMiklos Szeredi 		if (err)
1045f7e3a7d9SMiklos Szeredi 			pr_err("overlayfs: failed to verify index dir origin\n");
1046f7e3a7d9SMiklos Szeredi 
1047f7e3a7d9SMiklos Szeredi 		/* Cleanup bad/stale/orphan index entries */
1048f7e3a7d9SMiklos Szeredi 		if (!err)
1049ad204488SMiklos Szeredi 			err = ovl_indexdir_cleanup(ofs->indexdir,
1050ad204488SMiklos Szeredi 						   ofs->upper_mnt,
1051f7e3a7d9SMiklos Szeredi 						   oe->lowerstack,
1052f7e3a7d9SMiklos Szeredi 						   oe->numlower);
1053f7e3a7d9SMiklos Szeredi 	}
1054ad204488SMiklos Szeredi 	if (err || !ofs->indexdir)
1055f7e3a7d9SMiklos Szeredi 		pr_warn("overlayfs: try deleting index dir or mounting with '-o index=off' to disable inodes index.\n");
1056f7e3a7d9SMiklos Szeredi 
1057f7e3a7d9SMiklos Szeredi out:
1058f7e3a7d9SMiklos Szeredi 	return err;
1059f7e3a7d9SMiklos Szeredi }
1060f7e3a7d9SMiklos Szeredi 
1061ad204488SMiklos Szeredi static int ovl_get_lower_layers(struct ovl_fs *ofs, struct path *stack,
1062520d7c86SMiklos Szeredi 				unsigned int numlower)
1063520d7c86SMiklos Szeredi {
1064520d7c86SMiklos Szeredi 	int err;
1065520d7c86SMiklos Szeredi 	unsigned int i;
1066520d7c86SMiklos Szeredi 
1067520d7c86SMiklos Szeredi 	err = -ENOMEM;
1068ad204488SMiklos Szeredi 	ofs->lower_layers = kcalloc(numlower, sizeof(struct ovl_layer),
1069520d7c86SMiklos Szeredi 				    GFP_KERNEL);
1070ad204488SMiklos Szeredi 	if (ofs->lower_layers == NULL)
1071520d7c86SMiklos Szeredi 		goto out;
1072520d7c86SMiklos Szeredi 	for (i = 0; i < numlower; i++) {
1073520d7c86SMiklos Szeredi 		struct vfsmount *mnt;
1074520d7c86SMiklos Szeredi 		dev_t dev;
1075520d7c86SMiklos Szeredi 
1076520d7c86SMiklos Szeredi 		err = get_anon_bdev(&dev);
1077520d7c86SMiklos Szeredi 		if (err) {
1078520d7c86SMiklos Szeredi 			pr_err("overlayfs: failed to get anonymous bdev for lowerpath\n");
1079520d7c86SMiklos Szeredi 			goto out;
1080520d7c86SMiklos Szeredi 		}
1081520d7c86SMiklos Szeredi 
1082520d7c86SMiklos Szeredi 		mnt = clone_private_mount(&stack[i]);
1083520d7c86SMiklos Szeredi 		err = PTR_ERR(mnt);
1084520d7c86SMiklos Szeredi 		if (IS_ERR(mnt)) {
1085520d7c86SMiklos Szeredi 			pr_err("overlayfs: failed to clone lowerpath\n");
1086520d7c86SMiklos Szeredi 			free_anon_bdev(dev);
1087520d7c86SMiklos Szeredi 			goto out;
1088520d7c86SMiklos Szeredi 		}
1089520d7c86SMiklos Szeredi 		/*
1090520d7c86SMiklos Szeredi 		 * Make lower layers R/O.  That way fchmod/fchown on lower file
1091520d7c86SMiklos Szeredi 		 * will fail instead of modifying lower fs.
1092520d7c86SMiklos Szeredi 		 */
1093520d7c86SMiklos Szeredi 		mnt->mnt_flags |= MNT_READONLY | MNT_NOATIME;
1094520d7c86SMiklos Szeredi 
1095ad204488SMiklos Szeredi 		ofs->lower_layers[ofs->numlower].mnt = mnt;
1096ad204488SMiklos Szeredi 		ofs->lower_layers[ofs->numlower].pseudo_dev = dev;
1097ad204488SMiklos Szeredi 		ofs->numlower++;
1098520d7c86SMiklos Szeredi 
1099520d7c86SMiklos Szeredi 		/* Check if all lower layers are on same sb */
1100520d7c86SMiklos Szeredi 		if (i == 0)
1101ad204488SMiklos Szeredi 			ofs->same_sb = mnt->mnt_sb;
1102ad204488SMiklos Szeredi 		else if (ofs->same_sb != mnt->mnt_sb)
1103ad204488SMiklos Szeredi 			ofs->same_sb = NULL;
1104520d7c86SMiklos Szeredi 	}
1105520d7c86SMiklos Szeredi 	err = 0;
1106520d7c86SMiklos Szeredi out:
1107520d7c86SMiklos Szeredi 	return err;
1108520d7c86SMiklos Szeredi }
1109520d7c86SMiklos Szeredi 
11104155c10aSMiklos Szeredi static struct ovl_entry *ovl_get_lowerstack(struct super_block *sb,
1111ad204488SMiklos Szeredi 					    struct ovl_fs *ofs)
111253dbb0b4SMiklos Szeredi {
111353dbb0b4SMiklos Szeredi 	int err;
111453dbb0b4SMiklos Szeredi 	char *lowertmp, *lower;
11154155c10aSMiklos Szeredi 	struct path *stack = NULL;
11164155c10aSMiklos Szeredi 	unsigned int stacklen, numlower = 0, i;
111753dbb0b4SMiklos Szeredi 	bool remote = false;
11184155c10aSMiklos Szeredi 	struct ovl_entry *oe;
111953dbb0b4SMiklos Szeredi 
112053dbb0b4SMiklos Szeredi 	err = -ENOMEM;
1121ad204488SMiklos Szeredi 	lowertmp = kstrdup(ofs->config.lowerdir, GFP_KERNEL);
112253dbb0b4SMiklos Szeredi 	if (!lowertmp)
11234155c10aSMiklos Szeredi 		goto out_err;
112453dbb0b4SMiklos Szeredi 
112553dbb0b4SMiklos Szeredi 	err = -EINVAL;
112653dbb0b4SMiklos Szeredi 	stacklen = ovl_split_lowerdirs(lowertmp);
112753dbb0b4SMiklos Szeredi 	if (stacklen > OVL_MAX_STACK) {
112853dbb0b4SMiklos Szeredi 		pr_err("overlayfs: too many lower directories, limit is %d\n",
112953dbb0b4SMiklos Szeredi 		       OVL_MAX_STACK);
11304155c10aSMiklos Szeredi 		goto out_err;
1131ad204488SMiklos Szeredi 	} else if (!ofs->config.upperdir && stacklen == 1) {
113253dbb0b4SMiklos Szeredi 		pr_err("overlayfs: at least 2 lowerdir are needed while upperdir nonexistent\n");
11334155c10aSMiklos Szeredi 		goto out_err;
113453dbb0b4SMiklos Szeredi 	}
113553dbb0b4SMiklos Szeredi 
113653dbb0b4SMiklos Szeredi 	err = -ENOMEM;
113753dbb0b4SMiklos Szeredi 	stack = kcalloc(stacklen, sizeof(struct path), GFP_KERNEL);
113853dbb0b4SMiklos Szeredi 	if (!stack)
11394155c10aSMiklos Szeredi 		goto out_err;
114053dbb0b4SMiklos Szeredi 
114153dbb0b4SMiklos Szeredi 	err = -EINVAL;
114253dbb0b4SMiklos Szeredi 	lower = lowertmp;
114353dbb0b4SMiklos Szeredi 	for (numlower = 0; numlower < stacklen; numlower++) {
1144ad204488SMiklos Szeredi 		err = ovl_lower_dir(lower, &stack[numlower], ofs,
114553dbb0b4SMiklos Szeredi 				    &sb->s_stack_depth, &remote);
114653dbb0b4SMiklos Szeredi 		if (err)
11474155c10aSMiklos Szeredi 			goto out_err;
114853dbb0b4SMiklos Szeredi 
114953dbb0b4SMiklos Szeredi 		lower = strchr(lower, '\0') + 1;
115053dbb0b4SMiklos Szeredi 	}
115153dbb0b4SMiklos Szeredi 
115253dbb0b4SMiklos Szeredi 	err = -EINVAL;
115353dbb0b4SMiklos Szeredi 	sb->s_stack_depth++;
115453dbb0b4SMiklos Szeredi 	if (sb->s_stack_depth > FILESYSTEM_MAX_STACK_DEPTH) {
115553dbb0b4SMiklos Szeredi 		pr_err("overlayfs: maximum fs stacking depth exceeded\n");
11564155c10aSMiklos Szeredi 		goto out_err;
115753dbb0b4SMiklos Szeredi 	}
115853dbb0b4SMiklos Szeredi 
1159ad204488SMiklos Szeredi 	err = ovl_get_lower_layers(ofs, stack, numlower);
11604155c10aSMiklos Szeredi 	if (err)
11614155c10aSMiklos Szeredi 		goto out_err;
11624155c10aSMiklos Szeredi 
11634155c10aSMiklos Szeredi 	err = -ENOMEM;
11644155c10aSMiklos Szeredi 	oe = ovl_alloc_entry(numlower);
11654155c10aSMiklos Szeredi 	if (!oe)
11664155c10aSMiklos Szeredi 		goto out_err;
11674155c10aSMiklos Szeredi 
11684155c10aSMiklos Szeredi 	for (i = 0; i < numlower; i++) {
11694155c10aSMiklos Szeredi 		oe->lowerstack[i].dentry = dget(stack[i].dentry);
1170ad204488SMiklos Szeredi 		oe->lowerstack[i].layer = &ofs->lower_layers[i];
11714155c10aSMiklos Szeredi 	}
117253dbb0b4SMiklos Szeredi 
117353dbb0b4SMiklos Szeredi 	if (remote)
117453dbb0b4SMiklos Szeredi 		sb->s_d_op = &ovl_reval_dentry_operations;
117553dbb0b4SMiklos Szeredi 	else
117653dbb0b4SMiklos Szeredi 		sb->s_d_op = &ovl_dentry_operations;
117753dbb0b4SMiklos Szeredi 
117853dbb0b4SMiklos Szeredi out:
117953dbb0b4SMiklos Szeredi 	for (i = 0; i < numlower; i++)
118053dbb0b4SMiklos Szeredi 		path_put(&stack[i]);
118153dbb0b4SMiklos Szeredi 	kfree(stack);
11824155c10aSMiklos Szeredi 	kfree(lowertmp);
11834155c10aSMiklos Szeredi 
11844155c10aSMiklos Szeredi 	return oe;
11854155c10aSMiklos Szeredi 
11864155c10aSMiklos Szeredi out_err:
11874155c10aSMiklos Szeredi 	oe = ERR_PTR(err);
118853dbb0b4SMiklos Szeredi 	goto out;
118953dbb0b4SMiklos Szeredi }
119053dbb0b4SMiklos Szeredi 
1191e9be9d5eSMiklos Szeredi static int ovl_fill_super(struct super_block *sb, void *data, int silent)
1192e9be9d5eSMiklos Szeredi {
119333006cdfSKees Cook 	struct path upperpath = { };
1194e9be9d5eSMiklos Szeredi 	struct dentry *root_dentry;
11954155c10aSMiklos Szeredi 	struct ovl_entry *oe;
1196ad204488SMiklos Szeredi 	struct ovl_fs *ofs;
119751f8f3c4SKonstantin Khlebnikov 	struct cred *cred;
1198e9be9d5eSMiklos Szeredi 	int err;
1199e9be9d5eSMiklos Szeredi 
1200f45827e8SErez Zadok 	err = -ENOMEM;
1201ad204488SMiklos Szeredi 	ofs = kzalloc(sizeof(struct ovl_fs), GFP_KERNEL);
1202ad204488SMiklos Szeredi 	if (!ofs)
1203e9be9d5eSMiklos Szeredi 		goto out;
1204e9be9d5eSMiklos Szeredi 
1205ad204488SMiklos Szeredi 	ofs->creator_cred = cred = prepare_creds();
1206c6fe6254SMiklos Szeredi 	if (!cred)
1207c6fe6254SMiklos Szeredi 		goto out_err;
1208c6fe6254SMiklos Szeredi 
1209ad204488SMiklos Szeredi 	ofs->config.index = ovl_index_def;
1210ad204488SMiklos Szeredi 	err = ovl_parse_opt((char *) data, &ofs->config);
1211f45827e8SErez Zadok 	if (err)
1212a9075cdbSMiklos Szeredi 		goto out_err;
1213f45827e8SErez Zadok 
1214e9be9d5eSMiklos Szeredi 	err = -EINVAL;
1215ad204488SMiklos Szeredi 	if (!ofs->config.lowerdir) {
121607f2af7bSKonstantin Khlebnikov 		if (!silent)
121753a08cb9SMiklos Szeredi 			pr_err("overlayfs: missing 'lowerdir'\n");
1218a9075cdbSMiklos Szeredi 		goto out_err;
121953a08cb9SMiklos Szeredi 	}
122053a08cb9SMiklos Szeredi 
122153a08cb9SMiklos Szeredi 	sb->s_stack_depth = 0;
1222cf9a6784SMiklos Szeredi 	sb->s_maxbytes = MAX_LFS_FILESIZE;
1223ad204488SMiklos Szeredi 	if (ofs->config.upperdir) {
1224ad204488SMiklos Szeredi 		if (!ofs->config.workdir) {
122553a08cb9SMiklos Szeredi 			pr_err("overlayfs: missing 'workdir'\n");
1226a9075cdbSMiklos Szeredi 			goto out_err;
1227e9be9d5eSMiklos Szeredi 		}
1228e9be9d5eSMiklos Szeredi 
1229ad204488SMiklos Szeredi 		err = ovl_get_upper(ofs, &upperpath);
123021a3b317SMiklos Szeredi 		if (err)
1231a9075cdbSMiklos Szeredi 			goto out_err;
1232d719e8f2SMiklos Szeredi 
1233ad204488SMiklos Szeredi 		err = ovl_get_workdir(ofs, &upperpath);
12348ed61dc3SMiklos Szeredi 		if (err)
1235a9075cdbSMiklos Szeredi 			goto out_err;
1236c6fe6254SMiklos Szeredi 
1237ad204488SMiklos Szeredi 		if (!ofs->workdir)
12381751e8a6SLinus Torvalds 			sb->s_flags |= SB_RDONLY;
12396e88256eSMiklos Szeredi 
1240ad204488SMiklos Szeredi 		sb->s_stack_depth = ofs->upper_mnt->mnt_sb->s_stack_depth;
1241ad204488SMiklos Szeredi 		sb->s_time_gran = ofs->upper_mnt->mnt_sb->s_time_gran;
1242c6fe6254SMiklos Szeredi 
124321765194SVivek Goyal 	}
1244ad204488SMiklos Szeredi 	oe = ovl_get_lowerstack(sb, ofs);
12454155c10aSMiklos Szeredi 	err = PTR_ERR(oe);
12464155c10aSMiklos Szeredi 	if (IS_ERR(oe))
1247a9075cdbSMiklos Szeredi 		goto out_err;
1248e9be9d5eSMiklos Szeredi 
124971cbad7eShujianyang 	/* If the upper fs is nonexistent, we mark overlayfs r/o too */
1250ad204488SMiklos Szeredi 	if (!ofs->upper_mnt)
12511751e8a6SLinus Torvalds 		sb->s_flags |= SB_RDONLY;
1252ad204488SMiklos Szeredi 	else if (ofs->upper_mnt->mnt_sb != ofs->same_sb)
1253ad204488SMiklos Szeredi 		ofs->same_sb = NULL;
1254e9be9d5eSMiklos Szeredi 
1255ad204488SMiklos Szeredi 	if (!(ovl_force_readonly(ofs)) && ofs->config.index) {
1256ad204488SMiklos Szeredi 		err = ovl_get_indexdir(ofs, oe, &upperpath);
125754fb347eSAmir Goldstein 		if (err)
12584155c10aSMiklos Szeredi 			goto out_free_oe;
12596e88256eSMiklos Szeredi 
1260ad204488SMiklos Szeredi 		if (!ofs->indexdir)
12611751e8a6SLinus Torvalds 			sb->s_flags |= SB_RDONLY;
126202bcd157SAmir Goldstein 	}
126302bcd157SAmir Goldstein 
126402bcd157SAmir Goldstein 	/* Show index=off/on in /proc/mounts for any of the reasons above */
1265ad204488SMiklos Szeredi 	if (!ofs->indexdir)
1266ad204488SMiklos Szeredi 		ofs->config.index = false;
126702bcd157SAmir Goldstein 
126851f8f3c4SKonstantin Khlebnikov 	/* Never override disk quota limits or use reserved space */
126951f8f3c4SKonstantin Khlebnikov 	cap_lower(cred->cap_effective, CAP_SYS_RESOURCE);
127051f8f3c4SKonstantin Khlebnikov 
1271655042ccSVivek Goyal 	sb->s_magic = OVERLAYFS_SUPER_MAGIC;
1272655042ccSVivek Goyal 	sb->s_op = &ovl_super_operations;
1273655042ccSVivek Goyal 	sb->s_xattr = ovl_xattr_handlers;
1274ad204488SMiklos Szeredi 	sb->s_fs_info = ofs;
12751751e8a6SLinus Torvalds 	sb->s_flags |= SB_POSIXACL | SB_NOREMOTELOCK;
1276655042ccSVivek Goyal 
1277c6fe6254SMiklos Szeredi 	err = -ENOMEM;
1278ca4c8a3aSMiklos Szeredi 	root_dentry = d_make_root(ovl_new_inode(sb, S_IFDIR, 0));
1279e9be9d5eSMiklos Szeredi 	if (!root_dentry)
12804155c10aSMiklos Szeredi 		goto out_free_oe;
1281e9be9d5eSMiklos Szeredi 
1282e9be9d5eSMiklos Szeredi 	mntput(upperpath.mnt);
1283f3a15685SAmir Goldstein 	if (upperpath.dentry) {
128455acc661SMiklos Szeredi 		oe->has_upper = true;
128513c72075SMiklos Szeredi 		if (ovl_is_impuredir(upperpath.dentry))
128613c72075SMiklos Szeredi 			ovl_set_flag(OVL_IMPURE, d_inode(root_dentry));
1287f3a15685SAmir Goldstein 	}
1288e9be9d5eSMiklos Szeredi 
1289e9be9d5eSMiklos Szeredi 	root_dentry->d_fsdata = oe;
1290e9be9d5eSMiklos Szeredi 
1291b79e05aaSAmir Goldstein 	/* Root is always merge -> can have whiteouts */
1292b79e05aaSAmir Goldstein 	ovl_set_flag(OVL_WHITEOUTS, d_inode(root_dentry));
129309d8b586SMiklos Szeredi 	ovl_inode_init(d_inode(root_dentry), upperpath.dentry,
129409d8b586SMiklos Szeredi 		       ovl_dentry_lower(root_dentry));
1295ed06e069SMiklos Szeredi 
1296e9be9d5eSMiklos Szeredi 	sb->s_root = root_dentry;
1297e9be9d5eSMiklos Szeredi 
1298e9be9d5eSMiklos Szeredi 	return 0;
1299e9be9d5eSMiklos Szeredi 
13004155c10aSMiklos Szeredi out_free_oe:
13014155c10aSMiklos Szeredi 	ovl_entry_stack_free(oe);
1302b9343632SChandan Rajendra 	kfree(oe);
13034155c10aSMiklos Szeredi out_err:
1304e9be9d5eSMiklos Szeredi 	path_put(&upperpath);
1305ad204488SMiklos Szeredi 	ovl_free_fs(ofs);
1306e9be9d5eSMiklos Szeredi out:
1307e9be9d5eSMiklos Szeredi 	return err;
1308e9be9d5eSMiklos Szeredi }
1309e9be9d5eSMiklos Szeredi 
1310e9be9d5eSMiklos Szeredi static struct dentry *ovl_mount(struct file_system_type *fs_type, int flags,
1311e9be9d5eSMiklos Szeredi 				const char *dev_name, void *raw_data)
1312e9be9d5eSMiklos Szeredi {
1313e9be9d5eSMiklos Szeredi 	return mount_nodev(fs_type, flags, raw_data, ovl_fill_super);
1314e9be9d5eSMiklos Szeredi }
1315e9be9d5eSMiklos Szeredi 
1316e9be9d5eSMiklos Szeredi static struct file_system_type ovl_fs_type = {
1317e9be9d5eSMiklos Szeredi 	.owner		= THIS_MODULE,
1318ef94b186SMiklos Szeredi 	.name		= "overlay",
1319e9be9d5eSMiklos Szeredi 	.mount		= ovl_mount,
1320e9be9d5eSMiklos Szeredi 	.kill_sb	= kill_anon_super,
1321e9be9d5eSMiklos Szeredi };
1322ef94b186SMiklos Szeredi MODULE_ALIAS_FS("overlay");
1323e9be9d5eSMiklos Szeredi 
132413cf199dSAmir Goldstein static void ovl_inode_init_once(void *foo)
132513cf199dSAmir Goldstein {
132613cf199dSAmir Goldstein 	struct ovl_inode *oi = foo;
132713cf199dSAmir Goldstein 
132813cf199dSAmir Goldstein 	inode_init_once(&oi->vfs_inode);
132913cf199dSAmir Goldstein }
133013cf199dSAmir Goldstein 
1331e9be9d5eSMiklos Szeredi static int __init ovl_init(void)
1332e9be9d5eSMiklos Szeredi {
133313cf199dSAmir Goldstein 	int err;
133413cf199dSAmir Goldstein 
133513cf199dSAmir Goldstein 	ovl_inode_cachep = kmem_cache_create("ovl_inode",
133613cf199dSAmir Goldstein 					     sizeof(struct ovl_inode), 0,
133713cf199dSAmir Goldstein 					     (SLAB_RECLAIM_ACCOUNT|
133813cf199dSAmir Goldstein 					      SLAB_MEM_SPREAD|SLAB_ACCOUNT),
133913cf199dSAmir Goldstein 					     ovl_inode_init_once);
134013cf199dSAmir Goldstein 	if (ovl_inode_cachep == NULL)
134113cf199dSAmir Goldstein 		return -ENOMEM;
134213cf199dSAmir Goldstein 
134313cf199dSAmir Goldstein 	err = register_filesystem(&ovl_fs_type);
134413cf199dSAmir Goldstein 	if (err)
134513cf199dSAmir Goldstein 		kmem_cache_destroy(ovl_inode_cachep);
134613cf199dSAmir Goldstein 
134713cf199dSAmir Goldstein 	return err;
1348e9be9d5eSMiklos Szeredi }
1349e9be9d5eSMiklos Szeredi 
1350e9be9d5eSMiklos Szeredi static void __exit ovl_exit(void)
1351e9be9d5eSMiklos Szeredi {
1352e9be9d5eSMiklos Szeredi 	unregister_filesystem(&ovl_fs_type);
135313cf199dSAmir Goldstein 
135413cf199dSAmir Goldstein 	/*
135513cf199dSAmir Goldstein 	 * Make sure all delayed rcu free inodes are flushed before we
135613cf199dSAmir Goldstein 	 * destroy cache.
135713cf199dSAmir Goldstein 	 */
135813cf199dSAmir Goldstein 	rcu_barrier();
135913cf199dSAmir Goldstein 	kmem_cache_destroy(ovl_inode_cachep);
136013cf199dSAmir Goldstein 
1361e9be9d5eSMiklos Szeredi }
1362e9be9d5eSMiklos Szeredi 
1363e9be9d5eSMiklos Szeredi module_init(ovl_init);
1364e9be9d5eSMiklos Szeredi module_exit(ovl_exit);
1365