xref: /openbmc/linux/fs/overlayfs/dir.c (revision 5955102c)
1e9be9d5eSMiklos Szeredi /*
2e9be9d5eSMiklos Szeredi  *
3e9be9d5eSMiklos Szeredi  * Copyright (C) 2011 Novell Inc.
4e9be9d5eSMiklos Szeredi  *
5e9be9d5eSMiklos Szeredi  * This program is free software; you can redistribute it and/or modify it
6e9be9d5eSMiklos Szeredi  * under the terms of the GNU General Public License version 2 as published by
7e9be9d5eSMiklos Szeredi  * the Free Software Foundation.
8e9be9d5eSMiklos Szeredi  */
9e9be9d5eSMiklos Szeredi 
10e9be9d5eSMiklos Szeredi #include <linux/fs.h>
11e9be9d5eSMiklos Szeredi #include <linux/namei.h>
12e9be9d5eSMiklos Szeredi #include <linux/xattr.h>
13e9be9d5eSMiklos Szeredi #include <linux/security.h>
14e9be9d5eSMiklos Szeredi #include <linux/cred.h>
15e9be9d5eSMiklos Szeredi #include "overlayfs.h"
16e9be9d5eSMiklos Szeredi 
17e9be9d5eSMiklos Szeredi void ovl_cleanup(struct inode *wdir, struct dentry *wdentry)
18e9be9d5eSMiklos Szeredi {
19e9be9d5eSMiklos Szeredi 	int err;
20e9be9d5eSMiklos Szeredi 
21e9be9d5eSMiklos Szeredi 	dget(wdentry);
22e36cb0b8SDavid Howells 	if (d_is_dir(wdentry))
23e9be9d5eSMiklos Szeredi 		err = ovl_do_rmdir(wdir, wdentry);
24e9be9d5eSMiklos Szeredi 	else
25e9be9d5eSMiklos Szeredi 		err = ovl_do_unlink(wdir, wdentry);
26e9be9d5eSMiklos Szeredi 	dput(wdentry);
27e9be9d5eSMiklos Szeredi 
28e9be9d5eSMiklos Szeredi 	if (err) {
29e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: cleanup of '%pd2' failed (%i)\n",
30e9be9d5eSMiklos Szeredi 		       wdentry, err);
31e9be9d5eSMiklos Szeredi 	}
32e9be9d5eSMiklos Szeredi }
33e9be9d5eSMiklos Szeredi 
34e9be9d5eSMiklos Szeredi struct dentry *ovl_lookup_temp(struct dentry *workdir, struct dentry *dentry)
35e9be9d5eSMiklos Szeredi {
36e9be9d5eSMiklos Szeredi 	struct dentry *temp;
37e9be9d5eSMiklos Szeredi 	char name[20];
38e9be9d5eSMiklos Szeredi 
39e9be9d5eSMiklos Szeredi 	snprintf(name, sizeof(name), "#%lx", (unsigned long) dentry);
40e9be9d5eSMiklos Szeredi 
41e9be9d5eSMiklos Szeredi 	temp = lookup_one_len(name, workdir, strlen(name));
42e9be9d5eSMiklos Szeredi 	if (!IS_ERR(temp) && temp->d_inode) {
43e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: workdir/%s already exists\n", name);
44e9be9d5eSMiklos Szeredi 		dput(temp);
45e9be9d5eSMiklos Szeredi 		temp = ERR_PTR(-EIO);
46e9be9d5eSMiklos Szeredi 	}
47e9be9d5eSMiklos Szeredi 
48e9be9d5eSMiklos Szeredi 	return temp;
49e9be9d5eSMiklos Szeredi }
50e9be9d5eSMiklos Szeredi 
51e9be9d5eSMiklos Szeredi /* caller holds i_mutex on workdir */
52e9be9d5eSMiklos Szeredi static struct dentry *ovl_whiteout(struct dentry *workdir,
53e9be9d5eSMiklos Szeredi 				   struct dentry *dentry)
54e9be9d5eSMiklos Szeredi {
55e9be9d5eSMiklos Szeredi 	int err;
56e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
57e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
58e9be9d5eSMiklos Szeredi 
59e9be9d5eSMiklos Szeredi 	whiteout = ovl_lookup_temp(workdir, dentry);
60e9be9d5eSMiklos Szeredi 	if (IS_ERR(whiteout))
61e9be9d5eSMiklos Szeredi 		return whiteout;
62e9be9d5eSMiklos Szeredi 
63e9be9d5eSMiklos Szeredi 	err = ovl_do_whiteout(wdir, whiteout);
64e9be9d5eSMiklos Szeredi 	if (err) {
65e9be9d5eSMiklos Szeredi 		dput(whiteout);
66e9be9d5eSMiklos Szeredi 		whiteout = ERR_PTR(err);
67e9be9d5eSMiklos Szeredi 	}
68e9be9d5eSMiklos Szeredi 
69e9be9d5eSMiklos Szeredi 	return whiteout;
70e9be9d5eSMiklos Szeredi }
71e9be9d5eSMiklos Szeredi 
72e9be9d5eSMiklos Szeredi int ovl_create_real(struct inode *dir, struct dentry *newdentry,
73e9be9d5eSMiklos Szeredi 		    struct kstat *stat, const char *link,
74e9be9d5eSMiklos Szeredi 		    struct dentry *hardlink, bool debug)
75e9be9d5eSMiklos Szeredi {
76e9be9d5eSMiklos Szeredi 	int err;
77e9be9d5eSMiklos Szeredi 
78e9be9d5eSMiklos Szeredi 	if (newdentry->d_inode)
79e9be9d5eSMiklos Szeredi 		return -ESTALE;
80e9be9d5eSMiklos Szeredi 
81e9be9d5eSMiklos Szeredi 	if (hardlink) {
82e9be9d5eSMiklos Szeredi 		err = ovl_do_link(hardlink, dir, newdentry, debug);
83e9be9d5eSMiklos Szeredi 	} else {
84e9be9d5eSMiklos Szeredi 		switch (stat->mode & S_IFMT) {
85e9be9d5eSMiklos Szeredi 		case S_IFREG:
86e9be9d5eSMiklos Szeredi 			err = ovl_do_create(dir, newdentry, stat->mode, debug);
87e9be9d5eSMiklos Szeredi 			break;
88e9be9d5eSMiklos Szeredi 
89e9be9d5eSMiklos Szeredi 		case S_IFDIR:
90e9be9d5eSMiklos Szeredi 			err = ovl_do_mkdir(dir, newdentry, stat->mode, debug);
91e9be9d5eSMiklos Szeredi 			break;
92e9be9d5eSMiklos Szeredi 
93e9be9d5eSMiklos Szeredi 		case S_IFCHR:
94e9be9d5eSMiklos Szeredi 		case S_IFBLK:
95e9be9d5eSMiklos Szeredi 		case S_IFIFO:
96e9be9d5eSMiklos Szeredi 		case S_IFSOCK:
97e9be9d5eSMiklos Szeredi 			err = ovl_do_mknod(dir, newdentry,
98e9be9d5eSMiklos Szeredi 					   stat->mode, stat->rdev, debug);
99e9be9d5eSMiklos Szeredi 			break;
100e9be9d5eSMiklos Szeredi 
101e9be9d5eSMiklos Szeredi 		case S_IFLNK:
102e9be9d5eSMiklos Szeredi 			err = ovl_do_symlink(dir, newdentry, link, debug);
103e9be9d5eSMiklos Szeredi 			break;
104e9be9d5eSMiklos Szeredi 
105e9be9d5eSMiklos Szeredi 		default:
106e9be9d5eSMiklos Szeredi 			err = -EPERM;
107e9be9d5eSMiklos Szeredi 		}
108e9be9d5eSMiklos Szeredi 	}
109e9be9d5eSMiklos Szeredi 	if (!err && WARN_ON(!newdentry->d_inode)) {
110e9be9d5eSMiklos Szeredi 		/*
111e9be9d5eSMiklos Szeredi 		 * Not quite sure if non-instantiated dentry is legal or not.
112e9be9d5eSMiklos Szeredi 		 * VFS doesn't seem to care so check and warn here.
113e9be9d5eSMiklos Szeredi 		 */
114e9be9d5eSMiklos Szeredi 		err = -ENOENT;
115e9be9d5eSMiklos Szeredi 	}
116e9be9d5eSMiklos Szeredi 	return err;
117e9be9d5eSMiklos Szeredi }
118e9be9d5eSMiklos Szeredi 
119e9be9d5eSMiklos Szeredi static int ovl_set_opaque(struct dentry *upperdentry)
120e9be9d5eSMiklos Szeredi {
121cead89bbShujianyang 	return ovl_do_setxattr(upperdentry, OVL_XATTR_OPAQUE, "y", 1, 0);
122e9be9d5eSMiklos Szeredi }
123e9be9d5eSMiklos Szeredi 
124e9be9d5eSMiklos Szeredi static void ovl_remove_opaque(struct dentry *upperdentry)
125e9be9d5eSMiklos Szeredi {
126e9be9d5eSMiklos Szeredi 	int err;
127e9be9d5eSMiklos Szeredi 
128cead89bbShujianyang 	err = ovl_do_removexattr(upperdentry, OVL_XATTR_OPAQUE);
129e9be9d5eSMiklos Szeredi 	if (err) {
130e9be9d5eSMiklos Szeredi 		pr_warn("overlayfs: failed to remove opaque from '%s' (%i)\n",
131e9be9d5eSMiklos Szeredi 			upperdentry->d_name.name, err);
132e9be9d5eSMiklos Szeredi 	}
133e9be9d5eSMiklos Szeredi }
134e9be9d5eSMiklos Szeredi 
135e9be9d5eSMiklos Szeredi static int ovl_dir_getattr(struct vfsmount *mnt, struct dentry *dentry,
136e9be9d5eSMiklos Szeredi 			 struct kstat *stat)
137e9be9d5eSMiklos Szeredi {
138e9be9d5eSMiklos Szeredi 	int err;
139e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
140e9be9d5eSMiklos Szeredi 	struct path realpath;
141e9be9d5eSMiklos Szeredi 
142e9be9d5eSMiklos Szeredi 	type = ovl_path_real(dentry, &realpath);
143e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&realpath, stat);
144e9be9d5eSMiklos Szeredi 	if (err)
145e9be9d5eSMiklos Szeredi 		return err;
146e9be9d5eSMiklos Szeredi 
147e9be9d5eSMiklos Szeredi 	stat->dev = dentry->d_sb->s_dev;
148e9be9d5eSMiklos Szeredi 	stat->ino = dentry->d_inode->i_ino;
149e9be9d5eSMiklos Szeredi 
150e9be9d5eSMiklos Szeredi 	/*
151e9be9d5eSMiklos Szeredi 	 * It's probably not worth it to count subdirs to get the
152e9be9d5eSMiklos Szeredi 	 * correct link count.  nlink=1 seems to pacify 'find' and
153e9be9d5eSMiklos Szeredi 	 * other utilities.
154e9be9d5eSMiklos Szeredi 	 */
1551afaba1eSMiklos Szeredi 	if (OVL_TYPE_MERGE(type))
156e9be9d5eSMiklos Szeredi 		stat->nlink = 1;
157e9be9d5eSMiklos Szeredi 
158e9be9d5eSMiklos Szeredi 	return 0;
159e9be9d5eSMiklos Szeredi }
160e9be9d5eSMiklos Szeredi 
161e9be9d5eSMiklos Szeredi static int ovl_create_upper(struct dentry *dentry, struct inode *inode,
162e9be9d5eSMiklos Szeredi 			    struct kstat *stat, const char *link,
163e9be9d5eSMiklos Szeredi 			    struct dentry *hardlink)
164e9be9d5eSMiklos Szeredi {
165e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
166e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
167e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
168e9be9d5eSMiklos Szeredi 	int err;
169e9be9d5eSMiklos Szeredi 
1705955102cSAl Viro 	inode_lock_nested(udir, I_MUTEX_PARENT);
171e9be9d5eSMiklos Szeredi 	newdentry = lookup_one_len(dentry->d_name.name, upperdir,
172e9be9d5eSMiklos Szeredi 				   dentry->d_name.len);
173e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
174e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
175e9be9d5eSMiklos Szeredi 		goto out_unlock;
176e9be9d5eSMiklos Szeredi 	err = ovl_create_real(udir, newdentry, stat, link, hardlink, false);
177e9be9d5eSMiklos Szeredi 	if (err)
178e9be9d5eSMiklos Szeredi 		goto out_dput;
179e9be9d5eSMiklos Szeredi 
180e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
181e9be9d5eSMiklos Szeredi 	ovl_dentry_update(dentry, newdentry);
182e9be9d5eSMiklos Szeredi 	ovl_copyattr(newdentry->d_inode, inode);
183e9be9d5eSMiklos Szeredi 	d_instantiate(dentry, inode);
184e9be9d5eSMiklos Szeredi 	newdentry = NULL;
185e9be9d5eSMiklos Szeredi out_dput:
186e9be9d5eSMiklos Szeredi 	dput(newdentry);
187e9be9d5eSMiklos Szeredi out_unlock:
1885955102cSAl Viro 	inode_unlock(udir);
189e9be9d5eSMiklos Szeredi 	return err;
190e9be9d5eSMiklos Szeredi }
191e9be9d5eSMiklos Szeredi 
192e9be9d5eSMiklos Szeredi static int ovl_lock_rename_workdir(struct dentry *workdir,
193e9be9d5eSMiklos Szeredi 				   struct dentry *upperdir)
194e9be9d5eSMiklos Szeredi {
195e9be9d5eSMiklos Szeredi 	/* Workdir should not be the same as upperdir */
196e9be9d5eSMiklos Szeredi 	if (workdir == upperdir)
197e9be9d5eSMiklos Szeredi 		goto err;
198e9be9d5eSMiklos Szeredi 
199e9be9d5eSMiklos Szeredi 	/* Workdir should not be subdir of upperdir and vice versa */
200e9be9d5eSMiklos Szeredi 	if (lock_rename(workdir, upperdir) != NULL)
201e9be9d5eSMiklos Szeredi 		goto err_unlock;
202e9be9d5eSMiklos Szeredi 
203e9be9d5eSMiklos Szeredi 	return 0;
204e9be9d5eSMiklos Szeredi 
205e9be9d5eSMiklos Szeredi err_unlock:
206e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
207e9be9d5eSMiklos Szeredi err:
208e9be9d5eSMiklos Szeredi 	pr_err("overlayfs: failed to lock workdir+upperdir\n");
209e9be9d5eSMiklos Szeredi 	return -EIO;
210e9be9d5eSMiklos Szeredi }
211e9be9d5eSMiklos Szeredi 
212e9be9d5eSMiklos Szeredi static struct dentry *ovl_clear_empty(struct dentry *dentry,
213e9be9d5eSMiklos Szeredi 				      struct list_head *list)
214e9be9d5eSMiklos Szeredi {
215e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
216e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
217e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
218e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
219e9be9d5eSMiklos Szeredi 	struct path upperpath;
220e9be9d5eSMiklos Szeredi 	struct dentry *upper;
221e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir;
222e9be9d5eSMiklos Szeredi 	struct kstat stat;
223e9be9d5eSMiklos Szeredi 	int err;
224e9be9d5eSMiklos Szeredi 
225cc6f67bcSMiklos Szeredi 	if (WARN_ON(!workdir))
226cc6f67bcSMiklos Szeredi 		return ERR_PTR(-EROFS);
227cc6f67bcSMiklos Szeredi 
228e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
229e9be9d5eSMiklos Szeredi 	if (err)
230e9be9d5eSMiklos Szeredi 		goto out;
231e9be9d5eSMiklos Szeredi 
232e9be9d5eSMiklos Szeredi 	ovl_path_upper(dentry, &upperpath);
233e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&upperpath, &stat);
234e9be9d5eSMiklos Szeredi 	if (err)
235e9be9d5eSMiklos Szeredi 		goto out_unlock;
236e9be9d5eSMiklos Szeredi 
237e9be9d5eSMiklos Szeredi 	err = -ESTALE;
238e9be9d5eSMiklos Szeredi 	if (!S_ISDIR(stat.mode))
239e9be9d5eSMiklos Szeredi 		goto out_unlock;
240e9be9d5eSMiklos Szeredi 	upper = upperpath.dentry;
241e9be9d5eSMiklos Szeredi 	if (upper->d_parent->d_inode != udir)
242e9be9d5eSMiklos Szeredi 		goto out_unlock;
243e9be9d5eSMiklos Szeredi 
244e9be9d5eSMiklos Szeredi 	opaquedir = ovl_lookup_temp(workdir, dentry);
245e9be9d5eSMiklos Szeredi 	err = PTR_ERR(opaquedir);
246e9be9d5eSMiklos Szeredi 	if (IS_ERR(opaquedir))
247e9be9d5eSMiklos Szeredi 		goto out_unlock;
248e9be9d5eSMiklos Szeredi 
249e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, opaquedir, &stat, NULL, NULL, true);
250e9be9d5eSMiklos Szeredi 	if (err)
251e9be9d5eSMiklos Szeredi 		goto out_dput;
252e9be9d5eSMiklos Szeredi 
253e9be9d5eSMiklos Szeredi 	err = ovl_copy_xattr(upper, opaquedir);
254e9be9d5eSMiklos Szeredi 	if (err)
255e9be9d5eSMiklos Szeredi 		goto out_cleanup;
256e9be9d5eSMiklos Szeredi 
257e9be9d5eSMiklos Szeredi 	err = ovl_set_opaque(opaquedir);
258e9be9d5eSMiklos Szeredi 	if (err)
259e9be9d5eSMiklos Szeredi 		goto out_cleanup;
260e9be9d5eSMiklos Szeredi 
2615955102cSAl Viro 	inode_lock(opaquedir->d_inode);
262e9be9d5eSMiklos Szeredi 	err = ovl_set_attr(opaquedir, &stat);
2635955102cSAl Viro 	inode_unlock(opaquedir->d_inode);
264e9be9d5eSMiklos Szeredi 	if (err)
265e9be9d5eSMiklos Szeredi 		goto out_cleanup;
266e9be9d5eSMiklos Szeredi 
267e9be9d5eSMiklos Szeredi 	err = ovl_do_rename(wdir, opaquedir, udir, upper, RENAME_EXCHANGE);
268e9be9d5eSMiklos Szeredi 	if (err)
269e9be9d5eSMiklos Szeredi 		goto out_cleanup;
270e9be9d5eSMiklos Szeredi 
271e9be9d5eSMiklos Szeredi 	ovl_cleanup_whiteouts(upper, list);
272e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, upper);
273e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
274e9be9d5eSMiklos Szeredi 
275e9be9d5eSMiklos Szeredi 	/* dentry's upper doesn't match now, get rid of it */
276e9be9d5eSMiklos Szeredi 	d_drop(dentry);
277e9be9d5eSMiklos Szeredi 
278e9be9d5eSMiklos Szeredi 	return opaquedir;
279e9be9d5eSMiklos Szeredi 
280e9be9d5eSMiklos Szeredi out_cleanup:
281e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, opaquedir);
282e9be9d5eSMiklos Szeredi out_dput:
283e9be9d5eSMiklos Szeredi 	dput(opaquedir);
284e9be9d5eSMiklos Szeredi out_unlock:
285e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
286e9be9d5eSMiklos Szeredi out:
287e9be9d5eSMiklos Szeredi 	return ERR_PTR(err);
288e9be9d5eSMiklos Szeredi }
289e9be9d5eSMiklos Szeredi 
290a105d685SMiklos Szeredi static struct dentry *ovl_check_empty_and_clear(struct dentry *dentry)
291e9be9d5eSMiklos Szeredi {
292e9be9d5eSMiklos Szeredi 	int err;
293e9be9d5eSMiklos Szeredi 	struct dentry *ret = NULL;
294e9be9d5eSMiklos Szeredi 	LIST_HEAD(list);
295e9be9d5eSMiklos Szeredi 
296e9be9d5eSMiklos Szeredi 	err = ovl_check_empty_dir(dentry, &list);
297e9be9d5eSMiklos Szeredi 	if (err)
298e9be9d5eSMiklos Szeredi 		ret = ERR_PTR(err);
299a105d685SMiklos Szeredi 	else {
300a105d685SMiklos Szeredi 		/*
301a105d685SMiklos Szeredi 		 * If no upperdentry then skip clearing whiteouts.
302a105d685SMiklos Szeredi 		 *
303a105d685SMiklos Szeredi 		 * Can race with copy-up, since we don't hold the upperdir
304a105d685SMiklos Szeredi 		 * mutex.  Doesn't matter, since copy-up can't create a
305a105d685SMiklos Szeredi 		 * non-empty directory from an empty one.
306a105d685SMiklos Szeredi 		 */
307a105d685SMiklos Szeredi 		if (ovl_dentry_upper(dentry))
308e9be9d5eSMiklos Szeredi 			ret = ovl_clear_empty(dentry, &list);
309a105d685SMiklos Szeredi 	}
310e9be9d5eSMiklos Szeredi 
311e9be9d5eSMiklos Szeredi 	ovl_cache_free(&list);
312e9be9d5eSMiklos Szeredi 
313e9be9d5eSMiklos Szeredi 	return ret;
314e9be9d5eSMiklos Szeredi }
315e9be9d5eSMiklos Szeredi 
316e9be9d5eSMiklos Szeredi static int ovl_create_over_whiteout(struct dentry *dentry, struct inode *inode,
317e9be9d5eSMiklos Szeredi 				    struct kstat *stat, const char *link,
318e9be9d5eSMiklos Szeredi 				    struct dentry *hardlink)
319e9be9d5eSMiklos Szeredi {
320e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
321e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
322e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
323e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
324e9be9d5eSMiklos Szeredi 	struct dentry *upper;
325e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
326e9be9d5eSMiklos Szeredi 	int err;
327e9be9d5eSMiklos Szeredi 
328cc6f67bcSMiklos Szeredi 	if (WARN_ON(!workdir))
329cc6f67bcSMiklos Szeredi 		return -EROFS;
330cc6f67bcSMiklos Szeredi 
331e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
332e9be9d5eSMiklos Szeredi 	if (err)
333e9be9d5eSMiklos Szeredi 		goto out;
334e9be9d5eSMiklos Szeredi 
335e9be9d5eSMiklos Szeredi 	newdentry = ovl_lookup_temp(workdir, dentry);
336e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
337e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
338e9be9d5eSMiklos Szeredi 		goto out_unlock;
339e9be9d5eSMiklos Szeredi 
340e9be9d5eSMiklos Szeredi 	upper = lookup_one_len(dentry->d_name.name, upperdir,
341e9be9d5eSMiklos Szeredi 			       dentry->d_name.len);
342e9be9d5eSMiklos Szeredi 	err = PTR_ERR(upper);
343e9be9d5eSMiklos Szeredi 	if (IS_ERR(upper))
344e9be9d5eSMiklos Szeredi 		goto out_dput;
345e9be9d5eSMiklos Szeredi 
346e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, newdentry, stat, link, hardlink, true);
347e9be9d5eSMiklos Szeredi 	if (err)
348e9be9d5eSMiklos Szeredi 		goto out_dput2;
349e9be9d5eSMiklos Szeredi 
350e9be9d5eSMiklos Szeredi 	if (S_ISDIR(stat->mode)) {
351e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
352e9be9d5eSMiklos Szeredi 		if (err)
353e9be9d5eSMiklos Szeredi 			goto out_cleanup;
354e9be9d5eSMiklos Szeredi 
355e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper,
356e9be9d5eSMiklos Szeredi 				    RENAME_EXCHANGE);
357e9be9d5eSMiklos Szeredi 		if (err)
358e9be9d5eSMiklos Szeredi 			goto out_cleanup;
359e9be9d5eSMiklos Szeredi 
360e9be9d5eSMiklos Szeredi 		ovl_cleanup(wdir, upper);
361e9be9d5eSMiklos Szeredi 	} else {
362e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper, 0);
363e9be9d5eSMiklos Szeredi 		if (err)
364e9be9d5eSMiklos Szeredi 			goto out_cleanup;
365e9be9d5eSMiklos Szeredi 	}
366e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
367e9be9d5eSMiklos Szeredi 	ovl_dentry_update(dentry, newdentry);
368e9be9d5eSMiklos Szeredi 	ovl_copyattr(newdentry->d_inode, inode);
369e9be9d5eSMiklos Szeredi 	d_instantiate(dentry, inode);
370e9be9d5eSMiklos Szeredi 	newdentry = NULL;
371e9be9d5eSMiklos Szeredi out_dput2:
372e9be9d5eSMiklos Szeredi 	dput(upper);
373e9be9d5eSMiklos Szeredi out_dput:
374e9be9d5eSMiklos Szeredi 	dput(newdentry);
375e9be9d5eSMiklos Szeredi out_unlock:
376e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
377e9be9d5eSMiklos Szeredi out:
378e9be9d5eSMiklos Szeredi 	return err;
379e9be9d5eSMiklos Szeredi 
380e9be9d5eSMiklos Szeredi out_cleanup:
381e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, newdentry);
382e9be9d5eSMiklos Szeredi 	goto out_dput2;
383e9be9d5eSMiklos Szeredi }
384e9be9d5eSMiklos Szeredi 
385e9be9d5eSMiklos Szeredi static int ovl_create_or_link(struct dentry *dentry, int mode, dev_t rdev,
386e9be9d5eSMiklos Szeredi 			      const char *link, struct dentry *hardlink)
387e9be9d5eSMiklos Szeredi {
388e9be9d5eSMiklos Szeredi 	int err;
389e9be9d5eSMiklos Szeredi 	struct inode *inode;
390e9be9d5eSMiklos Szeredi 	struct kstat stat = {
391e9be9d5eSMiklos Szeredi 		.mode = mode,
392e9be9d5eSMiklos Szeredi 		.rdev = rdev,
393e9be9d5eSMiklos Szeredi 	};
394e9be9d5eSMiklos Szeredi 
395e9be9d5eSMiklos Szeredi 	err = -ENOMEM;
396e9be9d5eSMiklos Szeredi 	inode = ovl_new_inode(dentry->d_sb, mode, dentry->d_fsdata);
397e9be9d5eSMiklos Szeredi 	if (!inode)
398e9be9d5eSMiklos Szeredi 		goto out;
399e9be9d5eSMiklos Szeredi 
400e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
401e9be9d5eSMiklos Szeredi 	if (err)
402e9be9d5eSMiklos Szeredi 		goto out_iput;
403e9be9d5eSMiklos Szeredi 
404e9be9d5eSMiklos Szeredi 	if (!ovl_dentry_is_opaque(dentry)) {
405e9be9d5eSMiklos Szeredi 		err = ovl_create_upper(dentry, inode, &stat, link, hardlink);
406e9be9d5eSMiklos Szeredi 	} else {
407e9be9d5eSMiklos Szeredi 		const struct cred *old_cred;
408e9be9d5eSMiklos Szeredi 		struct cred *override_cred;
409e9be9d5eSMiklos Szeredi 
410e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
411e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
412e9be9d5eSMiklos Szeredi 		if (!override_cred)
413e9be9d5eSMiklos Szeredi 			goto out_iput;
414e9be9d5eSMiklos Szeredi 
415e9be9d5eSMiklos Szeredi 		/*
416e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting opaque xattr
417e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir, rename
418e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
419e9be9d5eSMiklos Szeredi 		 */
420e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
421e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
422e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
423e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
424e9be9d5eSMiklos Szeredi 
425e9be9d5eSMiklos Szeredi 		err = ovl_create_over_whiteout(dentry, inode, &stat, link,
426e9be9d5eSMiklos Szeredi 					       hardlink);
427e9be9d5eSMiklos Szeredi 
428e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
429e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
430e9be9d5eSMiklos Szeredi 	}
431e9be9d5eSMiklos Szeredi 
432e9be9d5eSMiklos Szeredi 	if (!err)
433e9be9d5eSMiklos Szeredi 		inode = NULL;
434e9be9d5eSMiklos Szeredi out_iput:
435e9be9d5eSMiklos Szeredi 	iput(inode);
436e9be9d5eSMiklos Szeredi out:
437e9be9d5eSMiklos Szeredi 	return err;
438e9be9d5eSMiklos Szeredi }
439e9be9d5eSMiklos Szeredi 
440e9be9d5eSMiklos Szeredi static int ovl_create_object(struct dentry *dentry, int mode, dev_t rdev,
441e9be9d5eSMiklos Szeredi 			     const char *link)
442e9be9d5eSMiklos Szeredi {
443e9be9d5eSMiklos Szeredi 	int err;
444e9be9d5eSMiklos Szeredi 
445e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
446e9be9d5eSMiklos Szeredi 	if (!err) {
447e9be9d5eSMiklos Szeredi 		err = ovl_create_or_link(dentry, mode, rdev, link, NULL);
448e9be9d5eSMiklos Szeredi 		ovl_drop_write(dentry);
449e9be9d5eSMiklos Szeredi 	}
450e9be9d5eSMiklos Szeredi 
451e9be9d5eSMiklos Szeredi 	return err;
452e9be9d5eSMiklos Szeredi }
453e9be9d5eSMiklos Szeredi 
454e9be9d5eSMiklos Szeredi static int ovl_create(struct inode *dir, struct dentry *dentry, umode_t mode,
455e9be9d5eSMiklos Szeredi 		      bool excl)
456e9be9d5eSMiklos Szeredi {
457e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFREG, 0, NULL);
458e9be9d5eSMiklos Szeredi }
459e9be9d5eSMiklos Szeredi 
460e9be9d5eSMiklos Szeredi static int ovl_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode)
461e9be9d5eSMiklos Szeredi {
462e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFDIR, 0, NULL);
463e9be9d5eSMiklos Szeredi }
464e9be9d5eSMiklos Szeredi 
465e9be9d5eSMiklos Szeredi static int ovl_mknod(struct inode *dir, struct dentry *dentry, umode_t mode,
466e9be9d5eSMiklos Szeredi 		     dev_t rdev)
467e9be9d5eSMiklos Szeredi {
468e9be9d5eSMiklos Szeredi 	/* Don't allow creation of "whiteout" on overlay */
469e9be9d5eSMiklos Szeredi 	if (S_ISCHR(mode) && rdev == WHITEOUT_DEV)
470e9be9d5eSMiklos Szeredi 		return -EPERM;
471e9be9d5eSMiklos Szeredi 
472e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, mode, rdev, NULL);
473e9be9d5eSMiklos Szeredi }
474e9be9d5eSMiklos Szeredi 
475e9be9d5eSMiklos Szeredi static int ovl_symlink(struct inode *dir, struct dentry *dentry,
476e9be9d5eSMiklos Szeredi 		       const char *link)
477e9be9d5eSMiklos Szeredi {
478e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, S_IFLNK, 0, link);
479e9be9d5eSMiklos Szeredi }
480e9be9d5eSMiklos Szeredi 
481e9be9d5eSMiklos Szeredi static int ovl_link(struct dentry *old, struct inode *newdir,
482e9be9d5eSMiklos Szeredi 		    struct dentry *new)
483e9be9d5eSMiklos Szeredi {
484e9be9d5eSMiklos Szeredi 	int err;
485e9be9d5eSMiklos Szeredi 	struct dentry *upper;
486e9be9d5eSMiklos Szeredi 
487e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
488e9be9d5eSMiklos Szeredi 	if (err)
489e9be9d5eSMiklos Szeredi 		goto out;
490e9be9d5eSMiklos Szeredi 
491e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
492e9be9d5eSMiklos Szeredi 	if (err)
493e9be9d5eSMiklos Szeredi 		goto out_drop_write;
494e9be9d5eSMiklos Szeredi 
495e9be9d5eSMiklos Szeredi 	upper = ovl_dentry_upper(old);
496e9be9d5eSMiklos Szeredi 	err = ovl_create_or_link(new, upper->d_inode->i_mode, 0, NULL, upper);
497e9be9d5eSMiklos Szeredi 
498e9be9d5eSMiklos Szeredi out_drop_write:
499e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
500e9be9d5eSMiklos Szeredi out:
501e9be9d5eSMiklos Szeredi 	return err;
502e9be9d5eSMiklos Szeredi }
503e9be9d5eSMiklos Szeredi 
504a105d685SMiklos Szeredi static int ovl_remove_and_whiteout(struct dentry *dentry, bool is_dir)
505e9be9d5eSMiklos Szeredi {
506e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
507e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
508e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
509e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
510e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
511e9be9d5eSMiklos Szeredi 	struct dentry *upper;
512e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
513e9be9d5eSMiklos Szeredi 	int err;
514e9be9d5eSMiklos Szeredi 
515cc6f67bcSMiklos Szeredi 	if (WARN_ON(!workdir))
516cc6f67bcSMiklos Szeredi 		return -EROFS;
517cc6f67bcSMiklos Szeredi 
518d377c5ebSMiklos Szeredi 	if (is_dir) {
519d377c5ebSMiklos Szeredi 		if (OVL_TYPE_MERGE_OR_LOWER(ovl_path_type(dentry))) {
520a105d685SMiklos Szeredi 			opaquedir = ovl_check_empty_and_clear(dentry);
521e9be9d5eSMiklos Szeredi 			err = PTR_ERR(opaquedir);
522e9be9d5eSMiklos Szeredi 			if (IS_ERR(opaquedir))
523e9be9d5eSMiklos Szeredi 				goto out;
524d377c5ebSMiklos Szeredi 		} else {
525d377c5ebSMiklos Szeredi 			LIST_HEAD(list);
526d377c5ebSMiklos Szeredi 
527d377c5ebSMiklos Szeredi 			/*
528d377c5ebSMiklos Szeredi 			 * When removing an empty opaque directory, then it
529d377c5ebSMiklos Szeredi 			 * makes no sense to replace it with an exact replica of
530d377c5ebSMiklos Szeredi 			 * itself.  But emptiness still needs to be checked.
531d377c5ebSMiklos Szeredi 			 */
532d377c5ebSMiklos Szeredi 			err = ovl_check_empty_dir(dentry, &list);
533d377c5ebSMiklos Szeredi 			ovl_cache_free(&list);
534d377c5ebSMiklos Szeredi 			if (err)
535d377c5ebSMiklos Szeredi 				goto out;
536d377c5ebSMiklos Szeredi 		}
537e9be9d5eSMiklos Szeredi 	}
538e9be9d5eSMiklos Szeredi 
539e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
540e9be9d5eSMiklos Szeredi 	if (err)
541e9be9d5eSMiklos Szeredi 		goto out_dput;
542e9be9d5eSMiklos Szeredi 
543e9be9d5eSMiklos Szeredi 	whiteout = ovl_whiteout(workdir, dentry);
544e9be9d5eSMiklos Szeredi 	err = PTR_ERR(whiteout);
545e9be9d5eSMiklos Szeredi 	if (IS_ERR(whiteout))
546e9be9d5eSMiklos Szeredi 		goto out_unlock;
547e9be9d5eSMiklos Szeredi 
548a105d685SMiklos Szeredi 	upper = ovl_dentry_upper(dentry);
549a105d685SMiklos Szeredi 	if (!upper) {
550e9be9d5eSMiklos Szeredi 		upper = lookup_one_len(dentry->d_name.name, upperdir,
551e9be9d5eSMiklos Szeredi 				       dentry->d_name.len);
552e9be9d5eSMiklos Szeredi 		err = PTR_ERR(upper);
553e9be9d5eSMiklos Szeredi 		if (IS_ERR(upper))
554e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
555e9be9d5eSMiklos Szeredi 
556e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, whiteout, udir, upper, 0);
557e9be9d5eSMiklos Szeredi 		dput(upper);
558e9be9d5eSMiklos Szeredi 		if (err)
559e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
560e9be9d5eSMiklos Szeredi 	} else {
561e9be9d5eSMiklos Szeredi 		int flags = 0;
562e9be9d5eSMiklos Szeredi 
563e9be9d5eSMiklos Szeredi 		if (opaquedir)
564e9be9d5eSMiklos Szeredi 			upper = opaquedir;
565e9be9d5eSMiklos Szeredi 		err = -ESTALE;
566e9be9d5eSMiklos Szeredi 		if (upper->d_parent != upperdir)
567e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
568e9be9d5eSMiklos Szeredi 
569e9be9d5eSMiklos Szeredi 		if (is_dir)
570e9be9d5eSMiklos Szeredi 			flags |= RENAME_EXCHANGE;
571e9be9d5eSMiklos Szeredi 
572e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, whiteout, udir, upper, flags);
573e9be9d5eSMiklos Szeredi 		if (err)
574e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
575e9be9d5eSMiklos Szeredi 
576e9be9d5eSMiklos Szeredi 		if (is_dir)
577e9be9d5eSMiklos Szeredi 			ovl_cleanup(wdir, upper);
578e9be9d5eSMiklos Szeredi 	}
579e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
580e9be9d5eSMiklos Szeredi out_d_drop:
581e9be9d5eSMiklos Szeredi 	d_drop(dentry);
582e9be9d5eSMiklos Szeredi 	dput(whiteout);
583e9be9d5eSMiklos Szeredi out_unlock:
584e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
585e9be9d5eSMiklos Szeredi out_dput:
586e9be9d5eSMiklos Szeredi 	dput(opaquedir);
587e9be9d5eSMiklos Szeredi out:
588e9be9d5eSMiklos Szeredi 	return err;
589e9be9d5eSMiklos Szeredi 
590e9be9d5eSMiklos Szeredi kill_whiteout:
591e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, whiteout);
592e9be9d5eSMiklos Szeredi 	goto out_d_drop;
593e9be9d5eSMiklos Szeredi }
594e9be9d5eSMiklos Szeredi 
595e9be9d5eSMiklos Szeredi static int ovl_remove_upper(struct dentry *dentry, bool is_dir)
596e9be9d5eSMiklos Szeredi {
597e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
598e9be9d5eSMiklos Szeredi 	struct inode *dir = upperdir->d_inode;
599e9be9d5eSMiklos Szeredi 	struct dentry *upper = ovl_dentry_upper(dentry);
600e9be9d5eSMiklos Szeredi 	int err;
601e9be9d5eSMiklos Szeredi 
6025955102cSAl Viro 	inode_lock_nested(dir, I_MUTEX_PARENT);
603e9be9d5eSMiklos Szeredi 	err = -ESTALE;
604e9be9d5eSMiklos Szeredi 	if (upper->d_parent == upperdir) {
605e9be9d5eSMiklos Szeredi 		/* Don't let d_delete() think it can reset d_inode */
606e9be9d5eSMiklos Szeredi 		dget(upper);
607e9be9d5eSMiklos Szeredi 		if (is_dir)
608e9be9d5eSMiklos Szeredi 			err = vfs_rmdir(dir, upper);
609e9be9d5eSMiklos Szeredi 		else
610e9be9d5eSMiklos Szeredi 			err = vfs_unlink(dir, upper, NULL);
611e9be9d5eSMiklos Szeredi 		dput(upper);
612e9be9d5eSMiklos Szeredi 		ovl_dentry_version_inc(dentry->d_parent);
613e9be9d5eSMiklos Szeredi 	}
614e9be9d5eSMiklos Szeredi 
615e9be9d5eSMiklos Szeredi 	/*
616e9be9d5eSMiklos Szeredi 	 * Keeping this dentry hashed would mean having to release
617e9be9d5eSMiklos Szeredi 	 * upperpath/lowerpath, which could only be done if we are the
618e9be9d5eSMiklos Szeredi 	 * sole user of this dentry.  Too tricky...  Just unhash for
619e9be9d5eSMiklos Szeredi 	 * now.
620e9be9d5eSMiklos Szeredi 	 */
621e9be9d5eSMiklos Szeredi 	d_drop(dentry);
6225955102cSAl Viro 	inode_unlock(dir);
623e9be9d5eSMiklos Szeredi 
624e9be9d5eSMiklos Szeredi 	return err;
625e9be9d5eSMiklos Szeredi }
626e9be9d5eSMiklos Szeredi 
627e9be9d5eSMiklos Szeredi static inline int ovl_check_sticky(struct dentry *dentry)
628e9be9d5eSMiklos Szeredi {
629e9be9d5eSMiklos Szeredi 	struct inode *dir = ovl_dentry_real(dentry->d_parent)->d_inode;
630e9be9d5eSMiklos Szeredi 	struct inode *inode = ovl_dentry_real(dentry)->d_inode;
631e9be9d5eSMiklos Szeredi 
632e9be9d5eSMiklos Szeredi 	if (check_sticky(dir, inode))
633e9be9d5eSMiklos Szeredi 		return -EPERM;
634e9be9d5eSMiklos Szeredi 
635e9be9d5eSMiklos Szeredi 	return 0;
636e9be9d5eSMiklos Szeredi }
637e9be9d5eSMiklos Szeredi 
638e9be9d5eSMiklos Szeredi static int ovl_do_remove(struct dentry *dentry, bool is_dir)
639e9be9d5eSMiklos Szeredi {
640e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
641e9be9d5eSMiklos Szeredi 	int err;
642e9be9d5eSMiklos Szeredi 
643e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(dentry);
644e9be9d5eSMiklos Szeredi 	if (err)
645e9be9d5eSMiklos Szeredi 		goto out;
646e9be9d5eSMiklos Szeredi 
647e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
648e9be9d5eSMiklos Szeredi 	if (err)
649e9be9d5eSMiklos Szeredi 		goto out;
650e9be9d5eSMiklos Szeredi 
651e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
652e9be9d5eSMiklos Szeredi 	if (err)
653e9be9d5eSMiklos Szeredi 		goto out_drop_write;
654e9be9d5eSMiklos Szeredi 
655e9be9d5eSMiklos Szeredi 	type = ovl_path_type(dentry);
6561afaba1eSMiklos Szeredi 	if (OVL_TYPE_PURE_UPPER(type)) {
657e9be9d5eSMiklos Szeredi 		err = ovl_remove_upper(dentry, is_dir);
658e9be9d5eSMiklos Szeredi 	} else {
659e9be9d5eSMiklos Szeredi 		const struct cred *old_cred;
660e9be9d5eSMiklos Szeredi 		struct cred *override_cred;
661e9be9d5eSMiklos Szeredi 
662e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
663e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
664e9be9d5eSMiklos Szeredi 		if (!override_cred)
665e9be9d5eSMiklos Szeredi 			goto out_drop_write;
666e9be9d5eSMiklos Szeredi 
667e9be9d5eSMiklos Szeredi 		/*
668e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting xattr on whiteout, opaque dir
669e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir, rename
670e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
671e9be9d5eSMiklos Szeredi 		 * CAP_FSETID for chmod of opaque dir
672e9be9d5eSMiklos Szeredi 		 * CAP_CHOWN for chown of opaque dir
673e9be9d5eSMiklos Szeredi 		 */
674e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
675e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
676e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
677e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FSETID);
678e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_CHOWN);
679e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
680e9be9d5eSMiklos Szeredi 
681a105d685SMiklos Szeredi 		err = ovl_remove_and_whiteout(dentry, is_dir);
682e9be9d5eSMiklos Szeredi 
683e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
684e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
685e9be9d5eSMiklos Szeredi 	}
686e9be9d5eSMiklos Szeredi out_drop_write:
687e9be9d5eSMiklos Szeredi 	ovl_drop_write(dentry);
688e9be9d5eSMiklos Szeredi out:
689e9be9d5eSMiklos Szeredi 	return err;
690e9be9d5eSMiklos Szeredi }
691e9be9d5eSMiklos Szeredi 
692e9be9d5eSMiklos Szeredi static int ovl_unlink(struct inode *dir, struct dentry *dentry)
693e9be9d5eSMiklos Szeredi {
694e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, false);
695e9be9d5eSMiklos Szeredi }
696e9be9d5eSMiklos Szeredi 
697e9be9d5eSMiklos Szeredi static int ovl_rmdir(struct inode *dir, struct dentry *dentry)
698e9be9d5eSMiklos Szeredi {
699e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, true);
700e9be9d5eSMiklos Szeredi }
701e9be9d5eSMiklos Szeredi 
702e9be9d5eSMiklos Szeredi static int ovl_rename2(struct inode *olddir, struct dentry *old,
703e9be9d5eSMiklos Szeredi 		       struct inode *newdir, struct dentry *new,
704e9be9d5eSMiklos Szeredi 		       unsigned int flags)
705e9be9d5eSMiklos Szeredi {
706e9be9d5eSMiklos Szeredi 	int err;
707e9be9d5eSMiklos Szeredi 	enum ovl_path_type old_type;
708e9be9d5eSMiklos Szeredi 	enum ovl_path_type new_type;
709e9be9d5eSMiklos Szeredi 	struct dentry *old_upperdir;
710e9be9d5eSMiklos Szeredi 	struct dentry *new_upperdir;
711e9be9d5eSMiklos Szeredi 	struct dentry *olddentry;
712e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
713e9be9d5eSMiklos Szeredi 	struct dentry *trap;
714e9be9d5eSMiklos Szeredi 	bool old_opaque;
715e9be9d5eSMiklos Szeredi 	bool new_opaque;
716e9be9d5eSMiklos Szeredi 	bool new_create = false;
717e9be9d5eSMiklos Szeredi 	bool cleanup_whiteout = false;
718e9be9d5eSMiklos Szeredi 	bool overwrite = !(flags & RENAME_EXCHANGE);
719e36cb0b8SDavid Howells 	bool is_dir = d_is_dir(old);
720e9be9d5eSMiklos Szeredi 	bool new_is_dir = false;
721e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
722e9be9d5eSMiklos Szeredi 	const struct cred *old_cred = NULL;
723e9be9d5eSMiklos Szeredi 	struct cred *override_cred = NULL;
724e9be9d5eSMiklos Szeredi 
725e9be9d5eSMiklos Szeredi 	err = -EINVAL;
726e9be9d5eSMiklos Szeredi 	if (flags & ~(RENAME_EXCHANGE | RENAME_NOREPLACE))
727e9be9d5eSMiklos Szeredi 		goto out;
728e9be9d5eSMiklos Szeredi 
729e9be9d5eSMiklos Szeredi 	flags &= ~RENAME_NOREPLACE;
730e9be9d5eSMiklos Szeredi 
731e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(old);
732e9be9d5eSMiklos Szeredi 	if (err)
733e9be9d5eSMiklos Szeredi 		goto out;
734e9be9d5eSMiklos Szeredi 
735e9be9d5eSMiklos Szeredi 	/* Don't copy up directory trees */
736e9be9d5eSMiklos Szeredi 	old_type = ovl_path_type(old);
737e9be9d5eSMiklos Szeredi 	err = -EXDEV;
7381afaba1eSMiklos Szeredi 	if (OVL_TYPE_MERGE_OR_LOWER(old_type) && is_dir)
739e9be9d5eSMiklos Szeredi 		goto out;
740e9be9d5eSMiklos Szeredi 
741e9be9d5eSMiklos Szeredi 	if (new->d_inode) {
742e9be9d5eSMiklos Szeredi 		err = ovl_check_sticky(new);
743e9be9d5eSMiklos Szeredi 		if (err)
744e9be9d5eSMiklos Szeredi 			goto out;
745e9be9d5eSMiklos Szeredi 
746e36cb0b8SDavid Howells 		if (d_is_dir(new))
747e9be9d5eSMiklos Szeredi 			new_is_dir = true;
748e9be9d5eSMiklos Szeredi 
749e9be9d5eSMiklos Szeredi 		new_type = ovl_path_type(new);
750e9be9d5eSMiklos Szeredi 		err = -EXDEV;
7511afaba1eSMiklos Szeredi 		if (!overwrite && OVL_TYPE_MERGE_OR_LOWER(new_type) && new_is_dir)
752e9be9d5eSMiklos Szeredi 			goto out;
753e9be9d5eSMiklos Szeredi 
754e9be9d5eSMiklos Szeredi 		err = 0;
7551afaba1eSMiklos Szeredi 		if (!OVL_TYPE_UPPER(new_type) && !OVL_TYPE_UPPER(old_type)) {
756e9be9d5eSMiklos Szeredi 			if (ovl_dentry_lower(old)->d_inode ==
757e9be9d5eSMiklos Szeredi 			    ovl_dentry_lower(new)->d_inode)
758e9be9d5eSMiklos Szeredi 				goto out;
759e9be9d5eSMiklos Szeredi 		}
7601afaba1eSMiklos Szeredi 		if (OVL_TYPE_UPPER(new_type) && OVL_TYPE_UPPER(old_type)) {
761e9be9d5eSMiklos Szeredi 			if (ovl_dentry_upper(old)->d_inode ==
762e9be9d5eSMiklos Szeredi 			    ovl_dentry_upper(new)->d_inode)
763e9be9d5eSMiklos Szeredi 				goto out;
764e9be9d5eSMiklos Szeredi 		}
765e9be9d5eSMiklos Szeredi 	} else {
766e9be9d5eSMiklos Szeredi 		if (ovl_dentry_is_opaque(new))
7671afaba1eSMiklos Szeredi 			new_type = __OVL_PATH_UPPER;
768e9be9d5eSMiklos Szeredi 		else
7691afaba1eSMiklos Szeredi 			new_type = __OVL_PATH_UPPER | __OVL_PATH_PURE;
770e9be9d5eSMiklos Szeredi 	}
771e9be9d5eSMiklos Szeredi 
772e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
773e9be9d5eSMiklos Szeredi 	if (err)
774e9be9d5eSMiklos Szeredi 		goto out;
775e9be9d5eSMiklos Szeredi 
776e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
777e9be9d5eSMiklos Szeredi 	if (err)
778e9be9d5eSMiklos Szeredi 		goto out_drop_write;
779e9be9d5eSMiklos Szeredi 
780e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(new->d_parent);
781e9be9d5eSMiklos Szeredi 	if (err)
782e9be9d5eSMiklos Szeredi 		goto out_drop_write;
783e9be9d5eSMiklos Szeredi 	if (!overwrite) {
784e9be9d5eSMiklos Szeredi 		err = ovl_copy_up(new);
785e9be9d5eSMiklos Szeredi 		if (err)
786e9be9d5eSMiklos Szeredi 			goto out_drop_write;
787e9be9d5eSMiklos Szeredi 	}
788e9be9d5eSMiklos Szeredi 
7891afaba1eSMiklos Szeredi 	old_opaque = !OVL_TYPE_PURE_UPPER(old_type);
7901afaba1eSMiklos Szeredi 	new_opaque = !OVL_TYPE_PURE_UPPER(new_type);
791e9be9d5eSMiklos Szeredi 
792e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
793e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
794e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
795e9be9d5eSMiklos Szeredi 		if (!override_cred)
796e9be9d5eSMiklos Szeredi 			goto out_drop_write;
797e9be9d5eSMiklos Szeredi 
798e9be9d5eSMiklos Szeredi 		/*
799e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting xattr on whiteout, opaque dir
800e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir
801e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
802e9be9d5eSMiklos Szeredi 		 * CAP_FSETID for chmod of opaque dir
803e9be9d5eSMiklos Szeredi 		 * CAP_CHOWN for chown of opaque dir
804e9be9d5eSMiklos Szeredi 		 */
805e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
806e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
807e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
808e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FSETID);
809e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_CHOWN);
810e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
811e9be9d5eSMiklos Szeredi 	}
812e9be9d5eSMiklos Szeredi 
8131afaba1eSMiklos Szeredi 	if (overwrite && OVL_TYPE_MERGE_OR_LOWER(new_type) && new_is_dir) {
814a105d685SMiklos Szeredi 		opaquedir = ovl_check_empty_and_clear(new);
815e9be9d5eSMiklos Szeredi 		err = PTR_ERR(opaquedir);
816e9be9d5eSMiklos Szeredi 		if (IS_ERR(opaquedir)) {
817e9be9d5eSMiklos Szeredi 			opaquedir = NULL;
818e9be9d5eSMiklos Szeredi 			goto out_revert_creds;
819e9be9d5eSMiklos Szeredi 		}
820e9be9d5eSMiklos Szeredi 	}
821e9be9d5eSMiklos Szeredi 
822e9be9d5eSMiklos Szeredi 	if (overwrite) {
823e9be9d5eSMiklos Szeredi 		if (old_opaque) {
824e9be9d5eSMiklos Szeredi 			if (new->d_inode || !new_opaque) {
825e9be9d5eSMiklos Szeredi 				/* Whiteout source */
826e9be9d5eSMiklos Szeredi 				flags |= RENAME_WHITEOUT;
827e9be9d5eSMiklos Szeredi 			} else {
828e9be9d5eSMiklos Szeredi 				/* Switch whiteouts */
829e9be9d5eSMiklos Szeredi 				flags |= RENAME_EXCHANGE;
830e9be9d5eSMiklos Szeredi 			}
831e9be9d5eSMiklos Szeredi 		} else if (is_dir && !new->d_inode && new_opaque) {
832e9be9d5eSMiklos Szeredi 			flags |= RENAME_EXCHANGE;
833e9be9d5eSMiklos Szeredi 			cleanup_whiteout = true;
834e9be9d5eSMiklos Szeredi 		}
835e9be9d5eSMiklos Szeredi 	}
836e9be9d5eSMiklos Szeredi 
837e9be9d5eSMiklos Szeredi 	old_upperdir = ovl_dentry_upper(old->d_parent);
838e9be9d5eSMiklos Szeredi 	new_upperdir = ovl_dentry_upper(new->d_parent);
839e9be9d5eSMiklos Szeredi 
840e9be9d5eSMiklos Szeredi 	trap = lock_rename(new_upperdir, old_upperdir);
841e9be9d5eSMiklos Szeredi 
842e9be9d5eSMiklos Szeredi 	olddentry = ovl_dentry_upper(old);
843e9be9d5eSMiklos Szeredi 	newdentry = ovl_dentry_upper(new);
844e9be9d5eSMiklos Szeredi 	if (newdentry) {
845e9be9d5eSMiklos Szeredi 		if (opaquedir) {
846e9be9d5eSMiklos Szeredi 			newdentry = opaquedir;
847e9be9d5eSMiklos Szeredi 			opaquedir = NULL;
848e9be9d5eSMiklos Szeredi 		} else {
849e9be9d5eSMiklos Szeredi 			dget(newdentry);
850e9be9d5eSMiklos Szeredi 		}
851e9be9d5eSMiklos Szeredi 	} else {
852e9be9d5eSMiklos Szeredi 		new_create = true;
853e9be9d5eSMiklos Szeredi 		newdentry = lookup_one_len(new->d_name.name, new_upperdir,
854e9be9d5eSMiklos Szeredi 					   new->d_name.len);
855e9be9d5eSMiklos Szeredi 		err = PTR_ERR(newdentry);
856e9be9d5eSMiklos Szeredi 		if (IS_ERR(newdentry))
857e9be9d5eSMiklos Szeredi 			goto out_unlock;
858e9be9d5eSMiklos Szeredi 	}
859e9be9d5eSMiklos Szeredi 
860e9be9d5eSMiklos Szeredi 	err = -ESTALE;
861e9be9d5eSMiklos Szeredi 	if (olddentry->d_parent != old_upperdir)
862e9be9d5eSMiklos Szeredi 		goto out_dput;
863e9be9d5eSMiklos Szeredi 	if (newdentry->d_parent != new_upperdir)
864e9be9d5eSMiklos Szeredi 		goto out_dput;
865e9be9d5eSMiklos Szeredi 	if (olddentry == trap)
866e9be9d5eSMiklos Szeredi 		goto out_dput;
867e9be9d5eSMiklos Szeredi 	if (newdentry == trap)
868e9be9d5eSMiklos Szeredi 		goto out_dput;
869e9be9d5eSMiklos Szeredi 
870e9be9d5eSMiklos Szeredi 	if (is_dir && !old_opaque && new_opaque) {
871e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(olddentry);
872e9be9d5eSMiklos Szeredi 		if (err)
873e9be9d5eSMiklos Szeredi 			goto out_dput;
874e9be9d5eSMiklos Szeredi 	}
875e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && old_opaque && !new_opaque) {
876e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
877e9be9d5eSMiklos Szeredi 		if (err)
878e9be9d5eSMiklos Szeredi 			goto out_dput;
879e9be9d5eSMiklos Szeredi 	}
880e9be9d5eSMiklos Szeredi 
881e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
882e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(old_upperdir->d_inode, olddentry,
883e9be9d5eSMiklos Szeredi 				    new_upperdir->d_inode, newdentry,
884e9be9d5eSMiklos Szeredi 				    flags);
885e9be9d5eSMiklos Szeredi 	} else {
886e9be9d5eSMiklos Szeredi 		/* No debug for the plain case */
887e9be9d5eSMiklos Szeredi 		BUG_ON(flags & ~RENAME_EXCHANGE);
888e9be9d5eSMiklos Szeredi 		err = vfs_rename(old_upperdir->d_inode, olddentry,
889e9be9d5eSMiklos Szeredi 				 new_upperdir->d_inode, newdentry,
890e9be9d5eSMiklos Szeredi 				 NULL, flags);
891e9be9d5eSMiklos Szeredi 	}
892e9be9d5eSMiklos Szeredi 
893e9be9d5eSMiklos Szeredi 	if (err) {
894e9be9d5eSMiklos Szeredi 		if (is_dir && !old_opaque && new_opaque)
895e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(olddentry);
896e9be9d5eSMiklos Szeredi 		if (!overwrite && new_is_dir && old_opaque && !new_opaque)
897e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(newdentry);
898e9be9d5eSMiklos Szeredi 		goto out_dput;
899e9be9d5eSMiklos Szeredi 	}
900e9be9d5eSMiklos Szeredi 
901e9be9d5eSMiklos Szeredi 	if (is_dir && old_opaque && !new_opaque)
902e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(olddentry);
903e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && !old_opaque && new_opaque)
904e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(newdentry);
905e9be9d5eSMiklos Szeredi 
906e9be9d5eSMiklos Szeredi 	if (old_opaque != new_opaque) {
907e9be9d5eSMiklos Szeredi 		ovl_dentry_set_opaque(old, new_opaque);
908e9be9d5eSMiklos Szeredi 		if (!overwrite)
909e9be9d5eSMiklos Szeredi 			ovl_dentry_set_opaque(new, old_opaque);
910e9be9d5eSMiklos Szeredi 	}
911e9be9d5eSMiklos Szeredi 
912e9be9d5eSMiklos Szeredi 	if (cleanup_whiteout)
913e9be9d5eSMiklos Szeredi 		ovl_cleanup(old_upperdir->d_inode, newdentry);
914e9be9d5eSMiklos Szeredi 
915e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(old->d_parent);
916e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(new->d_parent);
917e9be9d5eSMiklos Szeredi 
918e9be9d5eSMiklos Szeredi out_dput:
919e9be9d5eSMiklos Szeredi 	dput(newdentry);
920e9be9d5eSMiklos Szeredi out_unlock:
921e9be9d5eSMiklos Szeredi 	unlock_rename(new_upperdir, old_upperdir);
922e9be9d5eSMiklos Szeredi out_revert_creds:
923e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
924e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
925e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
926e9be9d5eSMiklos Szeredi 	}
927e9be9d5eSMiklos Szeredi out_drop_write:
928e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
929e9be9d5eSMiklos Szeredi out:
930e9be9d5eSMiklos Szeredi 	dput(opaquedir);
931e9be9d5eSMiklos Szeredi 	return err;
932e9be9d5eSMiklos Szeredi }
933e9be9d5eSMiklos Szeredi 
934e9be9d5eSMiklos Szeredi const struct inode_operations ovl_dir_inode_operations = {
935e9be9d5eSMiklos Szeredi 	.lookup		= ovl_lookup,
936e9be9d5eSMiklos Szeredi 	.mkdir		= ovl_mkdir,
937e9be9d5eSMiklos Szeredi 	.symlink	= ovl_symlink,
938e9be9d5eSMiklos Szeredi 	.unlink		= ovl_unlink,
939e9be9d5eSMiklos Szeredi 	.rmdir		= ovl_rmdir,
940e9be9d5eSMiklos Szeredi 	.rename2	= ovl_rename2,
941e9be9d5eSMiklos Szeredi 	.link		= ovl_link,
942e9be9d5eSMiklos Szeredi 	.setattr	= ovl_setattr,
943e9be9d5eSMiklos Szeredi 	.create		= ovl_create,
944e9be9d5eSMiklos Szeredi 	.mknod		= ovl_mknod,
945e9be9d5eSMiklos Szeredi 	.permission	= ovl_permission,
946e9be9d5eSMiklos Szeredi 	.getattr	= ovl_dir_getattr,
947e9be9d5eSMiklos Szeredi 	.setxattr	= ovl_setxattr,
948e9be9d5eSMiklos Szeredi 	.getxattr	= ovl_getxattr,
949e9be9d5eSMiklos Szeredi 	.listxattr	= ovl_listxattr,
950e9be9d5eSMiklos Szeredi 	.removexattr	= ovl_removexattr,
951e9be9d5eSMiklos Szeredi };
952