xref: /openbmc/linux/fs/overlayfs/dir.c (revision 11f37104)
1e9be9d5eSMiklos Szeredi /*
2e9be9d5eSMiklos Szeredi  *
3e9be9d5eSMiklos Szeredi  * Copyright (C) 2011 Novell Inc.
4e9be9d5eSMiklos Szeredi  *
5e9be9d5eSMiklos Szeredi  * This program is free software; you can redistribute it and/or modify it
6e9be9d5eSMiklos Szeredi  * under the terms of the GNU General Public License version 2 as published by
7e9be9d5eSMiklos Szeredi  * the Free Software Foundation.
8e9be9d5eSMiklos Szeredi  */
9e9be9d5eSMiklos Szeredi 
10e9be9d5eSMiklos Szeredi #include <linux/fs.h>
11e9be9d5eSMiklos Szeredi #include <linux/namei.h>
12e9be9d5eSMiklos Szeredi #include <linux/xattr.h>
13e9be9d5eSMiklos Szeredi #include <linux/security.h>
14e9be9d5eSMiklos Szeredi #include <linux/cred.h>
15e9be9d5eSMiklos Szeredi #include "overlayfs.h"
16e9be9d5eSMiklos Szeredi 
17e9be9d5eSMiklos Szeredi void ovl_cleanup(struct inode *wdir, struct dentry *wdentry)
18e9be9d5eSMiklos Szeredi {
19e9be9d5eSMiklos Szeredi 	int err;
20e9be9d5eSMiklos Szeredi 
21e9be9d5eSMiklos Szeredi 	dget(wdentry);
22e36cb0b8SDavid Howells 	if (d_is_dir(wdentry))
23e9be9d5eSMiklos Szeredi 		err = ovl_do_rmdir(wdir, wdentry);
24e9be9d5eSMiklos Szeredi 	else
25e9be9d5eSMiklos Szeredi 		err = ovl_do_unlink(wdir, wdentry);
26e9be9d5eSMiklos Szeredi 	dput(wdentry);
27e9be9d5eSMiklos Szeredi 
28e9be9d5eSMiklos Szeredi 	if (err) {
29e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: cleanup of '%pd2' failed (%i)\n",
30e9be9d5eSMiklos Szeredi 		       wdentry, err);
31e9be9d5eSMiklos Szeredi 	}
32e9be9d5eSMiklos Szeredi }
33e9be9d5eSMiklos Szeredi 
34e9be9d5eSMiklos Szeredi struct dentry *ovl_lookup_temp(struct dentry *workdir, struct dentry *dentry)
35e9be9d5eSMiklos Szeredi {
36e9be9d5eSMiklos Szeredi 	struct dentry *temp;
37e9be9d5eSMiklos Szeredi 	char name[20];
38e9be9d5eSMiklos Szeredi 
39e9be9d5eSMiklos Szeredi 	snprintf(name, sizeof(name), "#%lx", (unsigned long) dentry);
40e9be9d5eSMiklos Szeredi 
41e9be9d5eSMiklos Szeredi 	temp = lookup_one_len(name, workdir, strlen(name));
42e9be9d5eSMiklos Szeredi 	if (!IS_ERR(temp) && temp->d_inode) {
43e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: workdir/%s already exists\n", name);
44e9be9d5eSMiklos Szeredi 		dput(temp);
45e9be9d5eSMiklos Szeredi 		temp = ERR_PTR(-EIO);
46e9be9d5eSMiklos Szeredi 	}
47e9be9d5eSMiklos Szeredi 
48e9be9d5eSMiklos Szeredi 	return temp;
49e9be9d5eSMiklos Szeredi }
50e9be9d5eSMiklos Szeredi 
51e9be9d5eSMiklos Szeredi /* caller holds i_mutex on workdir */
52e9be9d5eSMiklos Szeredi static struct dentry *ovl_whiteout(struct dentry *workdir,
53e9be9d5eSMiklos Szeredi 				   struct dentry *dentry)
54e9be9d5eSMiklos Szeredi {
55e9be9d5eSMiklos Szeredi 	int err;
56e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
57e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
58e9be9d5eSMiklos Szeredi 
59e9be9d5eSMiklos Szeredi 	whiteout = ovl_lookup_temp(workdir, dentry);
60e9be9d5eSMiklos Szeredi 	if (IS_ERR(whiteout))
61e9be9d5eSMiklos Szeredi 		return whiteout;
62e9be9d5eSMiklos Szeredi 
63e9be9d5eSMiklos Szeredi 	err = ovl_do_whiteout(wdir, whiteout);
64e9be9d5eSMiklos Szeredi 	if (err) {
65e9be9d5eSMiklos Szeredi 		dput(whiteout);
66e9be9d5eSMiklos Szeredi 		whiteout = ERR_PTR(err);
67e9be9d5eSMiklos Szeredi 	}
68e9be9d5eSMiklos Szeredi 
69e9be9d5eSMiklos Szeredi 	return whiteout;
70e9be9d5eSMiklos Szeredi }
71e9be9d5eSMiklos Szeredi 
72e9be9d5eSMiklos Szeredi int ovl_create_real(struct inode *dir, struct dentry *newdentry,
73e9be9d5eSMiklos Szeredi 		    struct kstat *stat, const char *link,
74e9be9d5eSMiklos Szeredi 		    struct dentry *hardlink, bool debug)
75e9be9d5eSMiklos Szeredi {
76e9be9d5eSMiklos Szeredi 	int err;
77e9be9d5eSMiklos Szeredi 
78e9be9d5eSMiklos Szeredi 	if (newdentry->d_inode)
79e9be9d5eSMiklos Szeredi 		return -ESTALE;
80e9be9d5eSMiklos Szeredi 
81e9be9d5eSMiklos Szeredi 	if (hardlink) {
82e9be9d5eSMiklos Szeredi 		err = ovl_do_link(hardlink, dir, newdentry, debug);
83e9be9d5eSMiklos Szeredi 	} else {
84e9be9d5eSMiklos Szeredi 		switch (stat->mode & S_IFMT) {
85e9be9d5eSMiklos Szeredi 		case S_IFREG:
86e9be9d5eSMiklos Szeredi 			err = ovl_do_create(dir, newdentry, stat->mode, debug);
87e9be9d5eSMiklos Szeredi 			break;
88e9be9d5eSMiklos Szeredi 
89e9be9d5eSMiklos Szeredi 		case S_IFDIR:
90e9be9d5eSMiklos Szeredi 			err = ovl_do_mkdir(dir, newdentry, stat->mode, debug);
91e9be9d5eSMiklos Szeredi 			break;
92e9be9d5eSMiklos Szeredi 
93e9be9d5eSMiklos Szeredi 		case S_IFCHR:
94e9be9d5eSMiklos Szeredi 		case S_IFBLK:
95e9be9d5eSMiklos Szeredi 		case S_IFIFO:
96e9be9d5eSMiklos Szeredi 		case S_IFSOCK:
97e9be9d5eSMiklos Szeredi 			err = ovl_do_mknod(dir, newdentry,
98e9be9d5eSMiklos Szeredi 					   stat->mode, stat->rdev, debug);
99e9be9d5eSMiklos Szeredi 			break;
100e9be9d5eSMiklos Szeredi 
101e9be9d5eSMiklos Szeredi 		case S_IFLNK:
102e9be9d5eSMiklos Szeredi 			err = ovl_do_symlink(dir, newdentry, link, debug);
103e9be9d5eSMiklos Szeredi 			break;
104e9be9d5eSMiklos Szeredi 
105e9be9d5eSMiklos Szeredi 		default:
106e9be9d5eSMiklos Szeredi 			err = -EPERM;
107e9be9d5eSMiklos Szeredi 		}
108e9be9d5eSMiklos Szeredi 	}
109e9be9d5eSMiklos Szeredi 	if (!err && WARN_ON(!newdentry->d_inode)) {
110e9be9d5eSMiklos Szeredi 		/*
111e9be9d5eSMiklos Szeredi 		 * Not quite sure if non-instantiated dentry is legal or not.
112e9be9d5eSMiklos Szeredi 		 * VFS doesn't seem to care so check and warn here.
113e9be9d5eSMiklos Szeredi 		 */
114e9be9d5eSMiklos Szeredi 		err = -ENOENT;
115e9be9d5eSMiklos Szeredi 	}
116e9be9d5eSMiklos Szeredi 	return err;
117e9be9d5eSMiklos Szeredi }
118e9be9d5eSMiklos Szeredi 
119e9be9d5eSMiklos Szeredi static int ovl_set_opaque(struct dentry *upperdentry)
120e9be9d5eSMiklos Szeredi {
121cead89bbShujianyang 	return ovl_do_setxattr(upperdentry, OVL_XATTR_OPAQUE, "y", 1, 0);
122e9be9d5eSMiklos Szeredi }
123e9be9d5eSMiklos Szeredi 
124e9be9d5eSMiklos Szeredi static void ovl_remove_opaque(struct dentry *upperdentry)
125e9be9d5eSMiklos Szeredi {
126e9be9d5eSMiklos Szeredi 	int err;
127e9be9d5eSMiklos Szeredi 
128cead89bbShujianyang 	err = ovl_do_removexattr(upperdentry, OVL_XATTR_OPAQUE);
129e9be9d5eSMiklos Szeredi 	if (err) {
130e9be9d5eSMiklos Szeredi 		pr_warn("overlayfs: failed to remove opaque from '%s' (%i)\n",
131e9be9d5eSMiklos Szeredi 			upperdentry->d_name.name, err);
132e9be9d5eSMiklos Szeredi 	}
133e9be9d5eSMiklos Szeredi }
134e9be9d5eSMiklos Szeredi 
135e9be9d5eSMiklos Szeredi static int ovl_dir_getattr(struct vfsmount *mnt, struct dentry *dentry,
136e9be9d5eSMiklos Szeredi 			 struct kstat *stat)
137e9be9d5eSMiklos Szeredi {
138e9be9d5eSMiklos Szeredi 	int err;
139e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
140e9be9d5eSMiklos Szeredi 	struct path realpath;
141e9be9d5eSMiklos Szeredi 
142e9be9d5eSMiklos Szeredi 	type = ovl_path_real(dentry, &realpath);
143e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&realpath, stat);
144e9be9d5eSMiklos Szeredi 	if (err)
145e9be9d5eSMiklos Szeredi 		return err;
146e9be9d5eSMiklos Szeredi 
147e9be9d5eSMiklos Szeredi 	stat->dev = dentry->d_sb->s_dev;
148e9be9d5eSMiklos Szeredi 	stat->ino = dentry->d_inode->i_ino;
149e9be9d5eSMiklos Szeredi 
150e9be9d5eSMiklos Szeredi 	/*
151e9be9d5eSMiklos Szeredi 	 * It's probably not worth it to count subdirs to get the
152e9be9d5eSMiklos Szeredi 	 * correct link count.  nlink=1 seems to pacify 'find' and
153e9be9d5eSMiklos Szeredi 	 * other utilities.
154e9be9d5eSMiklos Szeredi 	 */
1551afaba1eSMiklos Szeredi 	if (OVL_TYPE_MERGE(type))
156e9be9d5eSMiklos Szeredi 		stat->nlink = 1;
157e9be9d5eSMiklos Szeredi 
158e9be9d5eSMiklos Szeredi 	return 0;
159e9be9d5eSMiklos Szeredi }
160e9be9d5eSMiklos Szeredi 
161e9be9d5eSMiklos Szeredi static int ovl_create_upper(struct dentry *dentry, struct inode *inode,
162e9be9d5eSMiklos Szeredi 			    struct kstat *stat, const char *link,
163e9be9d5eSMiklos Szeredi 			    struct dentry *hardlink)
164e9be9d5eSMiklos Szeredi {
165e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
166e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
167e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
168e9be9d5eSMiklos Szeredi 	int err;
169e9be9d5eSMiklos Szeredi 
1705955102cSAl Viro 	inode_lock_nested(udir, I_MUTEX_PARENT);
171e9be9d5eSMiklos Szeredi 	newdentry = lookup_one_len(dentry->d_name.name, upperdir,
172e9be9d5eSMiklos Szeredi 				   dentry->d_name.len);
173e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
174e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
175e9be9d5eSMiklos Szeredi 		goto out_unlock;
176e9be9d5eSMiklos Szeredi 	err = ovl_create_real(udir, newdentry, stat, link, hardlink, false);
177e9be9d5eSMiklos Szeredi 	if (err)
178e9be9d5eSMiklos Szeredi 		goto out_dput;
179e9be9d5eSMiklos Szeredi 
180e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
181e9be9d5eSMiklos Szeredi 	ovl_dentry_update(dentry, newdentry);
182e9be9d5eSMiklos Szeredi 	ovl_copyattr(newdentry->d_inode, inode);
183e9be9d5eSMiklos Szeredi 	d_instantiate(dentry, inode);
184e9be9d5eSMiklos Szeredi 	newdentry = NULL;
185e9be9d5eSMiklos Szeredi out_dput:
186e9be9d5eSMiklos Szeredi 	dput(newdentry);
187e9be9d5eSMiklos Szeredi out_unlock:
1885955102cSAl Viro 	inode_unlock(udir);
189e9be9d5eSMiklos Szeredi 	return err;
190e9be9d5eSMiklos Szeredi }
191e9be9d5eSMiklos Szeredi 
192e9be9d5eSMiklos Szeredi static int ovl_lock_rename_workdir(struct dentry *workdir,
193e9be9d5eSMiklos Szeredi 				   struct dentry *upperdir)
194e9be9d5eSMiklos Szeredi {
195e9be9d5eSMiklos Szeredi 	/* Workdir should not be the same as upperdir */
196e9be9d5eSMiklos Szeredi 	if (workdir == upperdir)
197e9be9d5eSMiklos Szeredi 		goto err;
198e9be9d5eSMiklos Szeredi 
199e9be9d5eSMiklos Szeredi 	/* Workdir should not be subdir of upperdir and vice versa */
200e9be9d5eSMiklos Szeredi 	if (lock_rename(workdir, upperdir) != NULL)
201e9be9d5eSMiklos Szeredi 		goto err_unlock;
202e9be9d5eSMiklos Szeredi 
203e9be9d5eSMiklos Szeredi 	return 0;
204e9be9d5eSMiklos Szeredi 
205e9be9d5eSMiklos Szeredi err_unlock:
206e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
207e9be9d5eSMiklos Szeredi err:
208e9be9d5eSMiklos Szeredi 	pr_err("overlayfs: failed to lock workdir+upperdir\n");
209e9be9d5eSMiklos Szeredi 	return -EIO;
210e9be9d5eSMiklos Szeredi }
211e9be9d5eSMiklos Szeredi 
212e9be9d5eSMiklos Szeredi static struct dentry *ovl_clear_empty(struct dentry *dentry,
213e9be9d5eSMiklos Szeredi 				      struct list_head *list)
214e9be9d5eSMiklos Szeredi {
215e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
216e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
217e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
218e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
219e9be9d5eSMiklos Szeredi 	struct path upperpath;
220e9be9d5eSMiklos Szeredi 	struct dentry *upper;
221e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir;
222e9be9d5eSMiklos Szeredi 	struct kstat stat;
223e9be9d5eSMiklos Szeredi 	int err;
224e9be9d5eSMiklos Szeredi 
225cc6f67bcSMiklos Szeredi 	if (WARN_ON(!workdir))
226cc6f67bcSMiklos Szeredi 		return ERR_PTR(-EROFS);
227cc6f67bcSMiklos Szeredi 
228e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
229e9be9d5eSMiklos Szeredi 	if (err)
230e9be9d5eSMiklos Szeredi 		goto out;
231e9be9d5eSMiklos Szeredi 
232e9be9d5eSMiklos Szeredi 	ovl_path_upper(dentry, &upperpath);
233e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&upperpath, &stat);
234e9be9d5eSMiklos Szeredi 	if (err)
235e9be9d5eSMiklos Szeredi 		goto out_unlock;
236e9be9d5eSMiklos Szeredi 
237e9be9d5eSMiklos Szeredi 	err = -ESTALE;
238e9be9d5eSMiklos Szeredi 	if (!S_ISDIR(stat.mode))
239e9be9d5eSMiklos Szeredi 		goto out_unlock;
240e9be9d5eSMiklos Szeredi 	upper = upperpath.dentry;
241e9be9d5eSMiklos Szeredi 	if (upper->d_parent->d_inode != udir)
242e9be9d5eSMiklos Szeredi 		goto out_unlock;
243e9be9d5eSMiklos Szeredi 
244e9be9d5eSMiklos Szeredi 	opaquedir = ovl_lookup_temp(workdir, dentry);
245e9be9d5eSMiklos Szeredi 	err = PTR_ERR(opaquedir);
246e9be9d5eSMiklos Szeredi 	if (IS_ERR(opaquedir))
247e9be9d5eSMiklos Szeredi 		goto out_unlock;
248e9be9d5eSMiklos Szeredi 
249e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, opaquedir, &stat, NULL, NULL, true);
250e9be9d5eSMiklos Szeredi 	if (err)
251e9be9d5eSMiklos Szeredi 		goto out_dput;
252e9be9d5eSMiklos Szeredi 
253e9be9d5eSMiklos Szeredi 	err = ovl_copy_xattr(upper, opaquedir);
254e9be9d5eSMiklos Szeredi 	if (err)
255e9be9d5eSMiklos Szeredi 		goto out_cleanup;
256e9be9d5eSMiklos Szeredi 
257e9be9d5eSMiklos Szeredi 	err = ovl_set_opaque(opaquedir);
258e9be9d5eSMiklos Szeredi 	if (err)
259e9be9d5eSMiklos Szeredi 		goto out_cleanup;
260e9be9d5eSMiklos Szeredi 
2615955102cSAl Viro 	inode_lock(opaquedir->d_inode);
262e9be9d5eSMiklos Szeredi 	err = ovl_set_attr(opaquedir, &stat);
2635955102cSAl Viro 	inode_unlock(opaquedir->d_inode);
264e9be9d5eSMiklos Szeredi 	if (err)
265e9be9d5eSMiklos Szeredi 		goto out_cleanup;
266e9be9d5eSMiklos Szeredi 
267e9be9d5eSMiklos Szeredi 	err = ovl_do_rename(wdir, opaquedir, udir, upper, RENAME_EXCHANGE);
268e9be9d5eSMiklos Szeredi 	if (err)
269e9be9d5eSMiklos Szeredi 		goto out_cleanup;
270e9be9d5eSMiklos Szeredi 
271e9be9d5eSMiklos Szeredi 	ovl_cleanup_whiteouts(upper, list);
272e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, upper);
273e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
274e9be9d5eSMiklos Szeredi 
275e9be9d5eSMiklos Szeredi 	/* dentry's upper doesn't match now, get rid of it */
276e9be9d5eSMiklos Szeredi 	d_drop(dentry);
277e9be9d5eSMiklos Szeredi 
278e9be9d5eSMiklos Szeredi 	return opaquedir;
279e9be9d5eSMiklos Szeredi 
280e9be9d5eSMiklos Szeredi out_cleanup:
281e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, opaquedir);
282e9be9d5eSMiklos Szeredi out_dput:
283e9be9d5eSMiklos Szeredi 	dput(opaquedir);
284e9be9d5eSMiklos Szeredi out_unlock:
285e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
286e9be9d5eSMiklos Szeredi out:
287e9be9d5eSMiklos Szeredi 	return ERR_PTR(err);
288e9be9d5eSMiklos Szeredi }
289e9be9d5eSMiklos Szeredi 
290a105d685SMiklos Szeredi static struct dentry *ovl_check_empty_and_clear(struct dentry *dentry)
291e9be9d5eSMiklos Szeredi {
292e9be9d5eSMiklos Szeredi 	int err;
293e9be9d5eSMiklos Szeredi 	struct dentry *ret = NULL;
294e9be9d5eSMiklos Szeredi 	LIST_HEAD(list);
295e9be9d5eSMiklos Szeredi 
296e9be9d5eSMiklos Szeredi 	err = ovl_check_empty_dir(dentry, &list);
297e9be9d5eSMiklos Szeredi 	if (err)
298e9be9d5eSMiklos Szeredi 		ret = ERR_PTR(err);
299a105d685SMiklos Szeredi 	else {
300a105d685SMiklos Szeredi 		/*
301a105d685SMiklos Szeredi 		 * If no upperdentry then skip clearing whiteouts.
302a105d685SMiklos Szeredi 		 *
303a105d685SMiklos Szeredi 		 * Can race with copy-up, since we don't hold the upperdir
304a105d685SMiklos Szeredi 		 * mutex.  Doesn't matter, since copy-up can't create a
305a105d685SMiklos Szeredi 		 * non-empty directory from an empty one.
306a105d685SMiklos Szeredi 		 */
307a105d685SMiklos Szeredi 		if (ovl_dentry_upper(dentry))
308e9be9d5eSMiklos Szeredi 			ret = ovl_clear_empty(dentry, &list);
309a105d685SMiklos Szeredi 	}
310e9be9d5eSMiklos Szeredi 
311e9be9d5eSMiklos Szeredi 	ovl_cache_free(&list);
312e9be9d5eSMiklos Szeredi 
313e9be9d5eSMiklos Szeredi 	return ret;
314e9be9d5eSMiklos Szeredi }
315e9be9d5eSMiklos Szeredi 
316e9be9d5eSMiklos Szeredi static int ovl_create_over_whiteout(struct dentry *dentry, struct inode *inode,
317e9be9d5eSMiklos Szeredi 				    struct kstat *stat, const char *link,
318e9be9d5eSMiklos Szeredi 				    struct dentry *hardlink)
319e9be9d5eSMiklos Szeredi {
320e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
321e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
322e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
323e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
324e9be9d5eSMiklos Szeredi 	struct dentry *upper;
325e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
326e9be9d5eSMiklos Szeredi 	int err;
327e9be9d5eSMiklos Szeredi 
328cc6f67bcSMiklos Szeredi 	if (WARN_ON(!workdir))
329cc6f67bcSMiklos Szeredi 		return -EROFS;
330cc6f67bcSMiklos Szeredi 
331e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
332e9be9d5eSMiklos Szeredi 	if (err)
333e9be9d5eSMiklos Szeredi 		goto out;
334e9be9d5eSMiklos Szeredi 
335e9be9d5eSMiklos Szeredi 	newdentry = ovl_lookup_temp(workdir, dentry);
336e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
337e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
338e9be9d5eSMiklos Szeredi 		goto out_unlock;
339e9be9d5eSMiklos Szeredi 
340e9be9d5eSMiklos Szeredi 	upper = lookup_one_len(dentry->d_name.name, upperdir,
341e9be9d5eSMiklos Szeredi 			       dentry->d_name.len);
342e9be9d5eSMiklos Szeredi 	err = PTR_ERR(upper);
343e9be9d5eSMiklos Szeredi 	if (IS_ERR(upper))
344e9be9d5eSMiklos Szeredi 		goto out_dput;
345e9be9d5eSMiklos Szeredi 
346e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, newdentry, stat, link, hardlink, true);
347e9be9d5eSMiklos Szeredi 	if (err)
348e9be9d5eSMiklos Szeredi 		goto out_dput2;
349e9be9d5eSMiklos Szeredi 
350e9be9d5eSMiklos Szeredi 	if (S_ISDIR(stat->mode)) {
351e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
352e9be9d5eSMiklos Szeredi 		if (err)
353e9be9d5eSMiklos Szeredi 			goto out_cleanup;
354e9be9d5eSMiklos Szeredi 
355e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper,
356e9be9d5eSMiklos Szeredi 				    RENAME_EXCHANGE);
357e9be9d5eSMiklos Szeredi 		if (err)
358e9be9d5eSMiklos Szeredi 			goto out_cleanup;
359e9be9d5eSMiklos Szeredi 
360e9be9d5eSMiklos Szeredi 		ovl_cleanup(wdir, upper);
361e9be9d5eSMiklos Szeredi 	} else {
362e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper, 0);
363e9be9d5eSMiklos Szeredi 		if (err)
364e9be9d5eSMiklos Szeredi 			goto out_cleanup;
365e9be9d5eSMiklos Szeredi 	}
366e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
367e9be9d5eSMiklos Szeredi 	ovl_dentry_update(dentry, newdentry);
368e9be9d5eSMiklos Szeredi 	ovl_copyattr(newdentry->d_inode, inode);
369e9be9d5eSMiklos Szeredi 	d_instantiate(dentry, inode);
370e9be9d5eSMiklos Szeredi 	newdentry = NULL;
371e9be9d5eSMiklos Szeredi out_dput2:
372e9be9d5eSMiklos Szeredi 	dput(upper);
373e9be9d5eSMiklos Szeredi out_dput:
374e9be9d5eSMiklos Szeredi 	dput(newdentry);
375e9be9d5eSMiklos Szeredi out_unlock:
376e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
377e9be9d5eSMiklos Szeredi out:
378e9be9d5eSMiklos Szeredi 	return err;
379e9be9d5eSMiklos Szeredi 
380e9be9d5eSMiklos Szeredi out_cleanup:
381e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, newdentry);
382e9be9d5eSMiklos Szeredi 	goto out_dput2;
383e9be9d5eSMiklos Szeredi }
384e9be9d5eSMiklos Szeredi 
385e9be9d5eSMiklos Szeredi static int ovl_create_or_link(struct dentry *dentry, int mode, dev_t rdev,
386e9be9d5eSMiklos Szeredi 			      const char *link, struct dentry *hardlink)
387e9be9d5eSMiklos Szeredi {
388e9be9d5eSMiklos Szeredi 	int err;
389e9be9d5eSMiklos Szeredi 	struct inode *inode;
390e9be9d5eSMiklos Szeredi 	struct kstat stat = {
391e9be9d5eSMiklos Szeredi 		.mode = mode,
392e9be9d5eSMiklos Szeredi 		.rdev = rdev,
393e9be9d5eSMiklos Szeredi 	};
394e9be9d5eSMiklos Szeredi 
395e9be9d5eSMiklos Szeredi 	err = -ENOMEM;
396e9be9d5eSMiklos Szeredi 	inode = ovl_new_inode(dentry->d_sb, mode, dentry->d_fsdata);
397e9be9d5eSMiklos Szeredi 	if (!inode)
398e9be9d5eSMiklos Szeredi 		goto out;
399e9be9d5eSMiklos Szeredi 
400e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
401e9be9d5eSMiklos Szeredi 	if (err)
402e9be9d5eSMiklos Szeredi 		goto out_iput;
403e9be9d5eSMiklos Szeredi 
404e9be9d5eSMiklos Szeredi 	if (!ovl_dentry_is_opaque(dentry)) {
405e9be9d5eSMiklos Szeredi 		err = ovl_create_upper(dentry, inode, &stat, link, hardlink);
406e9be9d5eSMiklos Szeredi 	} else {
407e9be9d5eSMiklos Szeredi 		const struct cred *old_cred;
408e9be9d5eSMiklos Szeredi 		struct cred *override_cred;
409e9be9d5eSMiklos Szeredi 
410e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
411e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
412e9be9d5eSMiklos Szeredi 		if (!override_cred)
413e9be9d5eSMiklos Szeredi 			goto out_iput;
414e9be9d5eSMiklos Szeredi 
415e9be9d5eSMiklos Szeredi 		/*
416e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting opaque xattr
417e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir, rename
418e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
419e9be9d5eSMiklos Szeredi 		 */
420e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
421e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
422e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
423e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
424e9be9d5eSMiklos Szeredi 
425e9be9d5eSMiklos Szeredi 		err = ovl_create_over_whiteout(dentry, inode, &stat, link,
426e9be9d5eSMiklos Szeredi 					       hardlink);
427e9be9d5eSMiklos Szeredi 
428e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
429e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
430e9be9d5eSMiklos Szeredi 	}
431e9be9d5eSMiklos Szeredi 
432e9be9d5eSMiklos Szeredi 	if (!err)
433e9be9d5eSMiklos Szeredi 		inode = NULL;
434e9be9d5eSMiklos Szeredi out_iput:
435e9be9d5eSMiklos Szeredi 	iput(inode);
436e9be9d5eSMiklos Szeredi out:
437e9be9d5eSMiklos Szeredi 	return err;
438e9be9d5eSMiklos Szeredi }
439e9be9d5eSMiklos Szeredi 
440e9be9d5eSMiklos Szeredi static int ovl_create_object(struct dentry *dentry, int mode, dev_t rdev,
441e9be9d5eSMiklos Szeredi 			     const char *link)
442e9be9d5eSMiklos Szeredi {
443e9be9d5eSMiklos Szeredi 	int err;
444e9be9d5eSMiklos Szeredi 
445e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
446e9be9d5eSMiklos Szeredi 	if (!err) {
447e9be9d5eSMiklos Szeredi 		err = ovl_create_or_link(dentry, mode, rdev, link, NULL);
448e9be9d5eSMiklos Szeredi 		ovl_drop_write(dentry);
449e9be9d5eSMiklos Szeredi 	}
450e9be9d5eSMiklos Szeredi 
451e9be9d5eSMiklos Szeredi 	return err;
452e9be9d5eSMiklos Szeredi }
453e9be9d5eSMiklos Szeredi 
454e9be9d5eSMiklos Szeredi static int ovl_create(struct inode *dir, struct dentry *dentry, umode_t mode,
455e9be9d5eSMiklos Szeredi 		      bool excl)
456e9be9d5eSMiklos Szeredi {
457e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFREG, 0, NULL);
458e9be9d5eSMiklos Szeredi }
459e9be9d5eSMiklos Szeredi 
460e9be9d5eSMiklos Szeredi static int ovl_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode)
461e9be9d5eSMiklos Szeredi {
462e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFDIR, 0, NULL);
463e9be9d5eSMiklos Szeredi }
464e9be9d5eSMiklos Szeredi 
465e9be9d5eSMiklos Szeredi static int ovl_mknod(struct inode *dir, struct dentry *dentry, umode_t mode,
466e9be9d5eSMiklos Szeredi 		     dev_t rdev)
467e9be9d5eSMiklos Szeredi {
468e9be9d5eSMiklos Szeredi 	/* Don't allow creation of "whiteout" on overlay */
469e9be9d5eSMiklos Szeredi 	if (S_ISCHR(mode) && rdev == WHITEOUT_DEV)
470e9be9d5eSMiklos Szeredi 		return -EPERM;
471e9be9d5eSMiklos Szeredi 
472e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, mode, rdev, NULL);
473e9be9d5eSMiklos Szeredi }
474e9be9d5eSMiklos Szeredi 
475e9be9d5eSMiklos Szeredi static int ovl_symlink(struct inode *dir, struct dentry *dentry,
476e9be9d5eSMiklos Szeredi 		       const char *link)
477e9be9d5eSMiklos Szeredi {
478e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, S_IFLNK, 0, link);
479e9be9d5eSMiklos Szeredi }
480e9be9d5eSMiklos Szeredi 
481e9be9d5eSMiklos Szeredi static int ovl_link(struct dentry *old, struct inode *newdir,
482e9be9d5eSMiklos Szeredi 		    struct dentry *new)
483e9be9d5eSMiklos Szeredi {
484e9be9d5eSMiklos Szeredi 	int err;
485e9be9d5eSMiklos Szeredi 	struct dentry *upper;
486e9be9d5eSMiklos Szeredi 
487e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
488e9be9d5eSMiklos Szeredi 	if (err)
489e9be9d5eSMiklos Szeredi 		goto out;
490e9be9d5eSMiklos Szeredi 
491e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
492e9be9d5eSMiklos Szeredi 	if (err)
493e9be9d5eSMiklos Szeredi 		goto out_drop_write;
494e9be9d5eSMiklos Szeredi 
495e9be9d5eSMiklos Szeredi 	upper = ovl_dentry_upper(old);
496e9be9d5eSMiklos Szeredi 	err = ovl_create_or_link(new, upper->d_inode->i_mode, 0, NULL, upper);
497e9be9d5eSMiklos Szeredi 
498e9be9d5eSMiklos Szeredi out_drop_write:
499e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
500e9be9d5eSMiklos Szeredi out:
501e9be9d5eSMiklos Szeredi 	return err;
502e9be9d5eSMiklos Szeredi }
503e9be9d5eSMiklos Szeredi 
504a105d685SMiklos Szeredi static int ovl_remove_and_whiteout(struct dentry *dentry, bool is_dir)
505e9be9d5eSMiklos Szeredi {
506e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
507e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
508e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
509e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
510e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
511e9be9d5eSMiklos Szeredi 	struct dentry *upper;
512e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
513e9be9d5eSMiklos Szeredi 	int err;
514e9be9d5eSMiklos Szeredi 
515cc6f67bcSMiklos Szeredi 	if (WARN_ON(!workdir))
516cc6f67bcSMiklos Szeredi 		return -EROFS;
517cc6f67bcSMiklos Szeredi 
518d377c5ebSMiklos Szeredi 	if (is_dir) {
519d377c5ebSMiklos Szeredi 		if (OVL_TYPE_MERGE_OR_LOWER(ovl_path_type(dentry))) {
520a105d685SMiklos Szeredi 			opaquedir = ovl_check_empty_and_clear(dentry);
521e9be9d5eSMiklos Szeredi 			err = PTR_ERR(opaquedir);
522e9be9d5eSMiklos Szeredi 			if (IS_ERR(opaquedir))
523e9be9d5eSMiklos Szeredi 				goto out;
524d377c5ebSMiklos Szeredi 		} else {
525d377c5ebSMiklos Szeredi 			LIST_HEAD(list);
526d377c5ebSMiklos Szeredi 
527d377c5ebSMiklos Szeredi 			/*
528d377c5ebSMiklos Szeredi 			 * When removing an empty opaque directory, then it
529d377c5ebSMiklos Szeredi 			 * makes no sense to replace it with an exact replica of
530d377c5ebSMiklos Szeredi 			 * itself.  But emptiness still needs to be checked.
531d377c5ebSMiklos Szeredi 			 */
532d377c5ebSMiklos Szeredi 			err = ovl_check_empty_dir(dentry, &list);
533d377c5ebSMiklos Szeredi 			ovl_cache_free(&list);
534d377c5ebSMiklos Szeredi 			if (err)
535d377c5ebSMiklos Szeredi 				goto out;
536d377c5ebSMiklos Szeredi 		}
537e9be9d5eSMiklos Szeredi 	}
538e9be9d5eSMiklos Szeredi 
539e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
540e9be9d5eSMiklos Szeredi 	if (err)
541e9be9d5eSMiklos Szeredi 		goto out_dput;
542e9be9d5eSMiklos Szeredi 
543e9be9d5eSMiklos Szeredi 	whiteout = ovl_whiteout(workdir, dentry);
544e9be9d5eSMiklos Szeredi 	err = PTR_ERR(whiteout);
545e9be9d5eSMiklos Szeredi 	if (IS_ERR(whiteout))
546e9be9d5eSMiklos Szeredi 		goto out_unlock;
547e9be9d5eSMiklos Szeredi 
548a105d685SMiklos Szeredi 	upper = ovl_dentry_upper(dentry);
549a105d685SMiklos Szeredi 	if (!upper) {
550e9be9d5eSMiklos Szeredi 		upper = lookup_one_len(dentry->d_name.name, upperdir,
551e9be9d5eSMiklos Szeredi 				       dentry->d_name.len);
552e9be9d5eSMiklos Szeredi 		err = PTR_ERR(upper);
553e9be9d5eSMiklos Szeredi 		if (IS_ERR(upper))
554e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
555e9be9d5eSMiklos Szeredi 
556e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, whiteout, udir, upper, 0);
557e9be9d5eSMiklos Szeredi 		dput(upper);
558e9be9d5eSMiklos Szeredi 		if (err)
559e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
560e9be9d5eSMiklos Szeredi 	} else {
561e9be9d5eSMiklos Szeredi 		int flags = 0;
562e9be9d5eSMiklos Szeredi 
563e9be9d5eSMiklos Szeredi 		if (opaquedir)
564e9be9d5eSMiklos Szeredi 			upper = opaquedir;
565e9be9d5eSMiklos Szeredi 		err = -ESTALE;
566e9be9d5eSMiklos Szeredi 		if (upper->d_parent != upperdir)
567e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
568e9be9d5eSMiklos Szeredi 
569e9be9d5eSMiklos Szeredi 		if (is_dir)
570e9be9d5eSMiklos Szeredi 			flags |= RENAME_EXCHANGE;
571e9be9d5eSMiklos Szeredi 
572e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, whiteout, udir, upper, flags);
573e9be9d5eSMiklos Szeredi 		if (err)
574e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
575e9be9d5eSMiklos Szeredi 
576e9be9d5eSMiklos Szeredi 		if (is_dir)
577e9be9d5eSMiklos Szeredi 			ovl_cleanup(wdir, upper);
578e9be9d5eSMiklos Szeredi 	}
579e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
580e9be9d5eSMiklos Szeredi out_d_drop:
581e9be9d5eSMiklos Szeredi 	d_drop(dentry);
582e9be9d5eSMiklos Szeredi 	dput(whiteout);
583e9be9d5eSMiklos Szeredi out_unlock:
584e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
585e9be9d5eSMiklos Szeredi out_dput:
586e9be9d5eSMiklos Szeredi 	dput(opaquedir);
587e9be9d5eSMiklos Szeredi out:
588e9be9d5eSMiklos Szeredi 	return err;
589e9be9d5eSMiklos Szeredi 
590e9be9d5eSMiklos Szeredi kill_whiteout:
591e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, whiteout);
592e9be9d5eSMiklos Szeredi 	goto out_d_drop;
593e9be9d5eSMiklos Szeredi }
594e9be9d5eSMiklos Szeredi 
595e9be9d5eSMiklos Szeredi static int ovl_remove_upper(struct dentry *dentry, bool is_dir)
596e9be9d5eSMiklos Szeredi {
597e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
598e9be9d5eSMiklos Szeredi 	struct inode *dir = upperdir->d_inode;
59911f37104SMiklos Szeredi 	struct dentry *upper;
600e9be9d5eSMiklos Szeredi 	int err;
601e9be9d5eSMiklos Szeredi 
6025955102cSAl Viro 	inode_lock_nested(dir, I_MUTEX_PARENT);
60311f37104SMiklos Szeredi 	upper = lookup_one_len(dentry->d_name.name, upperdir,
60411f37104SMiklos Szeredi 			       dentry->d_name.len);
60511f37104SMiklos Szeredi 	err = PTR_ERR(upper);
60611f37104SMiklos Szeredi 	if (IS_ERR(upper))
60711f37104SMiklos Szeredi 		goto out_unlock;
60811f37104SMiklos Szeredi 
609e9be9d5eSMiklos Szeredi 	err = -ESTALE;
61011f37104SMiklos Szeredi 	if (upper == ovl_dentry_upper(dentry)) {
611e9be9d5eSMiklos Szeredi 		if (is_dir)
612e9be9d5eSMiklos Szeredi 			err = vfs_rmdir(dir, upper);
613e9be9d5eSMiklos Szeredi 		else
614e9be9d5eSMiklos Szeredi 			err = vfs_unlink(dir, upper, NULL);
615e9be9d5eSMiklos Szeredi 		ovl_dentry_version_inc(dentry->d_parent);
616e9be9d5eSMiklos Szeredi 	}
61711f37104SMiklos Szeredi 	dput(upper);
618e9be9d5eSMiklos Szeredi 
619e9be9d5eSMiklos Szeredi 	/*
620e9be9d5eSMiklos Szeredi 	 * Keeping this dentry hashed would mean having to release
621e9be9d5eSMiklos Szeredi 	 * upperpath/lowerpath, which could only be done if we are the
622e9be9d5eSMiklos Szeredi 	 * sole user of this dentry.  Too tricky...  Just unhash for
623e9be9d5eSMiklos Szeredi 	 * now.
624e9be9d5eSMiklos Szeredi 	 */
625ce9113bbSRui Wang 	if (!err)
626e9be9d5eSMiklos Szeredi 		d_drop(dentry);
62711f37104SMiklos Szeredi out_unlock:
6285955102cSAl Viro 	inode_unlock(dir);
629e9be9d5eSMiklos Szeredi 
630e9be9d5eSMiklos Szeredi 	return err;
631e9be9d5eSMiklos Szeredi }
632e9be9d5eSMiklos Szeredi 
633e9be9d5eSMiklos Szeredi static inline int ovl_check_sticky(struct dentry *dentry)
634e9be9d5eSMiklos Szeredi {
635e9be9d5eSMiklos Szeredi 	struct inode *dir = ovl_dentry_real(dentry->d_parent)->d_inode;
636e9be9d5eSMiklos Szeredi 	struct inode *inode = ovl_dentry_real(dentry)->d_inode;
637e9be9d5eSMiklos Szeredi 
638e9be9d5eSMiklos Szeredi 	if (check_sticky(dir, inode))
639e9be9d5eSMiklos Szeredi 		return -EPERM;
640e9be9d5eSMiklos Szeredi 
641e9be9d5eSMiklos Szeredi 	return 0;
642e9be9d5eSMiklos Szeredi }
643e9be9d5eSMiklos Szeredi 
644e9be9d5eSMiklos Szeredi static int ovl_do_remove(struct dentry *dentry, bool is_dir)
645e9be9d5eSMiklos Szeredi {
646e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
647e9be9d5eSMiklos Szeredi 	int err;
648e9be9d5eSMiklos Szeredi 
649e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(dentry);
650e9be9d5eSMiklos Szeredi 	if (err)
651e9be9d5eSMiklos Szeredi 		goto out;
652e9be9d5eSMiklos Szeredi 
653e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
654e9be9d5eSMiklos Szeredi 	if (err)
655e9be9d5eSMiklos Szeredi 		goto out;
656e9be9d5eSMiklos Szeredi 
657e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
658e9be9d5eSMiklos Szeredi 	if (err)
659e9be9d5eSMiklos Szeredi 		goto out_drop_write;
660e9be9d5eSMiklos Szeredi 
661e9be9d5eSMiklos Szeredi 	type = ovl_path_type(dentry);
6621afaba1eSMiklos Szeredi 	if (OVL_TYPE_PURE_UPPER(type)) {
663e9be9d5eSMiklos Szeredi 		err = ovl_remove_upper(dentry, is_dir);
664e9be9d5eSMiklos Szeredi 	} else {
665e9be9d5eSMiklos Szeredi 		const struct cred *old_cred;
666e9be9d5eSMiklos Szeredi 		struct cred *override_cred;
667e9be9d5eSMiklos Szeredi 
668e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
669e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
670e9be9d5eSMiklos Szeredi 		if (!override_cred)
671e9be9d5eSMiklos Szeredi 			goto out_drop_write;
672e9be9d5eSMiklos Szeredi 
673e9be9d5eSMiklos Szeredi 		/*
674e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting xattr on whiteout, opaque dir
675e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir, rename
676e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
677e9be9d5eSMiklos Szeredi 		 * CAP_FSETID for chmod of opaque dir
678e9be9d5eSMiklos Szeredi 		 * CAP_CHOWN for chown of opaque dir
679e9be9d5eSMiklos Szeredi 		 */
680e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
681e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
682e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
683e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FSETID);
684e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_CHOWN);
685e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
686e9be9d5eSMiklos Szeredi 
687a105d685SMiklos Szeredi 		err = ovl_remove_and_whiteout(dentry, is_dir);
688e9be9d5eSMiklos Szeredi 
689e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
690e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
691e9be9d5eSMiklos Szeredi 	}
692e9be9d5eSMiklos Szeredi out_drop_write:
693e9be9d5eSMiklos Szeredi 	ovl_drop_write(dentry);
694e9be9d5eSMiklos Szeredi out:
695e9be9d5eSMiklos Szeredi 	return err;
696e9be9d5eSMiklos Szeredi }
697e9be9d5eSMiklos Szeredi 
698e9be9d5eSMiklos Szeredi static int ovl_unlink(struct inode *dir, struct dentry *dentry)
699e9be9d5eSMiklos Szeredi {
700e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, false);
701e9be9d5eSMiklos Szeredi }
702e9be9d5eSMiklos Szeredi 
703e9be9d5eSMiklos Szeredi static int ovl_rmdir(struct inode *dir, struct dentry *dentry)
704e9be9d5eSMiklos Szeredi {
705e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, true);
706e9be9d5eSMiklos Szeredi }
707e9be9d5eSMiklos Szeredi 
708e9be9d5eSMiklos Szeredi static int ovl_rename2(struct inode *olddir, struct dentry *old,
709e9be9d5eSMiklos Szeredi 		       struct inode *newdir, struct dentry *new,
710e9be9d5eSMiklos Szeredi 		       unsigned int flags)
711e9be9d5eSMiklos Szeredi {
712e9be9d5eSMiklos Szeredi 	int err;
713e9be9d5eSMiklos Szeredi 	enum ovl_path_type old_type;
714e9be9d5eSMiklos Szeredi 	enum ovl_path_type new_type;
715e9be9d5eSMiklos Szeredi 	struct dentry *old_upperdir;
716e9be9d5eSMiklos Szeredi 	struct dentry *new_upperdir;
717e9be9d5eSMiklos Szeredi 	struct dentry *olddentry;
718e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
719e9be9d5eSMiklos Szeredi 	struct dentry *trap;
720e9be9d5eSMiklos Szeredi 	bool old_opaque;
721e9be9d5eSMiklos Szeredi 	bool new_opaque;
722e9be9d5eSMiklos Szeredi 	bool new_create = false;
723e9be9d5eSMiklos Szeredi 	bool cleanup_whiteout = false;
724e9be9d5eSMiklos Szeredi 	bool overwrite = !(flags & RENAME_EXCHANGE);
725e36cb0b8SDavid Howells 	bool is_dir = d_is_dir(old);
726e9be9d5eSMiklos Szeredi 	bool new_is_dir = false;
727e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
728e9be9d5eSMiklos Szeredi 	const struct cred *old_cred = NULL;
729e9be9d5eSMiklos Szeredi 	struct cred *override_cred = NULL;
730e9be9d5eSMiklos Szeredi 
731e9be9d5eSMiklos Szeredi 	err = -EINVAL;
732e9be9d5eSMiklos Szeredi 	if (flags & ~(RENAME_EXCHANGE | RENAME_NOREPLACE))
733e9be9d5eSMiklos Szeredi 		goto out;
734e9be9d5eSMiklos Szeredi 
735e9be9d5eSMiklos Szeredi 	flags &= ~RENAME_NOREPLACE;
736e9be9d5eSMiklos Szeredi 
737e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(old);
738e9be9d5eSMiklos Szeredi 	if (err)
739e9be9d5eSMiklos Szeredi 		goto out;
740e9be9d5eSMiklos Szeredi 
741e9be9d5eSMiklos Szeredi 	/* Don't copy up directory trees */
742e9be9d5eSMiklos Szeredi 	old_type = ovl_path_type(old);
743e9be9d5eSMiklos Szeredi 	err = -EXDEV;
7441afaba1eSMiklos Szeredi 	if (OVL_TYPE_MERGE_OR_LOWER(old_type) && is_dir)
745e9be9d5eSMiklos Szeredi 		goto out;
746e9be9d5eSMiklos Szeredi 
747e9be9d5eSMiklos Szeredi 	if (new->d_inode) {
748e9be9d5eSMiklos Szeredi 		err = ovl_check_sticky(new);
749e9be9d5eSMiklos Szeredi 		if (err)
750e9be9d5eSMiklos Szeredi 			goto out;
751e9be9d5eSMiklos Szeredi 
752e36cb0b8SDavid Howells 		if (d_is_dir(new))
753e9be9d5eSMiklos Szeredi 			new_is_dir = true;
754e9be9d5eSMiklos Szeredi 
755e9be9d5eSMiklos Szeredi 		new_type = ovl_path_type(new);
756e9be9d5eSMiklos Szeredi 		err = -EXDEV;
7571afaba1eSMiklos Szeredi 		if (!overwrite && OVL_TYPE_MERGE_OR_LOWER(new_type) && new_is_dir)
758e9be9d5eSMiklos Szeredi 			goto out;
759e9be9d5eSMiklos Szeredi 
760e9be9d5eSMiklos Szeredi 		err = 0;
7611afaba1eSMiklos Szeredi 		if (!OVL_TYPE_UPPER(new_type) && !OVL_TYPE_UPPER(old_type)) {
762e9be9d5eSMiklos Szeredi 			if (ovl_dentry_lower(old)->d_inode ==
763e9be9d5eSMiklos Szeredi 			    ovl_dentry_lower(new)->d_inode)
764e9be9d5eSMiklos Szeredi 				goto out;
765e9be9d5eSMiklos Szeredi 		}
7661afaba1eSMiklos Szeredi 		if (OVL_TYPE_UPPER(new_type) && OVL_TYPE_UPPER(old_type)) {
767e9be9d5eSMiklos Szeredi 			if (ovl_dentry_upper(old)->d_inode ==
768e9be9d5eSMiklos Szeredi 			    ovl_dentry_upper(new)->d_inode)
769e9be9d5eSMiklos Szeredi 				goto out;
770e9be9d5eSMiklos Szeredi 		}
771e9be9d5eSMiklos Szeredi 	} else {
772e9be9d5eSMiklos Szeredi 		if (ovl_dentry_is_opaque(new))
7731afaba1eSMiklos Szeredi 			new_type = __OVL_PATH_UPPER;
774e9be9d5eSMiklos Szeredi 		else
7751afaba1eSMiklos Szeredi 			new_type = __OVL_PATH_UPPER | __OVL_PATH_PURE;
776e9be9d5eSMiklos Szeredi 	}
777e9be9d5eSMiklos Szeredi 
778e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
779e9be9d5eSMiklos Szeredi 	if (err)
780e9be9d5eSMiklos Szeredi 		goto out;
781e9be9d5eSMiklos Szeredi 
782e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
783e9be9d5eSMiklos Szeredi 	if (err)
784e9be9d5eSMiklos Szeredi 		goto out_drop_write;
785e9be9d5eSMiklos Szeredi 
786e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(new->d_parent);
787e9be9d5eSMiklos Szeredi 	if (err)
788e9be9d5eSMiklos Szeredi 		goto out_drop_write;
789e9be9d5eSMiklos Szeredi 	if (!overwrite) {
790e9be9d5eSMiklos Szeredi 		err = ovl_copy_up(new);
791e9be9d5eSMiklos Szeredi 		if (err)
792e9be9d5eSMiklos Szeredi 			goto out_drop_write;
793e9be9d5eSMiklos Szeredi 	}
794e9be9d5eSMiklos Szeredi 
7951afaba1eSMiklos Szeredi 	old_opaque = !OVL_TYPE_PURE_UPPER(old_type);
7961afaba1eSMiklos Szeredi 	new_opaque = !OVL_TYPE_PURE_UPPER(new_type);
797e9be9d5eSMiklos Szeredi 
798e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
799e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
800e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
801e9be9d5eSMiklos Szeredi 		if (!override_cred)
802e9be9d5eSMiklos Szeredi 			goto out_drop_write;
803e9be9d5eSMiklos Szeredi 
804e9be9d5eSMiklos Szeredi 		/*
805e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting xattr on whiteout, opaque dir
806e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir
807e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
808e9be9d5eSMiklos Szeredi 		 * CAP_FSETID for chmod of opaque dir
809e9be9d5eSMiklos Szeredi 		 * CAP_CHOWN for chown of opaque dir
810e9be9d5eSMiklos Szeredi 		 */
811e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
812e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
813e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
814e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FSETID);
815e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_CHOWN);
816e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
817e9be9d5eSMiklos Szeredi 	}
818e9be9d5eSMiklos Szeredi 
8191afaba1eSMiklos Szeredi 	if (overwrite && OVL_TYPE_MERGE_OR_LOWER(new_type) && new_is_dir) {
820a105d685SMiklos Szeredi 		opaquedir = ovl_check_empty_and_clear(new);
821e9be9d5eSMiklos Szeredi 		err = PTR_ERR(opaquedir);
822e9be9d5eSMiklos Szeredi 		if (IS_ERR(opaquedir)) {
823e9be9d5eSMiklos Szeredi 			opaquedir = NULL;
824e9be9d5eSMiklos Szeredi 			goto out_revert_creds;
825e9be9d5eSMiklos Szeredi 		}
826e9be9d5eSMiklos Szeredi 	}
827e9be9d5eSMiklos Szeredi 
828e9be9d5eSMiklos Szeredi 	if (overwrite) {
829e9be9d5eSMiklos Szeredi 		if (old_opaque) {
830e9be9d5eSMiklos Szeredi 			if (new->d_inode || !new_opaque) {
831e9be9d5eSMiklos Szeredi 				/* Whiteout source */
832e9be9d5eSMiklos Szeredi 				flags |= RENAME_WHITEOUT;
833e9be9d5eSMiklos Szeredi 			} else {
834e9be9d5eSMiklos Szeredi 				/* Switch whiteouts */
835e9be9d5eSMiklos Szeredi 				flags |= RENAME_EXCHANGE;
836e9be9d5eSMiklos Szeredi 			}
837e9be9d5eSMiklos Szeredi 		} else if (is_dir && !new->d_inode && new_opaque) {
838e9be9d5eSMiklos Szeredi 			flags |= RENAME_EXCHANGE;
839e9be9d5eSMiklos Szeredi 			cleanup_whiteout = true;
840e9be9d5eSMiklos Szeredi 		}
841e9be9d5eSMiklos Szeredi 	}
842e9be9d5eSMiklos Szeredi 
843e9be9d5eSMiklos Szeredi 	old_upperdir = ovl_dentry_upper(old->d_parent);
844e9be9d5eSMiklos Szeredi 	new_upperdir = ovl_dentry_upper(new->d_parent);
845e9be9d5eSMiklos Szeredi 
846e9be9d5eSMiklos Szeredi 	trap = lock_rename(new_upperdir, old_upperdir);
847e9be9d5eSMiklos Szeredi 
84811f37104SMiklos Szeredi 
84911f37104SMiklos Szeredi 	olddentry = lookup_one_len(old->d_name.name, old_upperdir,
85011f37104SMiklos Szeredi 				   old->d_name.len);
85111f37104SMiklos Szeredi 	err = PTR_ERR(olddentry);
85211f37104SMiklos Szeredi 	if (IS_ERR(olddentry))
85311f37104SMiklos Szeredi 		goto out_unlock;
85411f37104SMiklos Szeredi 
85511f37104SMiklos Szeredi 	err = -ESTALE;
85611f37104SMiklos Szeredi 	if (olddentry != ovl_dentry_upper(old))
85711f37104SMiklos Szeredi 		goto out_dput_old;
85811f37104SMiklos Szeredi 
859e9be9d5eSMiklos Szeredi 	newdentry = lookup_one_len(new->d_name.name, new_upperdir,
860e9be9d5eSMiklos Szeredi 				   new->d_name.len);
861e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
862e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
86311f37104SMiklos Szeredi 		goto out_dput_old;
864e9be9d5eSMiklos Szeredi 
865e9be9d5eSMiklos Szeredi 	err = -ESTALE;
86611f37104SMiklos Szeredi 	if (ovl_dentry_upper(new)) {
86711f37104SMiklos Szeredi 		if (opaquedir) {
86811f37104SMiklos Szeredi 			if (newdentry != opaquedir)
869e9be9d5eSMiklos Szeredi 				goto out_dput;
87011f37104SMiklos Szeredi 		} else {
87111f37104SMiklos Szeredi 			if (newdentry != ovl_dentry_upper(new))
872e9be9d5eSMiklos Szeredi 				goto out_dput;
87311f37104SMiklos Szeredi 		}
87411f37104SMiklos Szeredi 	} else {
87511f37104SMiklos Szeredi 		new_create = true;
87611f37104SMiklos Szeredi 		if (!d_is_negative(newdentry) &&
87711f37104SMiklos Szeredi 		    (!new_opaque || !ovl_is_whiteout(newdentry)))
87811f37104SMiklos Szeredi 			goto out_dput;
87911f37104SMiklos Szeredi 	}
88011f37104SMiklos Szeredi 
881e9be9d5eSMiklos Szeredi 	if (olddentry == trap)
882e9be9d5eSMiklos Szeredi 		goto out_dput;
883e9be9d5eSMiklos Szeredi 	if (newdentry == trap)
884e9be9d5eSMiklos Szeredi 		goto out_dput;
885e9be9d5eSMiklos Szeredi 
886e9be9d5eSMiklos Szeredi 	if (is_dir && !old_opaque && new_opaque) {
887e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(olddentry);
888e9be9d5eSMiklos Szeredi 		if (err)
889e9be9d5eSMiklos Szeredi 			goto out_dput;
890e9be9d5eSMiklos Szeredi 	}
891e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && old_opaque && !new_opaque) {
892e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
893e9be9d5eSMiklos Szeredi 		if (err)
894e9be9d5eSMiklos Szeredi 			goto out_dput;
895e9be9d5eSMiklos Szeredi 	}
896e9be9d5eSMiklos Szeredi 
897e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
898e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(old_upperdir->d_inode, olddentry,
899e9be9d5eSMiklos Szeredi 				    new_upperdir->d_inode, newdentry,
900e9be9d5eSMiklos Szeredi 				    flags);
901e9be9d5eSMiklos Szeredi 	} else {
902e9be9d5eSMiklos Szeredi 		/* No debug for the plain case */
903e9be9d5eSMiklos Szeredi 		BUG_ON(flags & ~RENAME_EXCHANGE);
904e9be9d5eSMiklos Szeredi 		err = vfs_rename(old_upperdir->d_inode, olddentry,
905e9be9d5eSMiklos Szeredi 				 new_upperdir->d_inode, newdentry,
906e9be9d5eSMiklos Szeredi 				 NULL, flags);
907e9be9d5eSMiklos Szeredi 	}
908e9be9d5eSMiklos Szeredi 
909e9be9d5eSMiklos Szeredi 	if (err) {
910e9be9d5eSMiklos Szeredi 		if (is_dir && !old_opaque && new_opaque)
911e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(olddentry);
912e9be9d5eSMiklos Szeredi 		if (!overwrite && new_is_dir && old_opaque && !new_opaque)
913e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(newdentry);
914e9be9d5eSMiklos Szeredi 		goto out_dput;
915e9be9d5eSMiklos Szeredi 	}
916e9be9d5eSMiklos Szeredi 
917e9be9d5eSMiklos Szeredi 	if (is_dir && old_opaque && !new_opaque)
918e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(olddentry);
919e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && !old_opaque && new_opaque)
920e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(newdentry);
921e9be9d5eSMiklos Szeredi 
92245d11738SKonstantin Khlebnikov 	/*
92345d11738SKonstantin Khlebnikov 	 * Old dentry now lives in different location. Dentries in
92445d11738SKonstantin Khlebnikov 	 * lowerstack are stale. We cannot drop them here because
92545d11738SKonstantin Khlebnikov 	 * access to them is lockless. This could be only pure upper
92645d11738SKonstantin Khlebnikov 	 * or opaque directory - numlower is zero. Or upper non-dir
92745d11738SKonstantin Khlebnikov 	 * entry - its pureness is tracked by flag opaque.
92845d11738SKonstantin Khlebnikov 	 */
929e9be9d5eSMiklos Szeredi 	if (old_opaque != new_opaque) {
930e9be9d5eSMiklos Szeredi 		ovl_dentry_set_opaque(old, new_opaque);
931e9be9d5eSMiklos Szeredi 		if (!overwrite)
932e9be9d5eSMiklos Szeredi 			ovl_dentry_set_opaque(new, old_opaque);
933e9be9d5eSMiklos Szeredi 	}
934e9be9d5eSMiklos Szeredi 
935e9be9d5eSMiklos Szeredi 	if (cleanup_whiteout)
936e9be9d5eSMiklos Szeredi 		ovl_cleanup(old_upperdir->d_inode, newdentry);
937e9be9d5eSMiklos Szeredi 
938e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(old->d_parent);
939e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(new->d_parent);
940e9be9d5eSMiklos Szeredi 
941e9be9d5eSMiklos Szeredi out_dput:
942e9be9d5eSMiklos Szeredi 	dput(newdentry);
94311f37104SMiklos Szeredi out_dput_old:
94411f37104SMiklos Szeredi 	dput(olddentry);
945e9be9d5eSMiklos Szeredi out_unlock:
946e9be9d5eSMiklos Szeredi 	unlock_rename(new_upperdir, old_upperdir);
947e9be9d5eSMiklos Szeredi out_revert_creds:
948e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
949e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
950e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
951e9be9d5eSMiklos Szeredi 	}
952e9be9d5eSMiklos Szeredi out_drop_write:
953e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
954e9be9d5eSMiklos Szeredi out:
955e9be9d5eSMiklos Szeredi 	dput(opaquedir);
956e9be9d5eSMiklos Szeredi 	return err;
957e9be9d5eSMiklos Szeredi }
958e9be9d5eSMiklos Szeredi 
959e9be9d5eSMiklos Szeredi const struct inode_operations ovl_dir_inode_operations = {
960e9be9d5eSMiklos Szeredi 	.lookup		= ovl_lookup,
961e9be9d5eSMiklos Szeredi 	.mkdir		= ovl_mkdir,
962e9be9d5eSMiklos Szeredi 	.symlink	= ovl_symlink,
963e9be9d5eSMiklos Szeredi 	.unlink		= ovl_unlink,
964e9be9d5eSMiklos Szeredi 	.rmdir		= ovl_rmdir,
965e9be9d5eSMiklos Szeredi 	.rename2	= ovl_rename2,
966e9be9d5eSMiklos Szeredi 	.link		= ovl_link,
967e9be9d5eSMiklos Szeredi 	.setattr	= ovl_setattr,
968e9be9d5eSMiklos Szeredi 	.create		= ovl_create,
969e9be9d5eSMiklos Szeredi 	.mknod		= ovl_mknod,
970e9be9d5eSMiklos Szeredi 	.permission	= ovl_permission,
971e9be9d5eSMiklos Szeredi 	.getattr	= ovl_dir_getattr,
972e9be9d5eSMiklos Szeredi 	.setxattr	= ovl_setxattr,
973e9be9d5eSMiklos Szeredi 	.getxattr	= ovl_getxattr,
974e9be9d5eSMiklos Szeredi 	.listxattr	= ovl_listxattr,
975e9be9d5eSMiklos Szeredi 	.removexattr	= ovl_removexattr,
976e9be9d5eSMiklos Szeredi };
977